期刊文献+

基于超图注意力网络的生物医学文本分类方法 被引量:5

Biomedical Text Classification Method Based on Hypergraph Attention Network
原文传递
导出
摘要 【目的】融合标签语义信息,采用文本级超图和交叉注意力机制捕捉文献文本的组织结构及语义语法信息,提高生物医学领域的文本分类效果。【方法】使用经微调的BioBERT模型从生物医学领域文本中获取向量特征,构建文本级超图捕获文本的语序、语义及语法信息,通过提出的交叉注意力机制网络将文本级超图和标签语义信息进行特征融合实现文本分类任务。【结果】在数据集PM-Sentence数据集上的实验结果表明,所提模型相较于基线模型在综合评价F1指标上最大提高2.34个百分点。【局限】构建的数据集有待扩充,对所提模型用于该领域其他任务的适用性有待进一步研究。【结论】所提模型提升了生物医学文本的分类效果,为知识检索、知识挖掘等知识服务应用提供了有效支持。 [Objective]This paper proposes a new model integrating tag semantics.It uses text-level hypergraph and cross attention mechanism to capture the organizational structure and grammatical semantics of literature,aiming to improve the classification of biomedical texts.[Methods]First,we utilized the fine-tuned BioBERT to retrieve vector features from the biomedical texts.Then,we constructed a text-level hypergraph to capture the word order,semantics,and syntactics of the texts.Finally,we merged the features of text-level hypergraph and labelled semantics through the cross attention mechanism network to finish the text classification.[Results]The experimental results on the PM-Sentence dataset show that the proposed model is 2.34 percentage points higher than the baseline model in the comprehensive evaluation of F1 indicators.[Limitations]The experimental dataset needs to be expanded to evaluate the model’s performance in other fields.[Conclusions]The newly constructed model improves the classification of biomedical texts and provides effective support for knowledge retrieval and mining.
作者 白思萌 牛振东 何慧 时恺泽 易坤 马原驰 Bai Simeng;Niu Zhendong;He Hui;Shi Kaize;Yi Kun;Ma Yuanchi(School of Computer,Beijing Institute of Technology,Beijing 100081,China;School of Medical Technology,Beijing Institute of Technology,Beijing 100081,China;Australian Artificial Intelligence Institute,University of Technology Sydney,Sydney 2007,Australia)
出处 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期13-24,共12页 Data Analysis and Knowledge Discovery
基金 国家重点研发计划(项目编号:2019YFB1406303)的研究成果之一。
关键词 文本分类 文本级超图 交叉注意力机制 生物医学领域 标签信息融合 Text Classification Text-Level Hypergraph Cross Attention Mechanism Biomedical Field Label Information Fusion
  • 相关文献

参考文献7

二级参考文献89

  • 1线岩团,相艳,余正涛,文永华,王红斌,张亚飞.用于文本分类的均值原型网络[J].中文信息学报,2020(6):73-80. 被引量:2
  • 2胡佳妮,徐蔚然,郭军,邓伟洪.中文文本分类中的特征选择算法研究[J].光通信研究,2005(3):44-46. 被引量:47
  • 3宋枫溪,高秀梅,刘树海,杨静宇.统计模式识别中的维数削减与低损降维[J].计算机学报,2005,28(11):1915-1922. 被引量:44
  • 4刘华.基于关键短语的文本分类研究[J].中文信息学报,2007,21(4):34-41. 被引量:14
  • 5Eppig JT,Bult CJ,Kadin JA,et al.The Mouse Genome Database (MGD):from genes to mice-a community resource for mouse biology[J].Nucleic Acids Res,2005,33:471-475.
  • 6William Hersh.TREC 2005 genomics track overview.
  • 7Luo S,Tapas K.Thresholding strategies for text classifiers:TREC2005 biomedical triage task experiments[C]//14th Text Retrieval Conference,2005.
  • 8Niu J,Sun L.WIM at TREC 2005[C]//14th Text Retrieval Conference,2005.
  • 9Yang Z,Lin H.TREC 2005 genomics track experiments at DUTAI[C]//14th Text Retrieval Conference,2005.
  • 10Joachims T.Making Large-scale SVM learning practical[M]//Sch(o)lkopf B,Burges C,Smola A.Advances in Kernel MethodsSupport Vector Learning.[S.l.]:MIT-Press,1999.

共引文献128

同被引文献79

引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部