期刊文献+

基于双向长短期记忆网络和标签嵌入的文本分类模型 被引量:13

A text classification model based on BiLSTM and label embedding
原文传递
导出
摘要 提出了一种基于双向长短期记忆网络和标签嵌入的文本分类模型。首先利用BERT模型提取句子特征,然后通过BiLSTM和注意力机制得到融合重要上、下文信息的文本表示,最后将标签和词在联合空间学习,利用标签与词之间的兼容性得分对标签和句子表示加权,实现标签信息的双重嵌入,分类器根据给定标签信息对句子进行分类。在5个权威数据集上的实验表明,该方法能有效地提高文本分类性能,具有更好的实用性。 A text classification model based on BiLSTM and label embedding for text classification was proposed.Firstly,our method introduced the BERT model to extract high-quality sentence features.Then,we used BiLSTM and attention mechanism to get the text representations that integrate important context information.Finally,labels and words learned in the joint space,and we used the compatibility score deriving from the label-word pairs to weight the labels and sentences representations,realizing the double label embeddings.The classifier classifies sentences according to the given label information.Experimental results on five general authoritative datasets show that our method effectively improves the text classification performance,and our model has better practicability.
作者 董彦如 刘培玉 刘文锋 赵红艳 DONG Yan-ru;LIU Pei-yu;LIU Wen-feng;ZHAO Hong-yan(School of Information Science and Engineering,Shandong Normal University,Jinan 250358,Shandong,China;School of Computer Science,Heze University,Heze 274015,Shandong,China;School of Information Engineering,Shandong Yingcai University,Jinan 250101,Shandong,China)
出处 《山东大学学报(理学版)》 CAS CSCD 北大核心 2020年第11期78-86,共9页 Journal of Shandong University(Natural Science)
基金 国家自然科学基金资助项目(61373148) 国家自然科学基金青年资助项目(61502151) 山东省社科规划项目(17CHLJ18,17CHLJ33,17CHLJ30) 山东省自然科学基金资助项(ZR2014FL010) 山东省教育厅基金资助项目(J15LN34)。
关键词 文本分类 文本表示 标签嵌入 text classification text representation labels embedding
  • 相关文献

同被引文献127

引证文献13

二级引证文献63

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部