局部语义与上下文关系的中文短文本分类算法被引量：7

Chinese Short Text Classification Algorithm Based on Local Semantics and Context

下载PDF

导出

摘要短文本通常是由几个到几十个词组成,长度短、特征稀疏,导致短文本分类的准确率难以提升。为了解决此问题,提出了一种基于局部语义特征与上下文关系融合的中文短文本分类算法,称为Bi-LSTM_CNN_AT,该算法利用CNN提取文本的局部语义特征,利用Bi-LSTM提取文本的上下文语义特征,并结合注意力机制,使得Bi-LSTM_CNN_AT模型能从众多的特征中提取出和当前任务最相关的特征,更好地进行文本分类。实验结果表明,Bi-LSTM_CNN_AT模型在NLP&CC2017的新闻标题分类数据集18个类别中的分类准确率为81.31%,比单通道的CNN模型提高2.02%,比单通道的Bi-LSTM模型提高1.77%。 Short text is usually composed of several to dozens of words.Short length and sparse features make it difficult to improve the classification accuracy of short texts.In order to solve this problem,an algorithm of classification for Chinese short texts is proposed based on local semantic features and context relationships,called Bi-LSTM_CNN_AT.In this algorithm,CNN is utilized to extract the local semantic features of a text,while Bi-LSTM is used to extract the contextual semantic features of the text.Moreover,the attention mechanism is combined too.Thus,the Bi-LSTM_CNN_AT model is able to extract the most relevant features to the current task from short texts.The experimental results show that the Bi-LSTM_CNN_AT model achieves a classification accuracy of 81.31%in the 18 categories of NLP&CC2017 news headline classification dataset,which is 2.02%higher than the single-channel CNN model and 1.77%higher than the singlechannel Bi-LSTM model respectively.

作者黄金杰蔺江全何勇军何瑾洁王雅君 HUANG Jinjie;LIN Jiangquan;HE Yongjun;HE Jinjie;WANG Yajun(School of Automation,Harbin University of Science and Technology,Harbin 150080,China;School of Computer Science and Technology,Harbin University of Science and Technology,Harbin 150080,China)

机构地区哈尔滨理工大学自动化学院哈尔滨理工大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2021年第6期94-100,共7页 Computer Engineering and Applications

基金国家自然科学基金(61305001) 黑龙江省自然科学基金(F201222)。

关键词短文本分类卷积神经网络双向长短时记忆网络注意力机制 short text classification convolutional neural network bidirectional long short-term memory network attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1hang li.Deep learning for natural language processing： advantages and challenges[J].National Science Review,2018,5(1):24-26. 被引量：27
2YANG Zhen,FAN Kefeng,LAI Yingxu,GAO Kaiming,WANG Yong.Short Texts Classification Through Reference Document Expansion[J].Chinese Journal of Electronics,2014,23(2):315-321. 被引量：12
3卢玲,杨武,杨有俊,陈梦晗.结合语义扩展和卷积神经网络的中文短文本分类方法[J].计算机应用,2017,37(12):3498-3503. 被引量：19
4申昌,冀俊忠.基于双通道卷积神经网络的文本情感分类算法[J].模式识别与人工智能,2018,31(2):158-166. 被引量：15

二级参考文献17

1L. Rocha, F. Mourao, H. Mota et al., "Temporal contexts: Ef- fective text classification in evolving document collections", In- formation Systems, Vol.38, No.3, pp.388-409, 2012.
2M.T. Fardanesh, "Classification accuracy improvement of neu- ral network classifiers by using unlabeled data", IEEE Trans- actions on Geoscienee and Remote Sensing, Vol.36, No.3, pp.1020 1025, 1998.
3T. Joachims, "Transductive inference for text classification us- ing support vector machines", Proc. of the Sixteenth In- ternational Conference on Machine Learning, Bled, Slovenia, pp.200-209, 1999.
4Y. Tsuruoka, J. Tsujii, "Training a naive bayes classifier via the EM algorithm with a class distribution constraint", Proc. of the Seventh Conference on Natural Language Learning, Edmonton, Canada, pp.127-134, 2003.
5R. Kothari, V. Jain, "Learning from labeled and unlabeled data using a minimal number of queries", IEEE Transaction on Neu- ral Networks, Vol.14, No.6, pp.1496 1505, 2003.
6M. Efron, P. Organisciak, K. Fenlon, "Improving retrieval of short texts through document expansion", Proc. of the 35th International A CM SIGIR Conference on Research and Devel- opment in Information Retrieval, Portland, OR, United states, pp.911-920, 2012.
7V. Vapnik, "The Nature of Statistical Learning Theory, Springer- Verlag, New York, 1999.
8S.M. Katz, "Estimation of probabilities from sparse data for the language model component of a speech recognizer", IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol.ASP-35, No.3, pp.400-401, 1987.
9C.X. Zhai, "Statistical language models for information retrieval a critical review", Foundations and Trends in Information Re- trieval, Vol.2, No.3, pp.137 213, 2008.
10V. Lavrenko, W.B. Croft, "Relevance based language models", Proc. of the 24th annual international A CM SIGIR conference on Research and Development in Information Retrieval, New York, USA, pp.120-127, 2001.

共引文献69

1YU Miao,YANG Wu,WANG Wei,SHEN Guowei,DONG Guozhong,GONG Liangyi.UGGreedy: Influence Maximization for User Group in Microblogging[J].Chinese Journal of Electronics,2016,25(2):241-248. 被引量：2
2HAN Zhongyuan,YANG Muyun,KONG Leilei,QI Haoliang,LI Sheng.A Hybrid Model for Microblog Real-Time Filtering[J].Chinese Journal of Electronics,2016,25(3):432-440. 被引量：1
3孟欣,左万利.基于word embedding的短文本特征扩展与分类[J].小型微型计算机系统,2017,38(8):1712-1717. 被引量：8
4刘德喜,付淇,韦亚雄,万常选,刘喜平,钟敏娟,邱家洪.基于多重增强图和主题分析的社交短文本检索方法[J].中文信息学报,2018,32(3):110-119. 被引量：5
5孙昭颖,刘功申.面向短文本的神经网络聚类算法研究[J].计算机科学,2018,45(B06):392-395. 被引量：14
6杨春妮,冯朝胜.结合句法特征和卷积神经网络的多意图识别模型[J].计算机应用,2018,38(7):1839-1845. 被引量：11
7雷朔,刘旭敏,徐维祥.基于词向量特征扩展的中文短文本分类研究[J].计算机应用与软件,2018,35(8):269-274. 被引量：16
8张富为,杨秋翔,宋超峰.基于卷积神经网络的构件分类策略的研究[J].计算机工程与应用,2019,55(8):201-207. 被引量：4
9曹湘,李誉坤,钱叶,闫晨阳,杨忠光.基于混合神经网络的电力短文本分类方法研究[J].计算机与数字工程,2019,47(5):1145-1150. 被引量：6
10吴璠,李寿山,周国栋.基于LSTM和多特征组合的电影评论专业程度分类[J].计算机科学,2019,46(B06):74-79. 被引量：2

同被引文献73

1陶志勇,李小兵,刘影,刘晓芳.基于双向长短时记忆网络的改进注意力短文本分类方法[J].数据分析与知识发现,2019,3(12):21-29. 被引量：23
2翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23. 被引量：14
3杨丽华,戴齐,郭艳军.KNN文本分类算法研究[J].微计算机信息,2006,22(07X):269-270. 被引量：24
4李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
5王昊,严明,苏新宁.基于机器学习的中文书目自动分类研究[J].中国图书馆学报,2010,36(6):28-39. 被引量：37
6丁兆云,贾焰,周斌.微博数据挖掘研究综述[J].计算机研究与发展,2014,51(4):691-706. 被引量：119
7刘华梅.《中国图书馆分类法》(第五版)类目复分仿分详解[J].图书馆,2014(5):128-131. 被引量：5
8薛春香,何琳,侯汉清.基于《中图法》知识库的自动分类相关问题探析[J].图书馆建设,2015(6):16-20. 被引量：9
9杨宇婷,王名扬,田宪允,李鹏宇.基于文档分布式表达的新浪微博情感分类研究[J].情报杂志,2016,35(2):151-156. 被引量：16
10ZHANG Yangsen,JIANG Yuru,TONG Yixuan.Study of Sentiment Classification for Chinese Microblog Based on Recurrent Neural Network[J].Chinese Journal of Electronics,2016,25(4):601-607. 被引量：29

引证文献7

1罗孝波,林佳瑜,梁祖红,王漳.针对低频词进行改进的中文短文本分类方法[J].计算机应用研究,2022,39(2):468-473. 被引量：2
2杨兴锐,赵寿为,张如学,杨兴俊,陶叶辉.结合自注意力和残差的BiLSTM_CNN文本分类模型[J].计算机工程与应用,2022,58(3):172-180. 被引量：16
3谢星雨,余本功.基于MFFMB的电商评论文本分类研究[J].数据分析与知识发现,2022,6(1):101-112. 被引量：6
4李湘东,石健,孙倩茹,贺超城.基于BERT-MLDFA的内容相近类目自动分类研究--以《中图法》E271和E712.51为例[J].数字图书馆论坛,2022(2):18-25. 被引量：1
5冼广铭,王鲁栋,曾碧卿,梅灏洋,陶睿.基于LDA和BiGRU的文本分类[J].计算机技术与发展,2022,32(4):15-20. 被引量：3
6王金政,杨颖,余本功.基于多头协同注意力机制的客户投诉文本分类模型[J].数据分析与知识发现,2023,7(1):128-137. 被引量：1
7厉贤斌,崔晨,翁理想,周杭霞.基于跨层连接的多通道DBiSAC网络欺凌检测模型[J].中国计量大学学报,2023,34(1):92-100.

二级引证文献28

1黄茜,贺超城,李欣儒,吴江.后疫情时代下短租民宿用户购买行为研究——基于BERT衡量的网络口碑[J].知识管理论坛,2023(3):238-257.
2朱明,陈一飞.面向物业投诉的字符级短文本分类模型[J].大众科技,2022,24(4):31-35. 被引量：1
3程欣炜,岳中刚.基于电商大数据的农产品短期经营风险预测研究——以家庭经营梨果种植户为样本[J].商业经济与管理,2022(9):16-29. 被引量：2
4王国英.基于多粒度与动态词向量的机器翻译关键技术研究[J].自动化与仪器仪表,2022(9):181-185. 被引量：1
5林伟.基于多特征融合的区块链异常交易检测[J].信息网络安全,2022(10):24-30. 被引量：1
6刘柏霆,管卫利,李陶深.基于XLNet+BiGRU+Att(Label)的文本分类模型[J].广西科学院学报,2022,38(4):412-419. 被引量：1
7蒋彦廷.依据《中国图书馆分类法》的英文图书分类探索[J].北京大学学报（自然科学版）,2023,59(1):11-20.
8胡晓辉.一种基于特征权重的文本分类新算法[J].科技创新与应用,2023,13(4):39-42.
9宛艳萍,闫思聪,于海阔,许敏聪.结合SS-GAN和BERT的文本分类模型[J].计算机技术与发展,2023,33(2):187-194. 被引量：1
10李帅文,刘继.基于混合深度学习方法的房地产网络舆情分析[J].软件工程,2023,26(5):15-19. 被引量：1

1陈涛,安俊秀.基于特征融合的微博短文本情感分类研究[J].数据与计算发展前沿,2020,2(6):21-29. 被引量：6
2姜志祥,叶青,傅晗,张帆.基于自注意力与指针网络的自动摘要模型[J].计算机工程与设计,2021,42(3):711-718. 被引量：4
3关慧,吕颖,贾成真.基于句法和语义的需求依赖关系自动获取[J].计算机技术与发展,2021,31(2):20-26. 被引量：3

计算机工程与应用

2021年第6期

浏览历史

内容加载中请稍等...

局部语义与上下文关系的中文短文本分类算法被引量：7

参考文献4

二级参考文献17

共引文献69

同被引文献73

引证文献7

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

局部语义与上下文关系的中文短文本分类算法 被引量：7

参考文献4

二级参考文献17

共引文献69

同被引文献73

引证文献7

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

局部语义与上下文关系的中文短文本分类算法被引量：7