一种基于扩展的两步文本倾向性分析方法被引量：4

Two-step text orientation identification based on feature extension

下载PDF

导出

摘要提出一种基于扩展的两步文本倾向性分析方法,该方法利用包含倾向性词表、否定词表、程度词表在内的情感词语对训练文本进行特征扩展,按照将情感词语和内容词语是否同等对待来构造两个分类器CF1和CF2;在分类时,对测试文本进行和训练文本类似的特征扩展,使用分类器CF1对其进行分类,对分类结果中的可靠部分直接做出判定,对分类结果中的不可靠部分利用分类器CF2进行二次分类并做出判定。实验结果验证了该方法的有效性。 This paper presents an extension-based two-step text orientation analysis method. This method uses sentiment words including orientation word list, negative word list and adverb of degree list to extend features of the training texts, and then constructs the classifier CF1 and the classifier CF2 according to whether sentiment words and content words are used in the same way or not. At the classification time, extend features of the testing texts in the same way as for the training texts and classify them with the classifier CF1. If the result of classification is reliable, make a judgment;if not, conduct the second classification for the testing texts with the classifier CF2. Experimental results have proved the effectiveness of the method.

作者樊兴华王鹏周鹏

机构地区重庆邮电大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 2012年第1期162-165,169,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.60703010) 重庆市教委科学技术研究项目(No.KJ070519)

关键词中文信息处理特征扩展倾向性分析构造分类器 Chinese information processing features extension orientation identification constructing classifier

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1Tumey P.Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews[C]//Proc of the 40th Annual Meeting of the Association for Computational Linguistics, N J, USA, 2002: 412-417.
2Dave K,Lawrence S,Pennock D.Mining the peanut gallery:opinion extraction and semantic classification of product reviews[C]// Proc of the 12th Int'l World Wide Web Conf.Budapest,Hungary: ACM Press, 2003 : 519-528.
3Tong R M.An operational system for detecting and tracking opinions in on-line diseussion[C]//SIGIR Workshop on Operational Text Classification,NY, USA, 2001 : 1-6.
4Hu M, Liu B.Mining and summarizing customer reviews[C]// Proc of Knowledge Discovery and Data Mining, NY, USA, 2004:168-177.
5Liu H, Lieberman H, Selker T.A model of textual affect sensing using real-world knowledge[C]//Proc of the llth Int'l Conf on Intelligent User Interface,2003 : 125-132.
6Pang Bo,Lee Lillian,Vaithyanathan S.Thumbs up?Sentiment classification using machine learning techniques[C]//Proc of the Conf on Empirical Methods in Natural Language Processing, Philadelphia, US, 2002: 81-86.
7许小颖,陶建华.汉语情感系统中情感划分的研究[C].第一届中国情感计算及智能交互学术会议论文集.2003:199-205.
8张桂宾.相对程度副词与绝对程度副词[J].华东师范大学学报（哲学社会科学版）,1997,29(2):92-96. 被引量：79
9张谊生.现代汉语副词的性质、范围与分类[J].语言研究,2000,20(1):51-63. 被引量：156
10樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70

二级参考文献16

1张谊生.名词的语义基础及功能转化与副词修饰名词(续)[J].语言教学与研究,1997(1):136-143. 被引量：105
2张谊生.名词的语义基础及功能转化与副词修饰名词[J].语言教学与研究,1996(4):57-75. 被引量：158
3张谊生.状词与副词的区别[J].汉语学习,1995(1):11-15. 被引量：16
4陆俭明.现代汉语副词独用刍议[J].语言教学与研究,1982(2):27-41. 被引量：112
5Lewis D. D.. An evaluation of phrasal and clustered representalions on a text categorization task. In: Proceedings of SIGIR'92,the 15st ACM International Conference on Research and Development in Information Retrieval, Copenhagen, Denmark,1992, 37-50.
6Sebastiani F,. Machine learning in automated text categorization. ACM Computing Surveys, 2002, 34(1): 1-47.
7Lewis D.. Naive bayes at forty: The independence assumption in information retrieval. In: Proceedings of the 10th European Conference on Machine Learning, Chemnitz, Germany, 1998,4-15.
8Salton G.. Automatic Text Processing: The Transformation,Analysis, and Retrieval of Information by Computer. Reading,MA: Addison Wesley, 1989.
9Mitchell T. M.. Machine Learning. New York: McCraw Hill,1996.
10Joachims T.. Text categorization with support vector machines: Learning with many relevant features. In: Proceedings of the 10th European Conference on Machine Learning,Chemnitz, Germany, 1998, 137-142.

共引文献306

1王蕾.形式否定的隐入规则分析[J].语言研究集刊,2023(1):51-65.
2李雨瞳.国际中文教育视角下“渐渐”“逐渐”和“逐步”的辨析[J].汉字文化,2023(6):143-147.
3翟帆.关于程度副词的对外汉语教学研究[J].内蒙古师范大学学报（哲学社会科学版）,2007,36(S1):494-498. 被引量：4
4孙登林,李生红,荆涛,刘功申.一种针对不良主题的文本过滤方法[J].信息安全与通信保密,2008,30(2):92-93. 被引量：4
5王静.“很”的词性再议[J].昌吉学院学报,2003(1):21-23. 被引量：8
6王细薇,樊兴华,赵军.一种基于特征扩展的中文短文本分类方法[J].计算机应用,2009,29(3):843-845. 被引量：36
7彭昱忠,元昌安,王艳,覃晓.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009,26(2):433-438. 被引量：19
8冯传强,方颐.现代汉语副词“几乎”和“简直”的语义、语用差异[J].中国石油大学胜利学院学报,2002,18(3):6-9. 被引量：8
9曹霞,黄婉梅.现代汉语程度副词研究[J].三峡大学学报（人文社会科学版）,2010,32(S2):138-139.
10张春玲,黄婉梅.浅议副词归属产生分歧的原因[J].三峡大学学报（人文社会科学版）,2009,31(S1):104-105.

同被引文献33

1刘永丹,曾海泉,李荣陆,胡运发.基于语义分析的倾向性文本过滤[J].通信学报,2004,25(7):78-85. 被引量：34
2樊兴华,孙茂松.一种高性能的两类中文文本分类方法[J].计算机学报,2006,29(1):124-131. 被引量：70
3曹勇刚,曹羽中,金茂忠,刘超.面向信息检索的自适应中文分词系统[J].软件学报,2006,17(3):356-363. 被引量：48
4苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386
5陈然.网络论坛舆论领袖筛选方法初探[D].武汉:华中科技大学,2009.
6HUANG X J, ZHAO J. Sentiment analysis for Chinese text [ J ]. Com- munications of CCF,2008,4(2).
7LIU H Y,ZHAO Y Y,QIN B,et al. Target extraction and sentiment classification[ C]//Proc of the 10th Chinese National Conference on Computational Linguistics. 2009.
8WILSON T, WIEBE J, HWA R. Recognizing strong and weak opinion clauses[J]. Computational Intelligence,2006,22(2) :73-99.
9FAN Xing-hua, NIE Jian-yun. Link distribution dependency model for document retrieval [ J]. Journal of Information & Computational Science ,2009,6 ( 3 : 1553-1564.
10Sajib Dasgupta, Vincent Ng. Mine the easy, classify the hard: a semi-supervised approach to automatic sentiment classification [ C ]. Proceedings of the 47th Annual Meeting of the ACL and the 4th IJC- NLP of the AFNLP, Singapore,2009 : 701-709.

引证文献4

1樊兴华,吴昊.意见领袖识别中的文本倾向性研究[J].计算机应用研究,2013,30(9):2613-2615. 被引量：6
2曹欢欢,谢兴生.负面新闻判定算法的研究与应用[J].小型微型计算机系统,2015,36(5):1047-1051. 被引量：3
3周邦定,曹海鹏,张彦.新闻情感倾向性识别算法的研究与应用[J].微型机与应用,2015,34(14):58-60. 被引量：1
4郑国伟,吕学强,夏红科,周建设.基于LSTM的金融新闻倾向性[J].计算机工程与设计,2018,39(11):3462-3467. 被引量：4

二级引证文献13

1何跃,帅马恋,余伟萍.新浪微博加V用户特征分析[J].情报杂志,2014,33(9):148-151. 被引量：5
2魏平杰,樊兴华.语音倾向性分析中的特征抽取研究[J].计算机应用研究,2014,31(12):3580-3583. 被引量：1
3陈福集,陈婷.舆情突发事件演化探析——基于意见领袖引导作用视角[J].情报资料工作,2015,36(2):23-28. 被引量：20
4Lejun Zhang,Tong Wang,Zilong Jin,Nan Su,Chunhui Zhao,Yongjun He.The Research on Social Networks Public Opinion Propagation Influence Models and Its Controllability[J].China Communications,2018,15(7):98-110. 被引量：8
5郭放.面向手机网络评论的意见挖掘技术研究[J].数字技术与应用,2018,36(7):111-114.
6郑国伟,吕学强,夏红科,周建设.基于LSTM的金融新闻倾向性[J].计算机工程与设计,2018,39(11):3462-3467. 被引量：4
7梁志剑,谢红宇,安卫钢.基于BiGRU和贝叶斯分类器的文本分类[J].计算机工程与设计,2020,41(2):381-385. 被引量：14
8王雨烟.浅谈微博语言的特征——微博语言的传播学分析[J].新闻研究导刊,2019,10(22):87-87. 被引量：2
9李福鹏,付东翔.基于Transformer编码器的金融文本情感分析方法[J].电子科技,2020,33(9):10-15. 被引量：4
10张仰森,周炜翔,张禹尧,吴云芳.一种基于情感计算与层次化多头注意力机制的负面新闻识别方法[J].电子学报,2020,48(9):1720-1728. 被引量：3

1西捷微型硬盘[J].摄影世界,2004(8):116-117.
2宁慧,杨松,赵勇,徐丽.基于语义特征的微博情感分析研究[J].应用科技,2016,43(3):70-74. 被引量：1
3张运陶,张宇.实验及工程数据拟合软件(CF1.0)及其应用[J].计算机与应用化学,2002,19(4):470-472. 被引量：2
4吴瑾.DIY外置USB读卡器[J].电子制作,2004,12(9):19-20.
5王伟,孟祥福,肖春娇.基于耦合关系的情感词语义分析方法[J].计算机科学与探索,2014,8(9):1146-1152. 被引量：1
6徐建强,陆耀.一种基于加权时空上下文的鲁棒视觉跟踪算法[J].自动化学报,2015,41(11):1901-1912. 被引量：33
7樊娜,王超,安毅生.文本情感文摘自动提取方法研究[J].微电子学与计算机,2012,29(8):164-168. 被引量：2
8张建德.手机上开发千千静听-Mp3playMobile播放[J].电脑编程技巧与维护,2010(13):29-35.
9吴淳,孙心佩,程健,刘帅.体感CF2.0三维场景游戏之开发[J].电子世界,2014(9):75-75. 被引量：3
10翟东海,杜佳,崔静静,聂洪玉.基于双粒度模型的中文情感特征词提取研究[J].重庆邮电大学学报（自然科学版）,2014,26(3):380-384.

计算机工程与应用

2012年第1期

浏览历史

内容加载中请稍等...

一种基于扩展的两步文本倾向性分析方法被引量：4

参考文献10

二级参考文献16

共引文献306

同被引文献33

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种基于扩展的两步文本倾向性分析方法 被引量：4

参考文献10

二级参考文献16

共引文献306

同被引文献33

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种基于扩展的两步文本倾向性分析方法被引量：4