大规模中文实体情感知识的自动获取被引量：2

Automatically Building a Large Scale Dictionary of Chinese Entity Sentiment Expressions

下载PDF

导出

摘要目前中文情感分析的主要资源以情感词典为主,缺乏针对实体或属性的情感知识资源。该文主要研究如何从大规模文本语料中自动获取实体情感知识。在该文方法中,用情感表达组合来表示实体情感知识。首先,基于二部图排序算法对情感表达组合候选集合进行排序。然后,提出了一种基于语义相似的提炼算法对于排序靠后的表达组合进行选择。在提炼选择过程中,充分考虑实体之间和情感词之间的约束。最后,该文在三种大规模不同领域的语料上进行实验,并进行人工评价。评价结果表明,从三个领域数据集上获取的实体情感表达组合正确率均高于90%。最终我们获得了一个大规模情感知识词典,包括约30万对的情感表达组合。 Except for some sentiment dictionaries.There are not sentiment expressions for entities which are very important for analysis.This paper proposes a method of automatically building a dictionary of entity sentiment expressions from large-scale raw text.In our method,we use a sorting algorithm based on a bipartite graph to rank the candidates of sentiment expressions.Then,we present a refining algorithm according to semantic similarity to extract some expressions from the low-rank set.Finally,we conduct the experiments on three datasets from different domains.The experimental results show that the accuracy of the extracted expressions is better than 90%.Totally we obtain a large scale dictionary including about 300 Ksentiment expressions.

作者卢奇陈文亮 LU Qi;CHEN Wenliang(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China;Collaborative Innovation Center of Novel Software Technology and Industrialization,Suzhou,Jiangsu 215006,China)

机构地区苏州大学计算机科学与技术学院软件新技术与产业化协同创新中心

出处《中文信息学报》 CSCD 北大核心 2018年第8期32-41,共10页 Journal of Chinese Information Processing

基金国家自然科学基金(61572338) 江苏省高校自然科学研究重大项目(16KJA520001)

关键词情感分析情感词典情感挖掘信息抽取 sentiment analysis sentiment dictionary sentiment mining information extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1王素格,吴苏红.基于依存关系的旅游景点评论的特征-观点对抽取[J].中文信息学报,2012,26(3):116-121. 被引量：17
2刘鸿宇,赵妍妍,秦兵,刘挺.评价对象抽取及其倾向性分析[J].中文信息学报,2010,24(1):84-88. 被引量：99
3Rong ZHANG,Koji ZETTSU,Yutaka KIDAWARA,Yasushi KIYOKI,Aoying ZHOU.Context-sensitive Web service discovery over the bipartite graph model[J].Frontiers of Computer Science,2013,7(6):875-893. 被引量：1

二级参考文献52

1姚天昉,聂青阳,李建超,李林琳,陈柯,付宁.一个用于汉语汽车评论的意见挖掘系统[C]//中文信息处理前沿进展-中国中文信息学会二十五周年学术会议论文集.北京:清华大学出版社,2006:260-281.
2李素建,刘群.汉语组块的定义和获取[C]//孙茂松,陈群秀.语言计算与基于内容的文本处理:全国计算语言学联合学术会议(SWCL2003)论文集.北京:清华大学出版社,2003:110-115.
3Hong Yu, Vasileios Hatzivassiloglou. Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences [C]//Proceedings of EMNLP 2003,2003: 129-136.
4Ellen Riloff, Janyce Wiebe, William Phillips. Exploiting subjectivity classification to improve information extraction [ C ]//Proceedings of AAAI-2005, 2005: 1106-1111.
5Minqing Hu,Bing Liu. Mining opinion features in customer reviews[C]//Proceedings of AAAI-2004,2004: 755-760.
6倪茂树,林鸿飞.基于关联规则和极性分析的商品评论挖掘[C]//第三届全国信息检索与内容安全学术会议,2007:635-642.
7Soo-Min Kim,Eduard Hovy. Automatic detection of opinion bearing words and sentences[C]//Proceedings of IJCNLP-2005,2005 : 61-66.
8Jun Zhao,Kang Liu,GenWang. Adding redundant features for crfs based sentence sentiment classification [C]//Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing, 2008: 117-126.
9Minqing Hu, Bing Liu. Mining and summarizing customer reviews [C]//Proceedings of KDD-2004, 2004 : 168-177.
10许洪波,孙乐,姚天昉.第三届中文倾向性分析评测总结报告[R].第三届中文倾向性分析评测(COAE2011).2011,1-24.

共引文献112

1吴杭鑫,张云华.基于词嵌入和自注意力机制的方面提取算法[J].智能计算机与应用,2021,11(4):25-29.
2赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：543
3文能,丁晟春.商品主观评论信息的倾向性分析综述[J].情报杂志,2010,29(12):70-74. 被引量：2
4张莉,钱玲飞,许鑫.基于核心句及句法关系的评价对象抽取[J].中文信息学报,2011,25(3):23-29. 被引量：22
5徐冰,赵铁军,王山雨,郑德权.基于浅层句法特征的评价对象抽取研究[J].自动化学报,2011,37(10):1241-1247. 被引量：49
6魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323. 被引量：70
7邱云飞,王雪,邵良杉.基于中文网络客户评论的消费者行为分析方法[J].现代情报,2012,32(1):8-11. 被引量：6
8王素格,吴苏红.基于依存关系的旅游景点评论的特征-观点对抽取[J].中文信息学报,2012,26(3):116-121. 被引量：17
9苏艳,居胜峰,王中卿,李寿山,周国栋.基于随机特征子空间的半监督情感分类方法研究[J].中文信息学报,2012,26(4):85-90. 被引量：16
10顾正甲,姚天昉.评价对象及其倾向性的抽取和判别[J].中文信息学报,2012,26(4):91-97. 被引量：23

同被引文献19

1徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：384
2李寿山,李逸薇,黄居仁,苏艳.基于双语信息和标签传播算法的中文情感词典构建方法[J].中文信息学报,2013,27(6):75-81. 被引量：35
3周咏梅,阳爱民,杨佳能.一种新闻评论情感词典的构建方法[J].计算机科学,2014,41(8):67-69. 被引量：21
4张莉,许鑫.产品评论中的隐式属性抽取研究[J].现代图书情报技术,2015(12):42-47. 被引量：9
5王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：71
6梅莉莉,黄河燕,周新宇,毛先领.情感词典构建综述[J].中文信息学报,2016,30(5):19-27. 被引量：22
7郗亚辉.产品评论中领域情感词典的构建[J].中文信息学报,2016,30(5):136-144. 被引量：23
8杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦.基于Word2Vec的情感词典自动构建与优化[J].计算机科学,2017,44(1):42-47. 被引量：40
9冯超,梁循,李亚平,周小平,李晓菲.基于词向量的跨领域中文情感词典构建方法[J].数据采集与处理,2017,32(3):579-587. 被引量：13
10林江豪,周咏梅,阳爱民,陈锦.基于词向量的领域情感词典构建[J].山东大学学报（工学版）,2018,48(3):40-47. 被引量：14

引证文献2

1王召义,陈应红,周海燕,孙婷婷.中文领域情感词典构建研究[J].情报探索,2020(11):48-56. 被引量：3
2刘玉玲,王翠林,付章杰.语义空间下基于情感表达的生成式文本隐写方法[J].通信学报,2023,44(4):176-186.

二级引证文献3

1狄巨星,柳子旭.基于BiGRU-ReCNN的微博文本情感倾向性分析[J].河北建筑工程学院学报,2022,40(2):210-216.
2钟金宏,黎梦萍,宣占祥.基于LDA模型的高校疫情防控舆情分析[J].信息技术与信息化,2022(12):72-75.
3刘涛,殷琴.数字人文视域下新世纪两岸闽南语歌曲语义网络分析[J].南京艺术学院学报（音乐与表演版）,2024(3):103-109.

1林惠兰.基于计算思维培养的小学编程教学[J].西部素质教育,2018,4(15):117-118. 被引量：4
2徐芳.学生计算能力的培养探究[J].科普童话（新课堂）,2018,0(23):22-22. 被引量：1
3周丹.博物馆历史文物文本英译方法研究[J].校园英语,2018,0(32):237-238. 被引量：1
4寇炜,郭代红,贾王平,胡鹏洲,庞宁,王啸宇.康莱特注射液致皮肤相关药品不良反应/事件的自动监测研究[J].药物流行病学杂志,2018,27(5):313-316.
5何有世,何述芳.基于领域本体的产品网络口碑信息多层次细粒度情感挖掘[J].数据分析与知识发现,2018,2(8):60-68. 被引量：8
6孙紫阳,顾君忠,杨静.基于深度学习的中文实体关系抽取方法[J].计算机工程,2018,44(9):164-170. 被引量：25
7李雁群,何云琪,钱龙华,周国栋.中文嵌套命名实体识别语料库的构建[J].中文信息学报,2018,32(8):19-26. 被引量：14
8孙晨,付英男,程文亮,钱卫宁.面向企业知识图谱构建的中文实体关系抽取[J].华东师范大学学报（自然科学版）,2018(3):55-66. 被引量：11
9张子民.小学语文教学中的情感教育理念及实践策略分析[J].中国校外教育,2018(10):136-136. 被引量：21
10何阳宇,易绵竹,贾惠心,李宏欣.老挝语命名实体识别研究综述[J].现代语言学,2018,6(3):449-461. 被引量：1

中文信息学报

2018年第8期

浏览历史

内容加载中请稍等...

大规模中文实体情感知识的自动获取被引量：2

参考文献3

二级参考文献52

共引文献112

同被引文献19

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

大规模中文实体情感知识的自动获取 被引量：2

参考文献3

二级参考文献52

共引文献112

同被引文献19

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

大规模中文实体情感知识的自动获取被引量：2