一种基于图的情感基准词选择方法

Graph-Based Selection Method for Basic Sentimental Lexicons

下载PDF

导出

摘要作为文本情感分析的前提和基础,词语的情感极性判别显得尤为重要。现有利用情感基准词进行词语的情感倾向研究中,情感基准词的选择多数基于研究者的人工判别或词语的使用频率。以上方式存在着随机性和主观性的缺陷,并且难以保证对词典中语义关系的全面覆盖。本文提出以候选基准词为顶点,两词间的知网相似度作为边的权重设定参数来构建情感词的无向图。将图中结点的中介性值作为基准词的选择依据,从而保证所选基准词的可靠性。实验证明,通过该方法选取出来的基准词在词的情感倾向分类中具有较高的准确率。 As the premise and basis of text sentimental analysis, the emotion polarity discrimination of lexicons is particularly important. Existing methods of select basic sentimental lexicons in the study of semantic tendency are mostly based on artificial discrimination and lexicons frequency. Those ways suffer the defects of randomness and subjectivity. And it is difficult to ensure the full coverage of the semantic relations in the dictionary. In the paper, we present a method that treats the candidate basic sentimental lexicons as the vertex and the HowNet acquaintance as edge weight to build sentimental lexicons undirect- ed graph. The betweeness-centrality value of nodes in the graph is used as the reference of basic lexicons selecting. Thus we can ensure the reliability of the selected basic lexicons. Experiments show our method has a high accuracy in the classification of emotional tendencies.

作者方溢君何炎祥刘楠

机构地区武汉大学计算机学院军事经济学院军需系

出处《数据采集与处理》 CSCD 北大核心 2017年第4期844-852,共9页 Journal of Data Acquisition and Processing

基金国家自然科学基金(61070083 61303115)资助项目

关键词情感基准词知网相似度情感词无向图中介性值 basic sentimental lexicons Hownet acquaintance sentimental lexicons undirected graph be- tweeness-centrality value

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2王素格,李德玉,魏英杰,宋晓雷.基于同义词的词汇情感倾向判别方法[J].中文信息学报,2009,23(5):68-74. 被引量：36
3陈岳峰,苗夺谦,李文,张志飞.基于概念的词汇情感倾向识别方法[J].智能系统学报,2011,6(6):489-494. 被引量：10
4彭学仕,孙春华.面向倾向性分析的基于词聚类的基准词选择方法[J].计算机应用研究,2011,28(1):114-116. 被引量：7
5李辉,张琦,卢湖川,杨德礼.基于知网的中文常问问答系统[J].计算机工程,2008,34(23):62-64. 被引量：2
6马续补,郭菊娥.基于《知网》语义相似度的企业事实主题诊断研究[J].情报杂志,2010,29(5):54-57. 被引量：1
7闻扬,苑春法,黄昌宁.基于搭配对的汉语形容词-名词聚类[J].中文信息学报,2000,14(6):45-50. 被引量：11
8李桃陶,周斌,王忠振.基于社交网络的图数据挖掘应用研究[J].计算机技术与发展,2014,24(10):6-11. 被引量：7
9罗征,王赛,张帆,孙泰.面向大数据的图数据处理技术[J].情报工程,2015,1(6):120-125. 被引量：3
10丁悦,张阳,李战怀,王勇.图数据挖掘技术的研究与进展[J].计算机应用,2012,32(1):182-190. 被引量：14

二级参考文献288

1车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量：63
2胡和平,曾庆锐,路松峰.中文词聚类研究[J].计算机工程与科学,2006,28(1):122-124. 被引量：9
3朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
4余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量：25
5张国强,张国清.基于回溯机制的互联网AS拓扑的Betweenness算法[J].计算机研究与发展,2006,43(10):1790-1796. 被引量：7
6徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：119
7刘华.基于文本分类中特征提取的领域词语聚类[J].语言文字应用,2007(1):139-144. 被引量：21
8何燕,穗志方,段慧明,李素建.基于专业术语词典的自动领域本体构造[J].情报学报,2007,26(1):65-70. 被引量：13
9李清泉,徐敬海,郑年波,曾喆.基于功能的导航数据模型[J].武汉大学学报（信息科学版）,2007,32(3):266-270. 被引量：15
10黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：249

共引文献436

1张安勤,彭柏程,张挺.以案例驱动的《图数据挖掘》课程教学改革和实践[J].中国电力教育,2021(S01):260-262. 被引量：1
2杜家驹,岂凡超,孙茂松,刘知远.基于局部语义相关性的定义文本义原预测[J].中文信息学报,2020(5):1-9. 被引量：2
3杨频,李涛,赵奎.一种网络舆情的定量分析方法[J].计算机应用研究,2009,26(3):1066-1068. 被引量：19
4申晓晔,封化民,毋非.基于语义的Web新闻内容倾向性分析框架[J].郑州大学学报（理学版）,2009,41(1):33-35.
5罗安,王勇,张福浩,刘纪平.基于角色标注的中文POI名称语义分类方法[J].测绘通报,2012(S1):521-524. 被引量：3
6李国林,万常选,边海容,杨莉,钟敏娟.基于语素的金融证劵域文本情感探测[J].计算机研究与发展,2011,48(S3):54-59. 被引量：7
7张辉,薛贵荣.基于文本挖掘的搭配词典自动架构探讨[J].上海工程技术大学学报,2004,18(4):323-326. 被引量：2
8胡和平,曾庆锐,路松峰.中文词聚类研究[J].计算机工程与科学,2006,28(1):122-124. 被引量：9
9徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：119
10马海兵,刘永丹,王兰成,李荣陆.三种文档语义倾向性识别方法的分析与比较[J].现代图书情报技术,2007(4):43-47. 被引量：15

1毕双艳,唐永林,路线,李松涛.两类联图的优美性[J].吉林工业大学学报,1999,29(1):44-47.
2浦填.变压器选择方法的讨论[J].机械制造与自动化,1991(5):40-42.
3新年兼容机购买白皮书[J].计算机教与学,2002(2):33-37.
4杨晶晶,慈玉芳,张子刚,王杉荣,王莉,陶平.网卡的选择与鉴别[J].内江科技,2004(3):30-30.
5刘桂真,王建方.(a,b,k)-临界图[J].科学通报,1997,42(11):1229-1230.
6杜先能.图与它们的表示之间的关系(英文)[J].安徽大学学报（自然科学版）,1998,22(4):1-4.
7刘桂真,王建方.(a,b,k)-临界图(英)[J].数学进展,1998,27(6):536-540. 被引量：18
8晓景.谈谈笔记本电脑的内存升级[J].现代通信,2002(12):37-37.
9刘桂真.关于Alspach问题的解[J].科学通报,1993,38(24):2223-2226. 被引量：1
10马润年,许进.图的正交[0,k_i]_1~m -因子分解(英文)[J].工程数学学报,1999,16(4):23-27. 被引量：1

数据采集与处理

2017年第4期

浏览历史

内容加载中请稍等...

一种基于图的情感基准词选择方法

参考文献15

二级参考文献288

共引文献436

相关作者

相关机构

相关主题

浏览历史