-
题名基于语义理解的文本倾向性识别机制
被引量:123
- 1
-
-
作者
徐琳宏
林鸿飞
杨志豪
-
机构
大连理工大学计算机科学与工程系
-
出处
《中文信息学报》
CSCD
北大核心
2007年第1期96-100,共5页
-
基金
国家自然科学基金资助项目(60373095
60673039)
-
文摘
文本倾向性识别在垃圾邮件过滤、信息安全和自动文摘等领域都有广泛的应用。本文提出了基于语义理解的文本倾向性识别机制。其主要思想是首先计算词汇与知网中已标注褒贬性的词汇间的相似度,获取词汇的倾向性;再选择倾向性明显的词汇作为特征值,用SVM分类器分析文本的褒贬性;最后采用否定规则匹配文本中的语义否定的策略提高分类效果,同时处理程度副词附近的褒义词和贬义词,以加强对文本褒贬义强度的识别。
-
关键词
计算机应用
中文信息处理
倾向性识别
知网
语义相似度
否定句
程度副词
-
Keywords
computer application
Chinese information processing
orientation identification
HowNet
semantic similarity
negative sentence
degree adverb
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名三种文档语义倾向性识别方法的分析与比较
被引量:15
- 2
-
-
作者
马海兵
刘永丹
王兰成
李荣陆
-
机构
南京政治学院上海分院
Autodesk公司
-
出处
《现代图书情报技术》
CSSCI
北大核心
2007年第4期43-47,共5页
-
基金
中国博士后基金资助项目"军队网络舆情分析系统"(项目编号:20060390952)
江苏省博士后科研资助项目(项目编号:0601029)的研究成果之一
-
文摘
研究并实现三种文档倾向性识别的方法:基于情感词加权的方法、基于语义模式分析的方法和基于文本分类的方法。第一种方法利用特征词汇的情感语义倾向性。第二种方法对自然语言的句法结构进行简化,以获取合适粒度的倾向性语义模式。第三种方法则直接利用传统的基于文本分类的方法。通过在网络舆情分析系统中的具体实现,探讨这三种方法各自的不足和优势。
-
关键词
自然语言处理
文本分类
倾向性识别
-
Keywords
Natural language process Text classification Semantic orientation recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名评价主题挖掘及其倾向性识别
被引量:5
- 3
-
-
作者
李芳
何婷婷
宋乐
-
机构
华中师范大学国家数字化学习工程技术研究中心
国家语言资源监测与研究中心网络媒体分中心
华中师范大学计算机科学系
-
出处
《计算机科学》
CSCD
北大核心
2012年第6期159-162,共4页
-
基金
国家自然科学基金重大研究计划课题(90920005)
国家自然科学基金(61003192)
+4 种基金
教育部哲学社会科学研究重大课题攻关项目(08JZD0032)
教育部/国家外国专家局高等学校学科创新引智计划课题(B07042)
湖北省自然科学基金计划项目(2009CDB145)
武汉市晨光计划项目(201050231067)
华中师范大学中央高校基本科研业务费项目(CCNU10A02009,CCNU10C01005)资助
-
文摘
主要研究如何从在线评论文本中挖掘产品的评价主题,并对其倾向性进行分析。首先采用一种启发式规则和共现概率统计相结合的方法识别文本集合中的名词性短语,再运用LDA模型挖掘潜在的评价主题。然后利用多特征融合的方法计算句子的倾向性,进而根据特征词群统计出各主题的倾向性结果。最后通过对网络汽车评论文本语料的实验证实了该方法的有效性。
-
关键词
LDA
评价主题
倾向性识别
-
Keywords
LDA
Opinion topic
Orientation identification
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名一种情感词语义加权的句子倾向性识别方法
被引量:3
- 4
-
-
作者
赵鹏
赵志伟
卓景文
-
机构
安徽大学计算智能与信号处理教育部重点实验室
安徽大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第35期161-163,192,共4页
-
基金
安徽省教育厅重点项目(No.KJ2009A001Z)
安徽省信息产业厅专项基金项目
安徽大学青年科学研究基金项目(No.2009QN004A)
-
文摘
互联网上大量的主观评论性信息蕴含着巨大的商业价值,同时也促使了倾向性识别研究的兴起。句子倾向性识别是文本倾向性识别的基础,现有句子倾向性识别方法存在着识别效果不理想、模式抽取困难等问题。将情感词视为基因,在不同的语境下呈现出不同的性状,通过构建情感词语义倾向分析器,先确定情感词的静态显性,然后根据不同的语境确定情感词的动态显性,最后提出基于情感词语义加权的句子倾向性识别算法。实验结果显示,该方法提高了句子倾向性识别的判全率和判准率,是合理和有效的。
-
关键词
情感词
上下文
语义倾向
倾向性识别
-
Keywords
sentiment word
context
semantic orientation
orientation distinction
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名融合直推式学习和语义理解的词语倾向性识别
- 5
-
-
作者
闻彬
饶彬
赵君喆
焦翠珍
戴文华
-
机构
湖北科技学院计算机科学与技术学院
-
出处
《计算机技术与发展》
2016年第1期74-77,共4页
-
基金
国家自然科学基金面上项目(61373108)
湖北省教育厅科研项目(Q20112809
+1 种基金
B20082803)
湖北省教育厅人文社会科学研究项目(13g389)
-
文摘
目前词语情感倾向性识别研究主要分为机器学习和语义理解,机器学习不能很好地识别通用领域词语,语义理解又存在准确率和召回率不够高的问题,因此文中提出了一种融合直推式学习和语义理解的词语倾向性识别方法。首先对HowNet知识库体系进行改进,在已有的四种义原的基础上,提出第五义原—情感义原;然后将第五义原手工融入到HowNet知识库中,再在此基础上提出词语情感相似度计算方法计算词语的情感值;最后将该方法融合直推式学习以判定词语情感倾向性。通过实验结果表明,与支持向量机和原语义理解方法相比,该方法在识别情感词上取得了较好的效果。
-
关键词
词语倾向性识别
机器学习
语义理解
意见挖掘
情感义原
HOWNET
-
Keywords
word sentiment orientation
machine learning
semantic comprehension
opinion mining
sentimental primitive
How Net
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于论坛主题的网页褒贬倾向性识别
- 6
-
-
作者
王爽
熊德兰
赵会洋
-
机构
许昌学院计算机科学与技术学院
-
出处
《计算机技术与发展》
2009年第9期111-114,共4页
-
基金
河南省自然科学研究计划项目(2008B520031)
许昌学院2009年校内科研项目(2009056)
-
文摘
褒贬倾向性识别在信息过滤、自动文摘、文本分类等领域有良好的应用前景。针对褒贬倾向性较为集中的论坛网页,提出了基于特定论坛主题的网页文本褒贬倾向性计算方法。结合句法分析和词语相似度计算方法,提取反映主题倾向的特征词,根据每个信息块的倾向性计算页面的褒贬倾向,实现了论坛网页句子级别、信息块级别和网页级别等三个层次的褒贬倾向性计算,在部分语料范围内的实验结果良好,对于此类网页的分析评价有一定的意义。
-
关键词
论坛主题分析
倾向性识别
网页评价
词语相似度
-
Keywords
forums theme analysis
orientation idcnification
Webpages evaluation
words similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于机器学习技术的在线疾病诊疗方案倾向性识别研究
被引量:1
- 7
-
-
作者
艾新龑
毛文涛
田梅
-
机构
河南师范大学计算机与信息工程学院
新乡医学院管理学院
-
出处
《中华医学图书情报杂志》
CAS
2018年第7期1-5,共5页
-
基金
国家自然科学基金"基于多任务学习的机械结构小损伤检测方法研究"(U1704158)
河南省高校科技创新人才资助计划"基于多任务学习的结构振动微损伤识别方法研究"(15HASTIT022)
-
文摘
目的:采用机器学习技术分析和预测在线疾病诊疗方案的倾向性。方法:爬取39疾病百科网中与心血管疾病相关的439条症状数据,通过TF-IDF算法提取症状关键词向量,采用支持向量机、决策树、神经网络建立分类模型,预测不同病症倾向西医或中西医结合的治疗方案。结果:对在线疾病信息的文本分析可挖掘疾病的特征,采用机器学习技术可有效预测对应治疗方案的倾向性,预测精度均达90%以上。结论:机器学习技术可揭示疾病症状和治疗方案之间的内在联系,有助于提高在线疾病咨询的效率,提供有针对性的备选治疗方案。
-
关键词
机器学习
在线医疗
中西医结合
心血管疾病
倾向性识别
文本挖掘
-
Keywords
Machine learning
Online medical treatment
Combined Western and traditional Chinese medicine
Cardiovascular disease
Tendency cognition
Text mining
-
分类号
R-058
[医药卫生]
R197.324
[医药卫生—卫生事业管理]
-
-
题名基于N-gram超核的中文倾向性句子识别
被引量:3
- 8
-
-
作者
廖祥文
李艺红
-
机构
福州大学数学与计算机科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2011年第5期89-93,100,共6页
-
基金
福建省自然科学基金资助项目(2010J05133)
福建省科技创新平台计划项目(2009J1007)
福州大学科技发展基金资助项目(2010-XQ-22)
-
文摘
倾向性句子识别是文本倾向性分析的重要组成部分,其目的是识别文档中具有情感倾向的主观性句子。中文句子的倾向性不仅与倾向词有关,而且还跟句法、语义等因素有关,这使得倾向性句子识别不能简单地从词语的倾向性来统计得到。该文提出了一种基于N-gram超核的中文倾向性句子识别分类算法。该算法基于句子的句法、语义等特征构造N-gram超核函数,并采用基于该超核函数的支持向量机分类器识别中文倾向性句子。实验结果表明,与多项式核、N-gram核等单核函数相比,基于N-gram超核的中文倾向性句子识别算法在一定程度上能有效识别倾向性句子。
-
关键词
倾向性句子识别
N-gram超核函数
倾向性分析
-
Keywords
identification of Chinese opinion sentences
N-gram hyperkernel function
opinion mining
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于HowNet的句子褒贬倾向性研究
被引量:31
- 9
-
-
作者
熊德兰
程菊明
田胜利
-
机构
许昌学院计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第22期143-145,共3页
-
基金
河南省教育厅自然科学基金项目(No2008B520031)
许昌市科技局科技发展计划项目(No07020062)
-
文摘
文本倾向性识别在信息过滤、自动文摘、文本分类等领域有广泛的应用前景。句子倾向性研究是文本倾向性识别的基础,结合句法分析结果和词语语义倾向性可以衡量句子褒贬倾向性。以HowNet的词汇语义相似度计算为基础,提出了基于的语义距离和语法距离的句子褒贬倾向性计算方法。大量语句实验表明,该方法的计算结果与人工判别结果更接近。
-
关键词
语义相似度
语法分析树
语义距离
语法距离
倾向性识别
-
Keywords
semantic similarity
syntactic tree
semantic distance
grammar distance
tendentious recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的基于知网词汇语义褒贬倾向性计算
被引量:15
- 10
-
-
作者
杨昱昺
吴贤伟
-
机构
宁波大红鹰学院电子信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第21期91-93,108,共4页
-
基金
浙江省教育厅科研项目(No.20071322)
-
文摘
词汇语义褒贬倾向性研究是句子褒贬倾向性识别的基础,而句子褒贬倾向性识别又是文本倾向性识别和篇章结构褒贬倾向性识别的基础。以《知网》的词汇语义相似度计算为基础,针对目前采用计算基准词对与词汇相似度的方法识别词汇褒贬倾向性理论,从褒贬基准词和计算公式入手,提出了改进办法。实验证明,在同样基准词对下,准确率得到了很大的提高,达到98.94%,具有实际应用价值。
-
关键词
语义相似度
倾向性识别
知网
褒贬基准词
-
Keywords
semantic similarity
tendentiousness recognition
HowNet
appraise benchmark words
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义倾向性的文本过滤研究
被引量:3
- 11
-
-
作者
程显毅
杨天明
朱倩
蔡月红
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第12期4460-4462,共3页
-
基金
国家自然科学基金资助项目(60702056)
-
文摘
以往文本过滤的研究主要集中于主题过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。在语义倾向性分析中,若忽略关联词和修饰词则有可能导致对极性词的倾向或强度判断失误。针对这一问题,提出了一种新的语义倾向性识别算法,用于对潜在极性词进行倾向性识别,并应用到文本过滤方面。实验表明此方法具有较高的准确率和召回率。
-
关键词
倾向性识别
文本过滤
语义
关联词
-
Keywords
orientation recognition
text filtering
semantic
conjunction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-