-
题名汉语比较句识别研究
被引量:16
- 1
-
-
作者
黄小江
万小军
杨建武
肖建国
-
机构
北京大学计算机科学技术研究所
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期30-38,共9页
-
基金
国家863计划资助项目(2008AA01Z421)
国家自然科学基金资助项目(60703064)
教育部高等学校博士点新教师基金资助项目(20070001059)
-
文摘
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为"比较"和"非比较"两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。
-
关键词
计算机应用
中文信息处理
汉语比较句识别
比较挖掘
文本分类
序列模式
-
Keywords
computer application
Chinese information processing
Chinese comparative sentences identification
comparative mining
text classification
sequential pattern
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名中文比较句识别及比较关系抽取
被引量:26
- 2
-
-
作者
宋锐
林鸿飞
常富洋
-
机构
大连理工大学计算机科学与工程系
-
出处
《中文信息学报》
CSCD
北大核心
2009年第2期102-107,122,共7页
-
基金
国家自然科学基金资助项目(60373095
60673039)
+1 种基金
国家863高科技计划资助项目(2006AA01Z151)
教育部留学回国人员科研启动基金项目
-
文摘
比较是一种具有一定说服力的评估方式,利用机器进行比较句的识别以及比较关系的抽取可以对观点挖掘、信息推荐等应用提供重要的依据。该文通过构建中文比较模式库以实现中文比较句的自动识别。在此基础上,该文通过选取比较主体、比较客体及其上下文的词、词性、位置、语义以及比较属性的领域知识等特征,利用条件随机域模型进行中文比较关系抽取。实验结果表明,中文比较模式库的构建有助于比较句的自动识别,而在词、词性、位置等Baseline特征中融入语义、领域知识及启发式规则特征后,基于条件随机域的比较关系抽取结果有了显著的提高。
-
关键词
计算机应用
中文信息处理
中文比较句识别
比较关系抽取
中文比较模式库
条件随机域
-
Keywords
computer application
Chinese information processing
Chinese comparative sentences identification
comparative relations extraction
Chinese comparative pattern database
CRF
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语义分类的比较句识别与比较要素抽取研究
被引量:9
- 3
-
-
作者
周红照
侯明午
侯敏
滕永林
-
机构
中国传媒大学国家语言资源监测与研究有声媒体中心
-
出处
《中文信息学报》
CSCD
北大核心
2014年第3期136-141,149,共7页
-
基金
国家语委十二五规划重点项目(ZDI125-3)
-
文摘
比较是人们常用的评估不同事物优劣、异同的表达方式,利用机器识别比较句并进一步抽取比较要素是语言信息处理领域一项新颖又有实用价值的课题。该文依据比较句与比较要素之间是一种"你中有我,我中有你"的共生关系,将比较句识别与比较要素抽取两个任务合二为一完成;根据词意分类,构建由领域词典、情感词典、标记词典、普通词典构成的词典系统;根据汉语比较句句义分类,构建比较句识别与比较要素抽取规则库。以第四届中文倾向性评测(COAE2012)发布的测试语料为实验对象,该系统取得了较好的实验(评测)结果。
-
关键词
语义分类
词典与规则
比较句识别
比较要素抽取
-
Keywords
semantic classification
lexicons and rules
comparative sentences identification
comparative elementsextraction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于关联特征词表的中文比较句识别
被引量:5
- 4
-
-
作者
杜文韬
刘培玉
费绍栋
张朕
-
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
山东财经大学图书馆
-
出处
《计算机应用》
CSCD
北大核心
2013年第6期1591-1594,共4页
-
基金
国家自然科学基金资助项目(60873247)
国家社会科学基金资助项目(12BXW040)
+3 种基金
公安部科技创新计划项目(2011YYCXSDST057)
山东省自然科学基金资助项目(ZR2012FM038
ZR2011FM030)
山东省科技发展计划项目(2012GGB01194)
-
文摘
中文比较句研究多集中于语言学领域,然而利用机器学习的方法识别比较句的研究才刚刚起步。根据关联规则挖掘算法的基本原理提出一种基于关联特征词表的比较句识别方法,该方法将词和词性作为一个基本元素,定义特征词表中核心词和依存词之间的关联方式,利用支持向量机(SVM)分类器进行比较句的识别。实验结果表明,该方法能够有效地识别出中文比较句,在准确率、召回率和F值上均取得不错的效果。
-
关键词
比较句识别
文本分类
中文比较模式库
类序列规则
关联特征词表
-
Keywords
comparative sentences identification
text classification
Chinese comparative pattern database
classsequential rule
associated feature vocabulary
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名维吾尔语比较句识别研究
- 5
-
-
作者
王慧云
禹龙
田生伟
加米拉.吾守尔
冯冠军
-
机构
新疆大学信息科学与工程学院
新疆大学网络中心
新疆大学软件学院
新疆大学人文学院
-
出处
《中文信息学报》
CSCD
北大核心
2016年第1期148-155,共8页
-
基金
国家自然科学基金(61262064
60963017
+6 种基金
61063026
61063043
61331011
61563051)
国家社科基金资助项目(10BTQ045
11XTQ007)
自治区教育厅高等院校重点项目(XJEDU2011I08)
-
文摘
识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模型,第一层是基于比较词的粗识别,第二层提出双向CSR挖掘算法(Bidirectional CSR Mining),以挖掘的模式为特征,利用支持向量机(SVM)筛选得到比较句,实现维吾尔语比较句的识别。实验F值达到70.93%,证明提出的两层识别模型可以有效识别维吾尔语比较句。
-
关键词
维吾尔语
比较句识别
双向CSR挖掘算法
文本分类
-
Keywords
Uyghur
comparative sentences identification
bidirectional CSR mining algorithm
text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名中文比较句的自动识别
被引量:2
- 6
-
-
作者
王巍
赵铁军
徐冰
郑德权
-
机构
哈尔滨工业大学机器智能与翻译研究室
-
出处
《智能计算机与应用》
2015年第5期1-3,共3页
-
基金
国家高技术研究发展计划(863)(2015AA015405)
国家自然科学基金面上项目(61402134)
国际科技合作项目(2014DFA11350)
-
文摘
评价文本的比较句识别是比较句情感分析的一项基础任务,具有重要的研究价值。提出中文比较句自动识别的方法,首先对包含至少一个关键词的候选比较句进行抽取,从而形成候选比较句集合,而后通过对候选比较句集合采用多特征融合的分类方法进行分类。实验结果表明比较句识别的性能达到87.26%的F1值。
-
关键词
评价文本
情感分析
比较句识别
多特征融合
-
Keywords
Evaluative Text
Sentiment Analysis
Comparative Sentence Identification
Feature Fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于混合类别序列规则的中文比较评论的识别
被引量:1
- 7
-
-
作者
朱茂然
蒋凯艳
高松
王洪伟
-
机构
同济大学经济与管理学院
中国信息安全测评中心
-
出处
《系统管理学报》
CSSCI
CSCD
北大核心
2021年第3期481-489,共9页
-
基金
国家自然科学基金青年项目(72001215)
经济社会应用统计重庆市重点实验室开放基金资助项目(KFJJ2019099)
+2 种基金
国家自然科学基金资助项目(71771177,71701085)
教育部科技发展中心高校产学研创新基金资助项目(2019J01012)
中国标准化协会服务贸易标准化科研课题(FMBZH-1947)。
-
文摘
在线评论中的比较信息揭示了品牌和商品的竞争性关系,为消费者的购买决策提供了有力的依据。在线评论中比较信息通常以显性和隐性两种形式存在。为此,提出一种将句法、规则、特征相结合的比较句识别算法。针对显性比较评论,提出了融合CSR方法与依存句法分析算法,即比较句的形式化结构与内在依存关系两个方面结合,提高比较句识别的效率。针对隐性比较评论,提出了基于产品名识别的方法,可有效识别隐性比较句,由此拓宽了比较句识别的范围。
-
关键词
比较句识别
类别序列规则
依存句法
隐性比较关系
-
Keywords
comparative sentence mining
class sequential rules(CSR)
dependency parsing
implicit comparative sentences
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-