-
题名基于规则的中文缺省识别研究
被引量:5
- 1
-
-
作者
杨国庆
孔芳
朱巧明
李培峰
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2011年第12期255-257,273,共4页
-
基金
国家自然科学基金(90920004
60970056
+2 种基金
61070123
61003153)
江苏省高校自然科学重大基础研究项目(08KJA520002)资助
-
文摘
中文语句中广泛存在缺省现象,缺省项识别的准确与否关系到缺省消解结果,因此对缺省项的识别很重要。介绍了一种基于规则的中文缺省项识别方法,即采用CTB语料构建基准语料库,以动词驱动为核心提出规则来获得缺省项的结构化信息。实验结果显示,基于规则的中文缺省项识别方法具有可行性。
-
关键词
缺省识别
规则
动词
-
Keywords
Ellipsis identification,Rule-based,Verbs
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名用于中文缺省识别研究的机器学习方法
被引量:1
- 2
-
-
作者
秦凯伟
孔芳
李培峰
朱巧明
徐生芹
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第22期130-132,共3页
-
基金
国家自然科学基金资助项目(90920004
60970056
+3 种基金
61070123
61003153)
江苏省高校自然科学重大基础研究基金资助项目(08KJA520002)
苏州市科技计划基金资助项目(SYG201112)
-
文摘
实现一个基于机器学习的中文缺省项识别系统,对语料库进行预处理,选取多个特征及其组合,通过支持向量模型(SVM)构建的缺省识别模型进行中文缺省识别。研究系统在不同句法分析树上的性能。实验结果证明,该识别系统在标准的句法分析树上F值能达到84.01%,在自动句法树上能达到68.22%。
-
关键词
缺省
自然语言处理
句法分析树
机器学习
语料
缺省识别
-
Keywords
ellipsis
natural language processing
sentence parse tree
machine learning
corpus
ellipsis identification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于条件随机场的评价对象缺省项识别
被引量:1
- 3
-
-
作者
唐文武
过弋
徐永斌
方旭
-
机构
华东理工大学信息科学与工程学院
石河子大学信息科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2016年第6期208-214,共7页
-
基金
国家自然科学基金(61462073)
-
文摘
在电商网站评论文本中,评价对象和评价属性的缺省识别对文本情感分析具有重要地作用。针对电商网站评论文本中评价对象和评价属性缺省问题,该文提出了一种基于条件随机场的评价对象缺省项识别方法。首先利用情感词典识别观点句,将缺省项识别问题转换成序列标注问题,综合词法特征和依存句法特征,使用条件随机场模型进行训练,并在测试集上对待识别的观点句进行序列标注,通过标注结果判定缺省项的位置。实验结果表明,该方法具有较高的准确率和召回率,验证了该方法的有效性。
-
关键词
条件随机场
评价对象
缺省识别
序列标注
-
Keywords
Conditional Random Fields(CRFs)
comment object
the default resolution
sequence labeling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-