摘要
针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。
This paper studies different features based up on the type of noun phrase in Chinese coreference resolution based on machine learning,and proposes features selection strategy to be applied to coreference resolution,the approach selects pronouns and other noun phrases features respectively,so this method can reduce some "noise" and utilize features effectively.Experimental results show that the method can improve the performance of coreference resolution system,and F-measure reaches 80.72%.
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第18期180-182,共3页
Computer Engineering
基金
国家"863"计划基金资助重点项目(2006AA010105)
国家自然科学基金资助项目(60772081)
北京市自然科学基金资助项目(4092015)
北京市教委科技发展计划基金资助项目(KM201010772023)
关键词
共指消解
特征选择
自然语言处理
支撑向量机
数据词典
coreference resolution
feature selection
nature language processing
Support Vector Machine(SVM)
data dictionary