基于特征分选策略的中文共指消解方法被引量：2

Chinese Coreference Resolution Method Based on Feature Respective Selection Strategy

下载PDF

导出

摘要针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。 This paper studies different features based up on the type of noun phrase in Chinese coreference resolution based on machine learning,and proposes features selection strategy to be applied to coreference resolution,the approach selects pronouns and other noun phrases features respectively,so this method can reduce some ＂noise＂ and utilize features effectively.Experimental results show that the method can improve the performance of coreference resolution system,and F-measure reaches 80.72%.

作者李渝勤甘润生杨永红施水才

机构地区北京信息科技大学计算机学院北京拓尔思信息技术股份有限公司中山大学信息科学与技术学院计算机科学系

出处《计算机工程》 CAS CSCD 北大核心 2011年第18期180-182,共3页 Computer Engineering

基金国家"863"计划基金资助重点项目(2006AA010105) 国家自然科学基金资助项目(60772081) 北京市自然科学基金资助项目(4092015) 北京市教委科技发展计划基金资助项目(KM201010772023)

关键词共指消解特征选择自然语言处理支撑向量机数据词典 coreference resolution feature selection nature language processing Support Vector Machine（SVM） data dictionary

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Ng S H, Lim D. A Machine Learning Approach to Coreference Resolution of Noun Phrases[J]. Computational Linguistics, 2001, 27(4): 521-544.
2Cardie N C. Improving Machine Learning Approaches to Corefe- rence Resolution[C]//Proc. of the 40th Annual Meeting on Asso- ciation for Computational Linguistics. Stroudsburg, USA: [s. n.], 2002: 104-111.
3Ng V. Semantic Class Induction and Coreference Resolution[C]// Proc. of the 45th Annual Meeting of the Association of Computational Linguistics. Prague, Czech: [s. n.], 2007: 536-543.
4王厚峰,何婷婷.汉语中人称代词的消解研究[J].计算机学报,2001,24(2):136-143. 被引量：36
5李艳翠,杨勇,周国栋,朱巧明.基于支持向量机的英语名词短语指代消解[J].计算机工程,2009,35(3):199-201. 被引量：1

二级参考文献8

1刘志文,郝惠宁,肖友芙,黄曾阳.自然语言语句的HNC表示[J].语言文字应用,1998(2):91-94. 被引量：6
2Wee Meng Soon, Hwee Tou N H T, Lim D C Y. A Machine Learning Approach to Coreference Resolution of Noun Phrase[J]. Computational Linguistics, 2001, 27(4): 521-544.
3Vincent N, Cardie C. Improving Machine Learning Approaches to Coreference Resolution[C]HProc. of the 40th Annual Meeting of the Association for Computational Linguistics. Philadelphia, PA, USA: [s. n.], 2002.
4Taylor J S.支持向量机导论[M].李国正,王猛,曾华军,译.北京:电子工业出版社,2004.
5Yang Xiaofeng, Su Jian, Zhou Guodong, et al. Improving Pronoun Resolution by Incorporating Coreferential Information of Candidates[C]//Proc. of ACL'04. Barcelona, Spain: [s. n.], 2004.
6Zhou Guodong, Su Jian. A Resolution System Using a Strategy[C]//Proc. of COLING'04 2004. High-performance Coreference Constraint-based Multi-Agent Geneva, Switzerland: [s. n.],
7王厚峰.句类中E块的作用及其判定策略[J].计算机科学,2000,27(5):64-67. 被引量：2
8王厚峰.指代消解的基本方法和实现技术[J].中文信息学报,2002,16(6):9-17. 被引量：46

共引文献35

1曹军,周经野,肖赤心.基于语义结构分析的汉语零代词消解[J].湘潭大学自然科学学报,2001,23(4):28-33. 被引量：3
2王厚峰.汉语篇章的指代消解浅论[J].语言文字应用,2004(4):113-119. 被引量：13
3李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
4赵军,刘非凡.Linguistic Theory Based Contextual Evidence Mining for Statistical Chinese Co-Reference Resolution[J].Journal of Computer Science & Technology,2007,22(4):608-617. 被引量：1
5庞宁,杨尔弘.基于最大熵模型的共指消解研究[J].中文信息学报,2008,22(2):24-27. 被引量：4
6郎君,秦兵,刘挺,李正华,李生.中文人称名词短语单复数自动识别[J].自动化学报,2008,34(8):972-979. 被引量：4
7郭巍,宋锐,林鸿飞.基于SVM与距离加权计算的观点和持有者识别机制[J].计算机工程与科学,2008,30(10):125-128. 被引量：2
8朱迎春.人称代词指代的消解与篇章教学[J].台州学院学报,2008,30(5):48-51. 被引量：1
9胡乃全,孔芳,王海东,周国栋,朱巧明.基于最大熵模型的中文指代消解系统实现[J].计算机应用研究,2009,26(8):2948-2951. 被引量：3
10李世奇,赵铁军,陈晨,刘鹏远.基于ART网络的无指导中文共指消解方法[J].高技术通讯,2009,19(9):926-932.

同被引文献36

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2吕易俗,田文杰,李翔宇,殷树娟,包舒,孙少东.基于Verilog的CAN总线协议验证模型库的建立[J].微电子学与计算机,2015,32(3):122-126. 被引量：2
3王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
4李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
5周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
6乐明.汉语篇章修辞结构的标注研究[J].中文信息学报,2008,22(4):19-23. 被引量：27
7杨勇,李艳翠,周国栋,朱巧明.指代消解中距离特征的研究[J].中文信息学报,2008,22(5):39-44. 被引量：7
8陈莉萍.汉语篇章结构标注的理论支撑[J].南京航空航天大学学报（社会科学版）,2008,10(3):68-71. 被引量：2
9王海东,胡乃全,孔芳,周国栋.指代消解中语义角色特征的研究[J].中文信息学报,2009,23(1):23-29. 被引量：8
10徐遇霄.基于Java的SOA分层研究与设计[J].舰船电子工程,2010,30(6):124-129. 被引量：10

引证文献2

1孔芳,王红玲,周国栋.汉语篇章理解研究综述[J].软件学报,2019,30(7):2052-2072. 被引量：4
2符一蕾,杨庆东.机床专家咨询系统的设计与实现[J].机械工程师,2019,0(10):35-37.

二级引证文献4

1李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：3
2杨进才,曹煜欣,胡泉,蔡旭勋.基于BERT-FHAN模型融合语句特征的汉语复句关系自动识别[J].计算机系统应用,2022,31(9):233-240.
3卢露,矫红岩,李梦,荀恩东.基于篇章的汉语句法结构树库[J].自动化学报,2022,48(12):2911-2921. 被引量：1
4蒋峰,范亚鑫,褚晓敏,李培峰,朱巧明.英汉篇章结构分析研究综述[J].软件学报,2023,34(9):4167-4194.

1冯元勇,孙乐,董静,李文波.基于分类信心重排序的中文共指消解研究[J].中文信息学报,2007,21(6):22-28.
2李世奇,赵铁军,陈晨,刘鹏远.基于ART网络的无指导中文共指消解方法[J].高技术通讯,2009,19(9):926-932.
3谢永康,周雅倩,黄萱菁.一种基于谱聚类的共指消解方法[J].中文信息学报,2009,23(3):10-16. 被引量：5
4如果我正在使用差异虚拟硬盘（VHD）并且父级VHD被损坏了，我会丢失差异磁盘中的所有数据吗？[J].Windows IT Pro Magazine（国际中文版）,2009(11):8-8.
5刘未鹏,周俊生,黄书剑,陈家骏.基于有监督关联聚类的中文共指消解[J].计算机科学,2009,36(9):182-185. 被引量：1
6徐娟,姚如贵.无双亲信息兄弟关系查询算法研究[J].计算机与数字工程,2015,43(2):159-163.
7卢小雷.伙伴 HP Officejet Pro 8610 喷墨多功能一体机[J].个人电脑,2014(5):12-15.
8年华,赵婉茹,卢楠楠,王梦瑶.基于统计调查问卷的手机APP使用现状研究[J].现代经济信息,2016,0(9):329-331.
9李素建,宋涛,高杰,幺鹏跃,李文捷.一种基于使用差异的词语领域性分析方法[J].中文信息学报,2009,23(6):72-78. 被引量：5
10涂巧玲.一种可执行功耗管理的无线传感器网络节点电源[J].测控技术,2009,28(10):8-10. 被引量：3

计算机工程

2011年第18期

浏览历史

内容加载中请稍等...

基于特征分选策略的中文共指消解方法被引量：2

参考文献5

二级参考文献8

共引文献35

同被引文献36

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于特征分选策略的中文共指消解方法 被引量：2

参考文献5

二级参考文献8

共引文献35

同被引文献36

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于特征分选策略的中文共指消解方法被引量：2