一种基于图划分的无监督汉语指代消解算法被引量：19

A New Graph Clustering Algorithm for Chinese Noun Phrase Coreference Resolution

下载PDF

导出

摘要指代消解是自然语言处理领域中的一个重要问题。针对当前中文指代标注训练语料非常缺乏的现状,本文提出一种无监督聚类算法实现对名词短语的指代消解。引入图对名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并引入一个有效的模块函数实现对图的自动划分,使得指代消解过程并不是孤立地对每一对名词短语分别进行共指决策,而是充分考虑了多个待消解项之间的相关性,并且避免了阈值选择问题。通过在ACE中文语料上的人称代词消解和名词短语消解实验结果表明,该算法是一种有效可行的无监督指代消解算法。 Coreference resolution plays an important role in natural language processing. Facing the fact that the Chinese training corpus for coreference resolution is heavily lacking, this paper presents a new unsupervised clustering algorithm for noun phrase coreference resolution. In this approach, the problem of coreference resolution is firstly converted as a graph clustering problem, and then an objective function called the modularity function, which allows automatic selection of the number of clusters, is selected for graph clustering. The proposed algorithm does not make pairwise coreference decisions independently of each other. The experimental results on the Chinese ACE training corpus demonstrate that the proposed method is a feasible unsupervised algorithm for noun phrase coreference resolution.

作者周俊生黄书剑陈家骏曲维光

机构地区南京大学计算机科学与技术系南京师范大学计算机科学系

出处《中文信息学报》 CSCD 北大核心 2007年第2期77-82,共6页 Journal of Chinese Information Processing

基金国家863高技术研究发展计划资助项目(2006AA01Z143) 国家自然科学基金资助项目(60673043) 江苏省自然科学基金项目(BK2006117)

关键词人工智能自然语言处理聚类指代消解模块函数 artificial intelligence natural language processing clustering coreference resolution modularity function

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1T. Morton. Coreference for NLP applications[A]. In:Proc. of the ACL[C]. 2000.
2D. Zelenko, C. Aone, and J. Tibbetts. Coreference resolution for information extraction[A]. In: Proc. of the ACL Workshop on Reference Resolution and its Applications[C]. 2004. 9-16.
3Kee van Deemter, Rodger Kibble. On Coreferring:Coreference in MUC and Related Annotation Schemes[J]. Computational Linguistics, 2000, 26(4): 615-623.
4王厚峰.指代消解的基本方法和实现技术[J].中文信息学报,2002,16(6):9-17. 被引量：46
5W. M. Soon, H. T. Ng, and D. Lim. A machine learning approach to coreference resolution of noun phrases[J]. Computational Linguistics, 2001, 27(4):521-544.
6V. Ng and C. Cardie.. Improving machine learning approaches to coreference resolution[A]. In: Proc. of the ACL[C]. 2002. 104-111.
7X. Yang, G. D. Zhou, J. Su, and C. L. Tan. Coreference resolution using competitive learning approach[A]. In: Proc. of the ACL 2003[C]. 176-183.
8X. Luo, A. Ittycheriah, H. Jing, N. Kambhatla, and S. Roukos. A mention-synchronous coreference resolution algorithm based on the Bell tree[A]. In: Proc.of the ACL 2004[C]. 136-143.
9王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
10C. Cardie and K. Wagstaff.. Noun phrase coreference as clustering[A]. In: Proc. of EMNLP/VLC[C]. 1999. 82-89.

二级参考文献14

1秦洪武.第三人称代词在深层回指中的应用分析[J].当代语言学,2001,3(1):55-64. 被引量：34
2马彦华黄昌宁等.汉语中人称代词指代问题研究.1998年中文信息处理国际会议论文集[M].北京,1998..
3郭志立.人称代词指代主体的辨析及其在摘要提取中的应用.1998年中文信息处理国际会议会论文集[M].北京清华大学出版社,1998.310-315.
40uinlan, CA.5: Programs for Machine Learning[M], Morgan Kaufinann, 1993.
5Michael PAUL, Kazuhide YAMAMU1D, Eiichiro SUMITA. Corpus-Based Anaphora Resolution Towards Antecedent Preference[A]. In: Proc. of the 37th ACL, Workshop Coreference and It's Application, Maryland, USA, 1999,47-52.
6W M Soon, HTNg, C Y Lim. Corpus-based leamirg for noun phrase conference msolulion[A]. In: Proc. of the Joint Conf on Eaoirical Methods in NIP and Very Large Corpora. Maryland: Univetsity of Maryland, USA, 1999, 285-291.
7M Vilain, J Aberdeen et al. A model-theoretic coreference scoring scheme. [A] In: Proc. of the 6th Message Understanding Corlf (MUC6), San Francisco: Morgan Kaufinann Publishers, 1995,45-52.
8Caroline Gasperin and Renata Viera, Using word similarity lists for resolving indirect anaphora[A], ACI2004 workshop on coreference resolution, 2004.
9Dmitry Zelenko, Chinatsu Aone, Jason Tibbetts, Coreference Resolution for Information Extraction [A], ACL2004 workshop on Coreference resolution, 2004.
10许敏,王能忠,马彦华.汉语中指代问题的研究及讨论[J].西南师范大学学报（自然科学版）,1999,24(6):633-637. 被引量：18

共引文献83

1吴敏.指代消解在普通语言学理论与课程实践上的应用研究[J].大家,2010(11):135-136.
2何甫权.英语指代与翻译[J].安徽文学（下半月）,2008(8):296-297.
3王厚峰.汉语篇章的指代消解浅论[J].语言文字应用,2004(4):113-119. 被引量：13
4王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
5李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
6徐琳,赵铁军.国家自然科学基金在自然语言处理领域近年来资助的已结题项目综述[J].软件学报,2005,16(10):1853-1858. 被引量：7
7李生,赵铁军.Chinese Information Processing and Its Prospects[J].Journal of Computer Science & Technology,2006,21(5):838-846. 被引量：1
8庞宁,杨尔弘.基于统计模型与规则的指代消解研究[J].太原科技,2007(5):61-62. 被引量：2
9赵军,刘非凡.Linguistic Theory Based Contextual Evidence Mining for Statistical Chinese Co-Reference Resolution[J].Journal of Computer Science & Technology,2007,22(4):608-617. 被引量：1
10张美娜,亓超,迟呈英,战学刚.基于汉语篇章结构的自动摘要方法研究[J].情报杂志,2007,26(8):34-36. 被引量：3

同被引文献263

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2王厚峰.汉语篇章的指代消解浅论[J].语言文字应用,2004(4):113-119. 被引量：13
3刘仲林.交叉科学时代的交叉研究[J].科学学研究,1993,11(2):9-16. 被引量：139
4王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量：36
5李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量：33
6朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：325
7刘洪星,王石林.Topic Maps与学科知识管理[J].计算机时代,2006(3):25-26. 被引量：6
8于海滨,秦兵,刘挺,郎君.命名实体识别和指代消解在文摘系统中的应用[J].计算机应用研究,2006,23(4):180-182. 被引量：7
9王智强,李蕾,王枞.基于决策树的汉语代词共指消解[J].北京邮电大学学报,2006,29(4):1-5. 被引量：4
10高琰,谷士文,唐琎,蔡自兴.机器学习中谱聚类方法的研究[J].计算机科学,2007,34(2):201-203. 被引量：31

引证文献19

1冯元勇,孙乐,董静,李文波.基于分类信心重排序的中文共指消解研究[J].中文信息学报,2007,21(6):22-28.
2谢永康,周雅倩,黄萱菁.一种基于谱聚类的共指消解方法[J].中文信息学报,2009,23(3):10-16. 被引量：5
3赵煜,蔡皖东,樊娜,李慧贤.利用词汇分布相似度的中文词汇语义倾向性计算[J].西安交通大学学报,2009,43(6):33-37. 被引量：1
4胡乃全,孔芳,王海东,周国栋,朱巧明.基于最大熵模型的中文指代消解系统实现[J].计算机应用研究,2009,26(8):2948-2951. 被引量：3
5李世奇,赵铁军,陈晨,刘鹏远.基于ART网络的无指导中文共指消解方法[J].高技术通讯,2009,19(9):926-932.
6董国志,朱玉全,程显毅.中文人称代词指代消解的研究[J].计算机应用研究,2011,28(5):1774-1776. 被引量：8
7孔芳,周国栋.基于树核函数的中英文代词消解[J].软件学报,2012,23(5):1085-1099. 被引量：23
8高俊伟,孔芳,朱巧明,李培峰.基于SVM的中文名词短语指代消解研究[J].计算机科学,2012,39(10):231-234. 被引量：5
9高俊伟,孔芳,朱巧明,李培峰.语料对中文名词短语指代消解影响研究[J].中文信息学报,2013,27(3):61-68. 被引量：1
10周炫余,刘娟,卢笑.篇章中指代消解研究综述[J].武汉大学学报（理学版）,2014,60(1):24-36. 被引量：7

二级引证文献77

1李牧南,王良,赖华鹏.中文科技政策文本分类:增强的TextCNN视角[J].科技管理研究,2023,43(2):160-166. 被引量：3
2李建元,周脚根,关佶红,周水庚.谱图聚类算法研究进展[J].智能系统学报,2011,6(5):405-414. 被引量：12
3肖晶,梁冰,张晓丹,吕世炅.一种面向篇级数据的作者名消歧规则和算法[J].现代图书情报技术,2012(5):55-59. 被引量：10
4周炫余,刘娟,卢笑.篇章中指代消解研究综述[J].武汉大学学报（理学版）,2014,60(1):24-36. 被引量：7
5奚雪峰,周国栋.基于Deep Learning的代词指代消解[J].北京大学学报（自然科学版）,2014,50(1):100-110. 被引量：23
6张瑛,梁琳琳,侯敏,滕永林.话题型微博中的人称代词特征及消解策略[J].海南大学学报（人文社会科学版）,2014,32(2):119-126.
7江泳,产文,王金华,周向东,施伯乐.基于混合核方法的上下位语义抽取[J].计算机应用与软件,2014,31(4):45-47.
8吴玉环,曾国荪.基于指代冗余的矩阵编码文本水印算法[J].通信技术,2014,47(7):800-806.
9姚明海,王娜,李劲松.一种新的基于特征选择的虹膜识别方法[J].计算机技术与发展,2014,24(12):96-100.
10宋洋,王厚峰.共指消解研究方法综述[J].中文信息学报,2015,29(1):1-12. 被引量：9

1蔡福全,孙京诰.功能安全温度变送器的单元测试分析[J].化工自动化及仪表,2015,42(7):777-780 834. 被引量：2
2李元龙,周俊生,陈家骏.一种基于关联聚类的汉语共指消解方法[J].计算机科学,2007,34(12):216-218. 被引量：2
3赵阳,刘弘.协同设计中基于规则推理的冲突消解研究[J].计算机应用研究,2006,23(1):54-56. 被引量：5
4叶奇明.进程的DLL依赖关系分析[J].智能计算机与应用,2012,2(4):72-74.
5庞宁,苏尚宏,赖振丹.中文人称代词消解研究[J].太原科技大学学报,2008,29(3):179-181. 被引量：2
6龙飞宇,刘嘉勇,袁熹.一种变换PE文件引入表结构的软件水印[J].计算机应用,2010,30(1):217-219. 被引量：4
7钱伟,郭以昆,周雅倩,吴立德.基于最大熵模型的英文名词短语指代消解[J].计算机研究与发展,2003,40(9):1337-1343. 被引量：19
8金洪斌,申时凯,张志鸿.在VB中调用Word应用程序实现动态报表[J].电脑编程技巧与维护,2003(1):31-32.
9pixiebox.编程实现Ring0下恢复所有模块导出函数的inline hook驱动[J].黑客防线,2008(10):70-73.
10殷晓波,罗恩.一种松弛的优化均衡流式图划分算法研究[J].计算机科学,2016,43(4):231-234. 被引量：1

中文信息学报

2007年第2期

浏览历史

内容加载中请稍等...

一种基于图划分的无监督汉语指代消解算法被引量：19

参考文献15

二级参考文献14

共引文献83

同被引文献263

引证文献19

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

一种基于图划分的无监督汉语指代消解算法 被引量：19

参考文献15

二级参考文献14

共引文献83

同被引文献263

引证文献19

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

一种基于图划分的无监督汉语指代消解算法被引量：19