期刊文献+

一种基于谱聚类的共指消解方法 被引量:5

A Spectral Clustering Based Coreference Resolution Method
下载PDF
导出
摘要 该文针对中文共指消解的具体任务,提出采用谱聚类的方法进行共指消解。首先,在待消解项对上抽取特征,使用最大熵模型判断两个待消解项存在共指关系的概率;然后,以此概率值作为相似度进行谱聚类;最后,得到若干实体,实现共指消解。该方法能从全局的角度进行实体划分,有效地提高准确率。在ACE 2007标准数据集上的Diagnostic实验结果表明该方法的ACE Value比baseline方法有了2.5%的提高,Unweighted Precision值有5.4%的提高。 This paper presents a novel method to implement coreference resolution. This method is based on spectral clustering. A maximum entropy model is first used to get the coreference probability of mention pairs with extracted features. The probabilities of mention pairs are then used to construct the similarity matrix for spectral clustering. Entities are generated according to the clustering cuts. This method can divide entities with a global view, which effectively improves precision. Experiments on ACE 2007 dataset show that the ACE Value of this method is 2.5% higher than that of baseline on Diagnostic task, and 5.4% higher in Unweighted Precision.
出处 《中文信息学报》 CSCD 北大核心 2009年第3期10-16,共7页 Journal of Chinese Information Processing
基金 国家自然科学基金资助项目(60503070) 技术发展高校资助项目(GH0742002)
关键词 计算机应用 中文信息处理 共指消解 谱聚类 最大熵模型 computer application Chinese information processing coreference resolution spectral clustering maximum entropy model
  • 相关文献

参考文献13

  • 1王厚峰.指代消解的基本方法和实现技术[J].中文信息学报,2002,16(6):9-17. 被引量:46
  • 2钱伟,郭以昆,周雅倩,吴立德.基于最大熵模型的英文名词短语指代消解[J].计算机研究与发展,2003,40(9):1337-1343. 被引量:19
  • 3庞宁,杨尔弘.基于最大熵模型的共指消解研究[J].中文信息学报,2008,22(2):24-27. 被引量:4
  • 4周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量:19
  • 5Yaqian Zhou, Changning Huang, Jianfeng Gao, et al. Transformation Based Chinese Entity Detection and Tracking[C]//IJCNLP, 2005: 232-237.
  • 6Wee Meng Soon, Hwee Tou Ng, Daniel Chung Yong Lim. A machine learning approach to eoreference resolution of noun phrases[J]. Computational Linguist, 2001, 27(4): 521-544.
  • 7Vincent Ng and Claire Cardie. Improving machine learning approaches to coreference resolution[C]// ACL, 2002: 104-111.
  • 8Florian, R., Hassan, H., Ittycheriah, A., et al. A statistical model for multilingual entity detection and tracking[C]//NAACL/HLT, 2004: 1-8.
  • 9Luo X, Ittycheriah A, Jing H, et al. A mention- synchronous coreference resolution algorithm based on the bell tree[C]//Proc of ACL, 2004: 135-142.
  • 10Aron Culotta, Michael Wick, Andrew McCallum, First-Order Probabilistic Models for Coreference Resolution[C]//NAACL/HLT, 2007: 81-88.

二级参考文献67

  • 1秦洪武.第三人称代词在深层回指中的应用分析[J].当代语言学,2001,3(1):55-64. 被引量:34
  • 2王厚峰,梅铮.鲁棒性的汉语人称代词消解[J].软件学报,2005,16(5):700-707. 被引量:36
  • 3李国臣,罗云飞.采用优先选择策略的中文人称代词的指代消解[J].中文信息学报,2005,19(4):24-30. 被引量:33
  • 4马彦华 黄昌宁 等.汉语中人称代词指代问题研究.1998年中文信息处理国际会议论文集[M].北京,1998..
  • 5郭志立.人称代词指代主体的辨析及其在摘要提取中的应用.1998年中文信息处理国际会议会论文集[M].北京清华大学出版社,1998.310-315.
  • 6陈凯江 刘秉伟 黄萱菁 等.基于隐马尔可夫模型的实体名识别[A]..见:863计划智能计算机主题学术会议论文集[C].北京:清华大学出版社,2001.443~453.
  • 7N A Chinichor. Overview of MUC-7/MET-2. In: Proc of the 7th Message Understanding Cord (MUC-7). San Francisco: Morgan Kaufmann Publishers, 1998.
  • 8C Cardie, K Wagstaff. Noun phrase coreference as clustering. In:Proc of the Joint Cod on Empirical Methods in NLP and Very Large Corpora. Maryland: University of Maryland, USA, 1999.82~ 89.
  • 9W M Soon, H T Ng, C Y Lim. Corpus-based learning for noun phrase oonference resolution. In: Proc of the Joint Conf on Empirical Methods in NLP and Very Large Corpora. Maryland: University of Maryland, USA, 1999. 285~291.
  • 10R Mitkov. Anaphora resolution: The state of the art. Proc of the COLING'98/ACL'98, Wolverhampton, 1999.

共引文献98

同被引文献179

引证文献5

二级引证文献31

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部