-
题名一种基于图划分的无监督汉语指代消解算法
被引量:19
- 1
-
-
作者
周俊生
黄书剑
陈家骏
曲维光
-
机构
南京大学计算机科学与技术系
南京师范大学计算机科学系
-
出处
《中文信息学报》
CSCD
北大核心
2007年第2期77-82,共6页
-
基金
国家863高技术研究发展计划资助项目(2006AA01Z143)
国家自然科学基金资助项目(60673043)
江苏省自然科学基金项目(BK2006117)
-
文摘
指代消解是自然语言处理领域中的一个重要问题。针对当前中文指代标注训练语料非常缺乏的现状,本文提出一种无监督聚类算法实现对名词短语的指代消解。引入图对名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并引入一个有效的模块函数实现对图的自动划分,使得指代消解过程并不是孤立地对每一对名词短语分别进行共指决策,而是充分考虑了多个待消解项之间的相关性,并且避免了阈值选择问题。通过在ACE中文语料上的人称代词消解和名词短语消解实验结果表明,该算法是一种有效可行的无监督指代消解算法。
-
关键词
人工智能
自然语言处理
聚类
指代消解
模块函数
-
Keywords
artificial intelligence
natural language processing
clustering
coreference resolution
modularity function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于关联聚类的汉语共指消解方法
被引量:2
- 2
-
-
作者
李元龙
周俊生
陈家骏
-
机构
南京大学计算机软件新技术国家重点实验室
南京大学计算机科学与技术系
-
出处
《计算机科学》
CSCD
北大核心
2007年第12期216-218,256,共4页
-
基金
国家自然科学基金项目(60673043)
国家863高技术研究发展计划(2006AA01Z143
2006AA01Z139)
-
文摘
指代消解是自然语言处理领域中的一个重要问题。本文引入图对汉语名词短语的指代消解问题进行建模,将指代消解问题转化为图划分问题,并应用关联聚类算法来实现对图的自动划分。相对于传统的link-first和link-best聚类机制,该方法并不是孤立地针对每一对名词短语分别进行共指决策,而是充分考虑了多个名词短语之间的相关性,且不需事先给出聚类的数量以及距离阈值。通过在ACE中文语料上名词短语消解的实验结果表明,该方法是一个有效的指代消解算法。
-
关键词
指代消解
共指
关联聚类
线性规划
-
Keywords
Reference resolution, coreference, correlation clustering, Linear programming
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于有监督关联聚类的中文共指消解
被引量:1
- 3
-
-
作者
刘未鹏
周俊生
黄书剑
陈家骏
-
机构
南京大学计算机软件新技术国家重点实验室
南京师范大学计算机科学系
-
出处
《计算机科学》
CSCD
北大核心
2009年第9期182-185,共4页
-
基金
国家自然科学基金项目(60673043)
国家社科基金(07BYY0)
江苏省高校自然科学基金(07KJB520057)资助
-
文摘
共指消解是文本信息处理中的一个重要问题。提出了一种有监督的关联聚类算法以实现对中文实体提及的共指消解。首先将共指消解过程看成图的关联聚类问题,从全局的角度实现对共指等价类的划分,而不是孤立地对每一对名词短语分别进行共指决策;然后给出了关联聚类的推导算法;最后设计了一种基于梯度下降的特征参数学习算法,使得训练出的特征参数能够较好拟合关联聚类的目标。在ACE中文语料上的实验结果显示,该算法优于传统的"分类-聚类"共指消解学习算法。
-
关键词
共指消解
关联聚类
损失函数
-
Keywords
coreference resolution,correlation clustering, loss function
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
X832
[环境科学与工程—环境工程]
-