-
题名基于核方法的中文实体关系抽取研究
被引量:18
- 1
-
-
作者
黄瑞红
孙乐
冯元勇
黄云平
-
机构
中国科学院软件研究所
-
出处
《中文信息学报》
CSCD
北大核心
2008年第5期102-108,共7页
-
基金
国家自然科学基金资助项目(6077302760736044)
国家863计划重点资助项目(2006AA010108)
-
文摘
命名实体关系抽取是信息抽取领域中的重要研究课题之一。该文探讨了核方法在中文关系抽取上的有效性问题,主要分为三部分:研究了在卷积树核中使用不同的语法树对关系抽取性能的影响;通过构造复合核检查了树核与平面核之间的互补效果;改进了最短路径依赖核,将核计算建立在原最短依赖路径的最长公共子序列上,以消除原始最短路径依赖核对依赖路径长度相同的过严要求。因为核方法开始被用于英文关系抽取时,F1值也只有40%左右,而我们在ACE2007标准语料集上的实验结果表明,只使用作用在语法树上的卷积核时,中文关系抽取的F1值达到了35%,可见卷积核方法对中文关系抽取也是有效的,同时实验也表明最短路径依赖核对中文关系抽取效果不明显。
-
关键词
计算机应用
中文信息处理
中文实体关系抽取
核方法
卷积树核
复合核
最短路径依赖核
-
Keywords
computer application
Chinese information processing
Chinese relation extraction
Kernel-based methods
convolution tree kernel
composite kernels
shortest path dependency kernel
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名几种图匹配的核方法研究
- 2
-
-
作者
张燕
-
机构
西安建筑科技大学信息与控制工程学院
-
出处
《电脑知识与技术》
2013年第3期1622-1625,1629,共5页
-
文摘
数据挖掘算法现面临挑战,这个挑战就是要处理日益增长的复杂对象。对于图数据,随机游走核是有力的容错图匹配方法。由于随机游走核的局部定义,它的适用性取决于潜在图表示的特性。另外通过定义图实例的核函数,数据挖掘算法的整个工具变得可用。迄今为止,已经提出了基于图的游走、子树和循环的图核。一般问题在于,这些核要么运算量大要么受限于他们的表达性。我们试着通过定义基于路径有表达性的图核克服这个问题。由于计算图的所有路径和最长路径是NP-难,我们建议基于最短路径图核。这些核在多项式时间内就可以计算,保持表现力并且仍然是正定的。
-
关键词
NP-难
图核
核方法
随机游走核
最短路径核
正定
-
Keywords
NP-hard
graph kernels
kernel methods
random walk kernel
shortest path graph kernel
positive definite
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-