-
题名面向专业文献知识实体类型的抽取和标注
被引量:5
- 1
-
-
作者
温雯
伍思杰
蔡瑞初
郝志峰
-
机构
广东工业大学计算机学院
佛山科学技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2018年第1期102-115,共14页
-
基金
国家自然科学基金(61202269)
博士点基金项目(20134420110010)
-
文摘
知识实体的类型标注是专业文献的结构化管理和知识脉络挖掘中的一个重要问题。然而,由于知识实体具有专业性强、类型多样等特点,传统的实体抽取方法并不能很好地实现知识实体的类型标注。为了解决这一问题,该文从数据中发现并总结出知识实体类型的独有特性,根据这些特性首先提出一种基于启发式规则的类型抽取方法、实现部分知识实体的类型标注,进而通过多标签加权的标签传播方法实现对所有知识实体的类型标注。与传统方法相比,该方法能够从数据中获得最有可能的类型标签,在无需人工标注的情况下获得有效的知识实体类型标注。实验结果表明,所提出方法具有较好的灵活性,更适用于专业文献知识实体的类型标注。
-
关键词
类型抽取
类型标注
知识实体
多标签加权
标签传播
-
Keywords
type extraction
type labelling
knowledge entityl multi-label weighting
label propagation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-