-
题名特征驱动的关键词提取算法综述
被引量:36
- 1
-
-
作者
常耀成
张宇翔
王红
万怀宇
肖春景
-
机构
中国民航大学计算机科学与技术学院
北京交通大学计算机与信息技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2018年第7期2046-2070,共25页
-
基金
国家自然科学基金(U1533104
U1633110
+1 种基金
61603028)
中央高校基本科研业务费(ZXH2012P009)~~
-
文摘
面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结果目前还远未取得令人满意的效果.为了促进关键词提取问题的解决,对近年来国内、外学者在该研究领域取得的成果进行了系统总结,具体包括候选关键词生成、特征工程和关键词提取3个主要步骤,并对未来可能的研究方向进行了探讨和展望.不同于围绕提取方法进行总结的综述文献,主要围绕着各种方法使用的特征信息归纳总结现有成果,这种从特征驱动的视角考察现有研究成果的方式有助于综合利用现有特征或提出新特征,进而提出更有效的关键词提取方法.
-
关键词
关键词提取
候选关键词生成
特征
有监督方法
图方法
-
Keywords
keyphrase extraction
candidate keyphrase generation
feature
supervised approach
graph-based approach
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-