-
题名基于小世界模型的复合关键词提取方法研究
被引量:14
- 1
-
-
作者
马力
焦李成
白琳
周雅夫
董洛兵
-
机构
西安电子科技大学智能信息处理研究所
西安邮电学院信息中心
西安电子科技大学图书馆
-
出处
《中文信息学报》
CSCD
北大核心
2009年第3期121-128,共8页
-
基金
国家自然科学基金资助项目(60803162)
陕西省自然科学基金资助项目(SJ08-ZT15)
陕西省教育厅科研计划资助项目(08JK245)
-
文摘
该文提出了一种新的基于小世界网络特性的关键词提取算法。首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络。引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集。利用侯选关键词集词语位置关系和汉语词性搭配关系,提取出复合关键词。实验结果表明该方法是可行和有效的,获取复合关键词比一般关键词所表达的含义更便于人们对文本的理解。
-
关键词
计算机应用
中文信息处理
小世界网络
词语网络
平均最短路径变化量
聚类系数变化量
复合关键词
-
Keywords
computer application
Chinese information processing
small world network
term network graph
average shortest path length increment
average clustering coefficient increment
compound keywords
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于SWN理论的关键字抽取策略
- 2
-
-
作者
赵峰
-
机构
同济大学电子与信息工程学院
-
出处
《科技传播》
2011年第24期227-227,170,共2页
-
文摘
本文在基于文本挖掘中的共现分析理论上,结合SWN理论及算法,借助图的平均最短路径变化量和簇系数变化量,计算分词在信息中的重要性,以确定文本关键字。
-
关键词
抽取
分词
SWN
共现分析
平均最短路径变化量
簇系数变化量
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-