-
题名基于改进TextRank算法的中文文本摘要提取
被引量:24
- 1
-
-
作者
徐馨韬
柴小丽
谢彬
沈晨
王敬平
-
机构
中国电子科技集团公司第三十二研究所
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期273-277,共5页
-
基金
国家部委基金
-
文摘
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。
-
关键词
Doc2Vec模型
K-MEANS算法
TextRank算法
摘要提取
权重影响因子
-
Keywords
Doc2Vec model
K-means algorithm
TextRank algorithm
summarization extraction
weight influence factor
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于TF-IDF和互信息的推荐算法研究
被引量:4
- 2
-
-
作者
张云纯
-
机构
南京理工大学计算机科学与工程学院
-
出处
《计算机时代》
2019年第12期42-46,共5页
-
文摘
本文提出一种基于TF-IDF和互信息的方剂推荐算法。其核心思想是根据TF-IDF算法的原理,确定核心药物;再计算核心药物和方剂间的互信息来确定二者相关性,以此确定最有效的方剂。对名老中医治疗肺癌的542首方剂,共计342味药物进行数据挖掘,通过该算法获得核心药物71味,推荐方剂126首。采用该算法获得名老中医治疗肺癌的核心方剂的结果表明,该算法通用性强,效率高。由于不仅探索了药物层面的规律,还挖掘了方剂层面的信息,故该算法有较高的实用价值。
-
关键词
TF–IDF
有向含权网络
互信息
推荐算法
权重影响因子
-
Keywords
TF-IDF
directed weighted network
mutual-information
recommendation algorithm
weight factor
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-