期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于远程学习的关键词提取技术研究 被引量:1
1
作者 曹聪慧 兰强 +1 位作者 侯群 漆为民 《电脑与电信》 2021年第8期1-5,9,共6页
伴随着互联网技术的发展,文本数量的爆发式增长带来了处理文本数据的一些困扰,传统的文本聚类以及关键词提取的技术不能很好解决对大数据进行精准筛选的需求。对此,提出利用基于LDA算法的潜在语义模型来对文本进行文本聚类,得到了对文... 伴随着互联网技术的发展,文本数量的爆发式增长带来了处理文本数据的一些困扰,传统的文本聚类以及关键词提取的技术不能很好解决对大数据进行精准筛选的需求。对此,提出利用基于LDA算法的潜在语义模型来对文本进行文本聚类,得到了对文本进行聚类的结果和LDA提取出来的主题词语;然后利用FP-growth算法对LDA算法的结果进行分析,对文本进行挖掘,得到中文关键词集;借助网络知识库的思想,利用百度百科提出了汉语比对算法对中文关键词集进行筛选,过滤掉了很多噪声词。实验表明,本文的方法可以很好地对给定的中文语料文本进行文本聚类和关键词提取,特别是在增加了基于百度百科远程学习的筛选之后,系统的准确率有大幅度的提高。 展开更多
关键词 文本聚类 关键词提取 LDA算法 远程学习 汉语比对算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部