期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于均衡段落和分话题向量的新闻热点话题检测研究 被引量:1
1
作者 魏家泽 董诚 +2 位作者 何彦青 刘志辉 彭柯芸 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第10期70-79,共10页
【目的】通过新闻热点话题检测技术提取热点新闻话题,减轻用户的新闻阅读压力。【方法】在TF-IDF方法基础上,通过均衡段落的位置加权方式(WTF-IDF)进行关键词提取;将K-means聚类作为基方法,在分层聚类中引入分话题向量完成话题聚类;提... 【目的】通过新闻热点话题检测技术提取热点新闻话题,减轻用户的新闻阅读压力。【方法】在TF-IDF方法基础上,通过均衡段落的位置加权方式(WTF-IDF)进行关键词提取;将K-means聚类作为基方法,在分层聚类中引入分话题向量完成话题聚类;提取标题高频词实现话题描述。【结果】WTF-IDF方法在关键词抽取数为3时与TF-IDF方法相比F1值提升5.4%;基于WTF-IDF与分话题向量的分层聚类与分层TF-IDF的K-means聚类相比准确提升3.1%。【局限】关键词抽取未考虑短语形式;分层聚类方法增加了算法时间复杂度。【结论】本文提出的关键词抽取和分层聚类方法可以改善新闻热点话题检测效果,话题描述得到的话题短语也达到一定的代表性与可读性。 展开更多
关键词 均衡段落 分话题向量 热点话题检测 层聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部