期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
EntropyRank:基于主题熵的关键短语提取算法 被引量:1
1
作者 尹红 陈雁 李平 《中文信息学报》 CSCD 北大核心 2019年第11期107-114,共8页
关键短语提取是自然语言处理领域的一个重要子任务,其目的是自动识别出文本中的重要短语,现有方法主要强调词语间相关关系和词语自身影响力会影响关键短语提取效果。考虑到关键短语应准确地表示文档主题这一特点,该文提出一种基于主题... 关键短语提取是自然语言处理领域的一个重要子任务,其目的是自动识别出文本中的重要短语,现有方法主要强调词语间相关关系和词语自身影响力会影响关键短语提取效果。考虑到关键短语应准确地表示文档主题这一特点,该文提出一种基于主题熵的关键短语提取算法。该算法利用隐含狄利克雷分布训练文档和词的主题分布,并结合两个主题分布来表示特定文档下的词主题分布,然后计算词主题分布的信息熵即主题熵来表示词语自身影响力,最后在词共现网络上使用随机游走方法计算每个候选短语的得分。在6个公开数据集上的实验结果表明,与现有的无监督关键短语提取算法相比,该算法在F1指标上能提高2.61%~6.98%。 展开更多
关键词 关键短语提取 随机游走 主题模型 词语影响力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部