期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于种子词汇的话题标签抽取研究 被引量:7
1
作者 寇宛秋 李芳 《中文信息学报》 CSCD 北大核心 2013年第5期114-121,143,共9页
传统话题模型用词项概率分布表示话题,在可解释性上存在很大的不足。该文在Latent Dirichlet Allocation(LDA)的结果上提出了一种基于种子词汇的话题标签抽取方法。首先根据提出的权重计算公式抽取每个话题的种子词,然后,采用bootstrapp... 传统话题模型用词项概率分布表示话题,在可解释性上存在很大的不足。该文在Latent Dirichlet Allocation(LDA)的结果上提出了一种基于种子词汇的话题标签抽取方法。首先根据提出的权重计算公式抽取每个话题的种子词,然后,采用bootstrapping思想,迭代产生包含种子词汇的关键短语集合,最后根据短语的完整性和泛化度选择话题标签。该文对两会报告话题和新闻事件话题进行实验,通过结果展示和人工评测,该方法抽取的话题标签能够较准确地表达话题的语义信息。 展开更多
关键词 话题标签 种子词抽取 bootstrapping算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部