期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种面向隐含主题的上下文树核
1
作者 徐超 周一民 沈磊 《电子与信息学报》 EI CSCD 北大核心 2010年第11期2695-2700,共6页
该文针对上下文树核用于文本表示时缺乏语义信息的问题,提出了一种面向隐含主题的上下文树核构造方法。首先采用隐含狄利克雷分配将文本中的词语映射到隐含主题空间,然后以隐含主题为单位建立上下文树模型,最后利用模型间的互信息构造... 该文针对上下文树核用于文本表示时缺乏语义信息的问题,提出了一种面向隐含主题的上下文树核构造方法。首先采用隐含狄利克雷分配将文本中的词语映射到隐含主题空间,然后以隐含主题为单位建立上下文树模型,最后利用模型间的互信息构造上下文树核。该方法以词的语义类别来定义文本的生成模型,解决了基于词的文本建模时所遇到的统计数据的稀疏性问题。在文本数据集上的聚类实验结果表明,文中提出的上下文树核能够更好地度量文本间主题的相似性,提高了文本聚类的性能。 展开更多
关键词 文本聚类 上下文树核 统计语言模型 隐含狄利克雷分配(LDA)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部