期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于主题的Web文本聚类算法 被引量:1
1
作者 袁晓峰 《成都大学学报(自然科学版)》 2010年第3期249-252,共4页
设计了一种基于主题的Web文本聚类方法(HTBC):首先根据文本的标题和正文提取文本的主题词向量,然后通过训练文本集生成词聚类,并将每个主题词向量归类到其应属的词类,再将同属于一个词类的主题词向量对应的文本归并到用对应词类的名字... 设计了一种基于主题的Web文本聚类方法(HTBC):首先根据文本的标题和正文提取文本的主题词向量,然后通过训练文本集生成词聚类,并将每个主题词向量归类到其应属的词类,再将同属于一个词类的主题词向量对应的文本归并到用对应词类的名字代表的类,从而达到聚类的目的.算法分四个步骤:预处理、建立主题向量、生成词聚类和主题聚类.同时,对HTBC与STC、AHC、KMC算法从聚类的准确率和召回率上做了比较,实验结果表明,HTBC算法的准确率较STC、AHC和KMC算法要好. 展开更多
关键词 htbc算法 WEB文本聚类 主题 搜索引擎 互信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部