期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于独立分量分析的隐蔽Web领域聚类 被引量:1
1
作者 王晓斌 温春 石昭祥 《计算机工程》 CAS CSCD 北大核心 2009年第7期175-176,179,共3页
针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过... 针对隐蔽Web主题领域自动识别问题,提出一种基于独立分量分析(ICA)的聚类算法。对查询页面进行页面文本抽取和预处理,利用TF-IDF公式计算权重并选择前N个权重最大的特征词构造文档矩阵,在使用潜在语义索引(LSI)进行特征重构的基础上通过ICA分解获得类别信息。利用LSI的词共现分析和文本降噪能力提高聚类准确率。实验表明聚类平均准确率达到90%以上。 展开更多
关键词 隐蔽web 潜在语义 独立分量分析 文本聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部