期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于向量空间的网页内容相似度计算方法研究 被引量:4
1
作者 何忠秀 王霜 安礼成 《计算机与现代化》 2010年第9期53-55,58,共4页
针对海量网页数据挖掘问题,提出基于向量空间的网页内容相似计算算法和软件系统框架。利用搜索引擎从海量网页中提取中文编码的网页URL,在此基础上提取网页的中文字符并分析提取出中文实词,建立向量空间模型计算网页内容间的相似度。该... 针对海量网页数据挖掘问题,提出基于向量空间的网页内容相似计算算法和软件系统框架。利用搜索引擎从海量网页中提取中文编码的网页URL,在此基础上提取网页的中文字符并分析提取出中文实词,建立向量空间模型计算网页内容间的相似度。该系统缩小了需要进行相似度计算的网页文档范围,节约大量时间和空间资源,为网络信息的分类、查询、智能化等奠定了良好的基础。 展开更多
关键词 向量空间 网页内容相似度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部