期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于多粒度树模型的Web站点描述及挖掘算法 被引量:5
1
作者 田永鸿 黄铁军 高文 《软件学报》 EI CSCD 北大核心 2004年第9期1393-1404,共12页
随着Web 所拥有的信息量和信息种类的急剧增长,Web 站点挖掘对于自动实现特定主题的 Web 资源发现和分类具有重要的意义.然而现有的 Web 站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入... 随着Web 所拥有的信息量和信息种类的急剧增长,Web 站点挖掘对于自动实现特定主题的 Web 资源发现和分类具有重要的意义.然而现有的 Web 站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入研究.从站点的采样尺寸、分析粒度和描述结构 3 个方面分析了设计高效的 Web 站点挖掘算法所需要解决的问题.在此基础上,提出了一种新的 Web 站点多粒度树描述模型,并描述了包括基于隐 Markov 树的两阶段分类算法、粒度间上下文融合算法、两阶段去噪程序以及基于熵的动态剪枝策略在内的多粒度 Web 站点挖掘算法.站点的多粒度描述方法及挖掘算法为多站点查询优化、Web 效用挖掘等的深入研究奠定了基础.实验表明,该算法相对于基线系统平均可以提高 16%的分类准确率,并减少了 34.5%的处理时间. 展开更多
关键词 算法 web站点挖掘 多粒度站点 上下文模型 隐MARKOV树 多粒度分类 基于熵的剪枝
下载PDF
大型Web站点逻辑域挖掘算法
2
作者 郑皎凌 《计算机工程》 CAS CSCD 北大核心 2008年第9期101-102,105,共3页
通过进一步发展Wen-SyanLi等人提出的Web站点逻辑域理论,该文提出Web站点逻辑域核模型及建立在其上的逻辑域挖掘算法。该算法通过对Web站点超链接的图结构进行运算,得到Web站点逻辑域。与Wen-SyanLi算法对比测试,结果表明在获得相同逻... 通过进一步发展Wen-SyanLi等人提出的Web站点逻辑域理论,该文提出Web站点逻辑域核模型及建立在其上的逻辑域挖掘算法。该算法通过对Web站点超链接的图结构进行运算,得到Web站点逻辑域。与Wen-SyanLi算法对比测试,结果表明在获得相同逻辑域个数的情况下,克服了其采用启发式方法所带来的效率问题。在对4个大型Web站点的单独测试中,平均能够达到85%的逻辑域挖掘精度。 展开更多
关键词 web站点结构挖掘 逻辑域 逻辑域核
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部