检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于URL结构和访问时间的Web页面访问相似性度量被引量：4: 1; 作者李超锋卢炎生《计算机科学》 CSCD 北大核心 2007年第4期207-209,286,共4页; Web页面相似性是Web页面聚类和Web会话聚类的基础,其准确性直接影响聚类的质量。本文在分析基于URL结构的静态Web页面相似性度量的基础上,提出了将URL结构和页面访问时间结合起来度量Web页面对之间的相似性并给出了度量标准。实验证明,... 展开更多; 关键词 Web页面相似性聚类 url结构访问时间; 下载PDF 职称材料

基于动态评价URL链接结构的主题爬行策略: 2; 作者郑凯《福建电脑》 2010年第2期83-84,96,共3页; 在深入分析了HTML页面的超链结构的基础上,加入了锚文本内容分析权重和动态评价策略,提出了算法的改进,形成了综合动态价值的URL链接结构的搜索策略。改进的算法根据链接类型的不同赋予了不同的权重因子,并结合了动态价值评价穿越"... 展开更多; 关键词主题搜索引擎 url链接结构主题爬虫; 下载PDF 职称材料

基于语义相关度主题爬虫的语料采集方法被引量：6: 3; 作者周昆王钊于碧辉《计算机系统应用》 2019年第5期190-195,共6页; 针对特定领域语料采集任务,设计了基于语义相关度主题爬虫的语料采集方法.根据选定的主题词,利用页面描述信息,基于维基百科中文语料训练出的词分布式表示综合HowNet计算页面信息相关度,结合URL的结构信息预测未访问URL链指的页面内容... 展开更多; 关键词生语料采集语义相关度主题爬虫页面信息相关度 url结构信息; 下载PDF 职称材料

可动态自适应主题爬虫的研究被引量：1: 4; 作者肖新凤余伟 +3 位作者李石君陈亚辉刘倍雄刘永明《计算机与数字工程》 2019年第5期1151-1159,共9页; 针对传统的主题爬虫在面对动态变化的互联网时存在着主题知识涵盖不全、领域知识更新以及主题资源中心转移等问题。论文提出了一种可动态自适应互联网信息的主题爬虫。其中,可动态选择种子URL的TopicHub算法,相比于传统的静态种子URL的... 展开更多; 关键词主题爬虫动态自适应 url图结构; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部