期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一个基于现实世界的大型Web参照数据集——UK2006 Datasets的初步研究
1
作者 曾刚 李宏 《企业技术开发》 2009年第5期16-17,31,共3页
文章介绍了WEBSPAM-UK2006数据集,一个大型的基于现实世界的,人工评判过一些垃圾行为的web数据集合,详细的对数据集的构成进行了分析,对数据集采用Python进行了初步的预处理,为以后在反垃圾网页行为方面的算法和判定研究提供了非常有意... 文章介绍了WEBSPAM-UK2006数据集,一个大型的基于现实世界的,人工评判过一些垃圾行为的web数据集合,详细的对数据集的构成进行了分析,对数据集采用Python进行了初步的预处理,为以后在反垃圾网页行为方面的算法和判定研究提供了非常有意的经验和参考。 展开更多
关键词 搜索引擎作弊 web数据集 链接分析 web
下载PDF
Research on A Web Intelligent Information Extraction Method
2
作者 Zhimin Wang 《International Journal of Technology Management》 2013年第2期94-96,共3页
The paper introduce segmentation ideas in the pretreatment process of web page. By page segmentation technique to extract the accurate information in the extract region, the region was processed to extract according t... The paper introduce segmentation ideas in the pretreatment process of web page. By page segmentation technique to extract the accurate information in the extract region, the region was processed to extract according to the rules of ontology extraction, and ultimately get the information you need. Through experiments on two real datasets and compare with related work, experimental results show that this method can achieve good extraction results. 展开更多
关键词 pages segmentation ONTOLOGY extraction rules accuracy information extraction
下载PDF
社会网络分析方法在图情领域合著关系的实证研究 被引量:23
3
作者 荣先乾 覃桃 《图书馆界》 2010年第1期1-5,共5页
本文首先构建了图情领域的作者合著网络,并将该网络与国外其他学科的合著网络进行比较分析,发现目前图情领域的合著交流并不充分,提出需要进一步加强交流与合作。随后,构建了图情领域核心作者的合著网络和web合著网络,并对两个网络进行... 本文首先构建了图情领域的作者合著网络,并将该网络与国外其他学科的合著网络进行比较分析,发现目前图情领域的合著交流并不充分,提出需要进一步加强交流与合作。随后,构建了图情领域核心作者的合著网络和web合著网络,并对两个网络进行了简单的比较分析,指出可以通过使用web合著网络近似模拟学术合著网络进行社会网络分析,解决web合著中的文献重复消岐和作者重名消岐问题。 展开更多
关键词 社会网络分析 图书馆学 情报学 合著关系 web数据集
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部