MD5算法在消除重复网页算法中的应用被引量：5

The Application of MD5 to Remove the Repeated Pages

下载PDF

导出

摘要 Internet用户通过常用搜索引擎获取Web信息时,往往得到了大量的重复网页信息,从而导致搜索效率不高。本文利用MD5算法成熟及可移植性好的特点,提出了一种基于MD5的消除重复网页的算法,实验证明该算法能有效的去除重复网页,时间和空间的复杂度不高,具有较强的实用价值。 The Searching Engines often return massive repeated pages information to Intemet users and result in low searching efficiency. Considering the mature and portability of MD5, an algorithm based on MD5 is proposed to remove the repeated pages. The experiment indicates this algorithm is effective＇and its complexity of time and space is not high. It is showed that the study is practicable and valid.

作者彭曙蓉章兢杨文忠

机构地区长沙理工大学电气与信息工程学院湖南大学电气与信息工程学院

出处《电脑知识与技术》 2005年第10期15-16,共2页 Computer Knowledge and Technology

基金教育部重点项目(教技司2001224)

关键词搜索引擎重复网页 MD5 Searching Engines Repeated Pages MD5

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献29

1姚新波,马治坤.基于特征串的网页去重算法[J].科技信息,2008(28). 被引量：3
2王哲.基于特征码的网页去重算法研究[J].山东电大学报,2009(1):14-16. 被引量：4
3陈淳鑫,阎光.MD5算法在B/S结构下口令验证中的应用[J].微型机与应用,2005,24(2):7-9. 被引量：6
4李丹,龙毅宏.MD5算法破解对实际应用的影响[J].信息安全与通信保密,2005,27(4):91-91. 被引量：15
5李霞.MD5加密算法浅析及应用[J].运城学院学报,2005,23(5):56-57. 被引量：12
6高凯,王永成,肖君.网页去重策略[J].上海交通大学学报,2006,40(5):775-777. 被引量：13
7王娜.博客搜索引擎与传统搜索引擎的比较研究[J].图书情报工作,2006,50(7):54-57. 被引量：11
8刘艳敏,刘飚,封化民,宋国森,方勇.Web页面主题信息抽取研究与实现[J].计算机工程与应用,2006,42(21):146-148. 被引量：11
9向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50. 被引量：27
10[3][美]维辛格(Weissinger A)著.冯延晖,等译.ASP技术手册[M].北京:中国电力出版社,2001.

引证文献5

1廖思周.MD5算法防穷举(冲撞)破译的设计及其实现[J].五邑大学学报（自然科学版）,2006,20(4):33-37. 被引量：1
2彭曙蓉,王耀南.针对小文本的Web数据挖掘技术及其应用[J].微计算机信息,2006,22(07X):203-205. 被引量：10
3潘冰,徐亮亮.中文博客搜索引擎研究[J].计算机工程与设计,2010,31(8):1718-1721. 被引量：3
4张小娣,宋余庆.基于网页正文逻辑段落和长句提取的网页去重算法[J].图书情报研究,2012,5(2):41-45. 被引量：1
5么丽颖.MD5算法的分析和改进[J].哈尔滨师范大学自然科学学报,2011,27(5):34-37. 被引量：5

二级引证文献20

1谢冬松,李岩.基于WEB的智能搜索应用技术探讨[J].中国科技信息,2007(4):130-131.
2李士勇,梁家荣,唐志刚.基于危险理论的web文本挖掘研究[J].微计算机信息,2007,23(30):170-171. 被引量：4
3倪现君.结构挖掘中web有向图模型的改进算法[J].微计算机信息,2007,23(36):163-165. 被引量：5
4吕爽,陈高云,吴晓,王鹏.基于主从模式的并行决策树算法研究[J].西南民族大学学报（自然科学版）,2007,33(4):743-745. 被引量：1
5洪军,倪宏,邓浩江,严勤.一种基于Web挖掘的音乐流派分类方法[J].微计算机信息,2009,25(27):168-169.
6廖莎莎.基于MD5与RSA算法的数字认证研究与实现[J].黄山学院学报,2010,12(5):80-82.
7刘兆伟,黄永峰.面向主题搜索引擎的实现与优化[J].数据通信,2011(4):29-32.
8崔琳,汪材印.基于语义Web的Blog智能检索系统研究[J].长江大学学报（自然科学版）,2011,8(10):77-79. 被引量：2
9毛太田,邹凯,毛静,周军.基于模糊集的Web文本最大支撑树聚类算法[J].现代情报,2011,31(11):21-25.
10刘璇,许洁萍,陈捷.以Web标签为基础的相似歌曲研究[J].山东大学学报（理学版）,2012,47(5):53-58.

1王华志.网络信息检索中常用搜索引擎的使用[J].内蒙古科技与经济,2013(9):82-83.
2猛犸.误判容易,过滤很难[J].新世纪周刊,2009(18):106-106.
3谭敏清.国外常用搜索引擎[J].湖北商检科技,1999(3):25-29.
4张国喜.Internet检索工具的使用研究[J].津图学刊,2004(1):37-41.
5孙掌印.搜索引擎Yahoo与Google的比较分析[J].科技情报开发与经济,2011,21(17):160-162.
6周靖.浅介几种常用搜索引擎的选择比较[J].办公自动化（综合月刊）,2008(8):47-48.
7韩娜,沈西挺,刘岩.基于用户兴趣的个性化搜索系统研究[J].软件导刊,2010,9(1):38-39. 被引量：2
8李伶思,赵兴,刘孟.常用搜索引擎的局限性与改进策略——基于百度与google对比的视角[J].赤峰学院学报（自然科学版）,2014,30(7):54-55.
9谌新华.网络信息资源常用搜索引擎[J].现代情报,2003,23(7):62-63. 被引量：7
10崔凌洁.高职学生常用搜索引擎Google评议[J].科技信息,2011(24):211-211.

电脑知识与技术

2005年第10期

浏览历史

内容加载中请稍等...

MD5算法在消除重复网页算法中的应用被引量：5

同被引文献29

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

MD5算法在消除重复网页算法中的应用 被引量：5

同被引文献29

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

MD5算法在消除重复网页算法中的应用被引量：5