面向网络爬虫的网站优化策略探讨被引量：1

Discussion on Website Optimization Strategy for Web Crawler

下载PDF

导出

摘要作为网络技术发展的产物,网络爬虫能够根据自身逻辑借助网页链接来对网页中所存在的数据信息加以分类收集,并将收集到的信息以数据的形式存储在本地的存储介质中,利用这些爬取到的数据,就能够进行信息的收集与分类等用途,是如今网络信息的主要处理方式之一,也是当前网络搜索的一项核心技术。在网页搜索引擎的建设初期,引擎设计人员就要对网页的信息形式进行优化,提高网页的易用程度,并对网络爬虫进行一定程度的优化。 As a product of the development of network technology, web crawlers can classify and collect the data and information existing in web pages according to their own logic with the help of web page links, and store the collected information in the form of data in local storage media. Using these crawled data, they can collect and classify information, which is one of the main ways of processing network information today, it is also a core technology of current network search. In the early stage of the construction of web search engine, engine designers should optimize the information form of web pages, improve the ease of use of web pages, and optimize web crawlers to a certain extent.

作者黄燕妮 HUANG Yanni(Quanzhou Institute of Textile and Garment,Quanzhou Fujian 362700)

机构地区泉州纺织服装职业学院

出处《软件》 2022年第8期153-155,166,共4页 Software

关键词网络爬虫网站优化策略 web crawler a website optimization strategy

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1穆喆.用云指建站把网站优化到极致[J].计算机与网络,2018,44(18):49-49. 被引量：1
2侯建华.三大思路让网站优化文章写作锦上添花[J].计算机与网络,2017,43(18):45-45. 被引量：1
3黄媛.面向网络爬虫的企业网站优化策略[J].信息系统工程,2017,30(4):23-23. 被引量：2
4尹江,尹治本,黄洪.网络爬虫效率瓶颈的分析与解决方案[J].计算机应用,2008,28(5):1114-1116. 被引量：18

二级参考文献7

1苗长芬 ,冯伟华 .面向主题Crawler的设计与实现[J].平原大学学报,2005,22(3):110-112. 被引量：1
2李晓明,闫宏飞,王继民.搜索引擎-原理、技术与系统[M].北京:科学出版社,2004:1-5.
3黄河燕.基于增量反馈和自适应机制的主题爬虫系统的设计与实现[D].南京:南京理工大学,2005.
4BEHROUZ A F.TCP/IP Protocol Suite[M].2nd ed.谢希仁,译.北京:清华大学出版社,2003.
5刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2007,24(10):26-29. 被引量：132
6尹江,尹治本,黄洪.网络爬虫效率瓶颈的分析与解决方案[J].计算机应用,2008,28(5):1114-1116. 被引量：18
7张芳.面向网络爬虫的企业网站优化策略研究[J].开封教育学院学报,2015,35(5):286-287. 被引量：1

共引文献18

1李爱国,王月强.多线程Web图像搜索器的磁盘I/O缓冲方法[J].郑州大学学报（理学版）,2010,42(1):33-37.
2丁军平,蔡皖东.面向P2P特定信息的爬虫改进技术[J].计算机工程与应用,2011,47(29):23-26. 被引量：3
3黄超,李毅,麻荣宽,马建勋.网页漏洞挖掘系统设计[J].信息网络安全,2012(9):76-80. 被引量：2
4刘为民.基于ESB的企业内部公共信息搜索[J].计算机应用,2013,33(A02):128-129.
5杨济运,刘建勋,姜磊,彭桃,文一凭,卢厅.基于协程模型的分布式爬虫框架[J].计算技术与自动化,2014,33(3):126-133. 被引量：5
6杨洋,李晓风,赵赫,刘冰.基于网络爬虫的文献检索系统的研究和实现[J].计算机技术与发展,2014,24(11):35-38. 被引量：7
7严磊,丁宾,姚志敏,马勇男,郑涛.基于MD5去重树的网络爬虫的设计与优化[J].计算机应用与软件,2015,32(2):325-329. 被引量：10
8邓炳光,郭慧兰,张治中.移动互联网用户行为分析系统中聚焦爬虫的设计与实现[J].重庆邮电大学学报（自然科学版）,2015,27(3):359-365. 被引量：4
9陈富基,袁建,欧珠多吉,索朗卓玛.藏语文信息监测关键技术初探[J].西藏科技,2015(12):20-21.
10赵晓永,王磊.面向分布式网络爬虫的域名解析方法研究[J].北京信息科技大学学报（自然科学版）,2017,32(2):45-49. 被引量：2

同被引文献6

1李传科,肖自乾.基于Python的网页数据分析及可视化应用[J].信息记录材料,2021,22(9):203-205. 被引量：4
2李文骞.基于Python的微博网络舆情监控系统设计与实现[J].电脑编程技巧与维护,2021(12):49-51. 被引量：4
3张雁涔.基于Python的蔬菜销售系统设计[J].无线互联科技,2022,19(11):52-54. 被引量：1
4林丰.知识可视化在高中物理教学中的应用研究--以Excel作为知识可视化工具为例[J].中学物理,2022,40(19):62-65. 被引量：7
5刘秀丽.基于Python语言的好友管理系统的设计[J].现代信息科技,2022,6(15):6-10. 被引量：2
6王辛浩,单艳.探究Python语言下网络爬虫的技术特点及应用[J].数字技术与应用,2022,40(10):85-87. 被引量：9

引证文献1

1丁宣伊.基于Python的高校电信诈骗数据收集及可视化系统设计[J].电脑编程技巧与维护,2023(3):90-93. 被引量：1

二级引证文献1

1李琴,陈赣浪.基于3D数字孪生技术的通信网络可视化方法[J].长江信息通信,2024,37(6):152-154.

1房建玲.医院文书档案管理存在问题与质量提升策略研究[J].大众商务,2022(15):79-81.
2陈书泱.新技术集群环境下IP“影视化”开发的必然趋势[J].今传媒,2022,30(9):124-126.
3钱晋萍.希沃白板视域下的小学数学高效课堂策略[J].天津教育,2022(25):71-73. 被引量：4
4王路阳,张开扬.收编与驯化:电子游戏的大众化突围--以《英雄联盟》S11总决赛EDG夺冠事件为例[J].新闻文化建设,2022(16):21-23.
5朱骅,原芳.民族志文化翻译与赛珍珠的中国知识体系建构[J].江苏大学学报（社会科学版）,2022,24(5):105-114.
6倪文尖.海子《面朝大海,春暖花开》新说——b站讲课整理稿之一[J].现代中文学刊,2022(3):80-84.
7俞树毅,王睿.草原生态文明建设进路中“围栏困境”的破解[J].兰州大学学报（社会科学版）,2022,50(4):63-73. 被引量：6

软件

2022年第8期

浏览历史

内容加载中请稍等...

面向网络爬虫的网站优化策略探讨被引量：1

参考文献4

二级参考文献7

共引文献18

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向网络爬虫的网站优化策略探讨 被引量：1

参考文献4

二级参考文献7

共引文献18

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向网络爬虫的网站优化策略探讨被引量：1