期刊文献+

Web聊天室探测系统的网页获取和改进研究

Web Access and Improvement Study on Detection System of the Web Chat Rooms
下载PDF
导出
摘要 网络聊天以它低成本,高效率的优势给网络用户提供了在线实时通信的功能,从而成为目前互联网使用最广泛的网络服务。以网络聊天室的探测为载体深入研究网页获取和预处理的技术问题。主要探讨网络爬虫的原理和工作流程,在网络爬虫器中引入网络并行多线程处理技术。讨论WebLech的技术特点和实现技术,对WebLech做出了改进。 Web chat with its low-cost,high-efficiency advantages of online real-time communication capabilities,thus becoming the most widely used Internet network services to network users.Detection of Internet chat rooms as a carrier-depth study of Web access to technical problems and the pretreatment.Of the principles and workflow of the web crawler,Web crawler in the introduction of network parallel multi-threading technology.Discuss the technical features of the WebLech and implementation technology,improvements made WebLech.
作者 孙群 漆正东
出处 《计算机光盘软件与应用》 2012年第3期184-184,187,共2页 Computer CD Software and Application
关键词 网络爬虫 网络并行处理 搜索策略 网页结构挖掘 Web crawler Network parallel processing Search strategy Web structuremining
  • 相关文献

参考文献1

二级参考文献5

  • 1Brin S, Page L. The anatomy of a large-scale hypertextual Web search engine[A]. Proceedings of the 7th International World Wide Web Conference[C]. Australia:[s. n. ],1998.
  • 2Kleinberg J. Authoritative sources in a hyperlinked environment[J]. Journal of ACM (JASM), 1999.
  • 3Chakrabarti S, Dom B, Gibson D. Automatic resource compilation by analyzing hyperlink structure and associated text[EB/OL]. http://decweb-ethz-ch/WWW7/1898/com 1898.html, 1998.
  • 4Lempel P, Moran S. The stochastic approach for link-structure analysis(SALSA) and the TKC effect[EB/OL], http://www9. org/w9cdrom/175/175.html, 2000.
  • 5Chen D, Chang H. Learning to probabilistically identify authoritative documents [EB/OL]. http ://www. cse- rosy. edv/-cse960/Papers/Link Analysis/phits. pdf, 2000.

共引文献17

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部