期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Web的专用爬虫的研究
1
作者 夏道勋 谢晓尧 《贵州师范大学学报(自然科学版)》 CAS 2009年第3期92-95,共4页
网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分... 网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分类器、提取器、爬虫的基本功能、数据存储及核心算法。 展开更多
关键词 专用爬虫 WEB内容挖掘 超文本分类器 提取器
下载PDF
微博社会网络重要用户节点筛选及舆情引导 被引量:10
2
作者 谢天保 张晓雯 仵凯博 《计算机科学》 CSCD 北大核心 2014年第S1期400-405,共6页
首先通过研究网络爬虫以及新浪微博的开放平台,设计实现新浪微博专用爬虫,获取研究数据。其次,通过实验得到重要用户节点指标,提出贝叶斯-PageRank算法筛选重要用户节点,并实验验证重要用户节点的有效性。最后通过对重要用户节点的监测... 首先通过研究网络爬虫以及新浪微博的开放平台,设计实现新浪微博专用爬虫,获取研究数据。其次,通过实验得到重要用户节点指标,提出贝叶斯-PageRank算法筛选重要用户节点,并实验验证重要用户节点的有效性。最后通过对重要用户节点的监测实现网络舆情发现并给出相关舆情引导策略。 展开更多
关键词 微博社会网络 专用网络爬虫 重要用户节点筛选 舆情引导
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部