期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于Heritrix的主题爬虫在互联网舆情系统中应用 被引量:5
1
作者 肖江 季节 《电子设计工程》 2015年第6期30-32,共3页
在信息化爆炸的时代,一般搜索引擎的搜索结果已经满足不了人们的需要,能获得更准确全面信息的垂直搜索引擎越来越受到关注。其中,主题爬虫作为垂直搜索引擎的核心部分一直是搜索方向的研究热点。本文以开源的网络爬虫Heritrix为基础,分... 在信息化爆炸的时代,一般搜索引擎的搜索结果已经满足不了人们的需要,能获得更准确全面信息的垂直搜索引擎越来越受到关注。其中,主题爬虫作为垂直搜索引擎的核心部分一直是搜索方向的研究热点。本文以开源的网络爬虫Heritrix为基础,分析其结构特征与工作原理并引入了多线程处理的改进办法,设计出一个主题爬虫,在单机环境下进行该爬虫性能的测试。实验结果表明该主题爬虫的查全率达到较高水准,为进一步研究开发搜索效率高的垂直搜索引擎打下坚实的基础。 展开更多
关键词 舆情系统 主题爬虫 HERITRIX 多线程
下载PDF
基于主题的网络舆情分析模型及其实现 被引量:72
2
作者 钱爱兵 《现代图书情报技术》 CSSCI 北大核心 2008年第4期49-55,共7页
网络舆情分析是信息处理领域内的一个新兴且有实用价值的方向。分析网络舆情分析的基本问题,提出难点以及相关的解决方案,并在此基础上设计基于主题的网络舆情分析模型。
关键词 主题信息采集 网络舆情 舆情分析
下载PDF
基于知识库和主题爬虫的南海舆情实时监测研究 被引量:10
3
作者 丁晟春 龚思兰 +1 位作者 周文杰 王曰芬 《情报杂志》 CSSCI 北大核心 2016年第5期32-37,共6页
[目的/意义]为满足对网络舆情的系统研究需求,需要将领域知识库作为重要支撑应用于相关研究中。[方法/过程]首先,研究针对南海问题构建多语种南海舆情监测基本本体,基于该本体实现主题爬虫对舆情信息的采集;接着,基于优化的行块分布正... [目的/意义]为满足对网络舆情的系统研究需求,需要将领域知识库作为重要支撑应用于相关研究中。[方法/过程]首先,研究针对南海问题构建多语种南海舆情监测基本本体,基于该本体实现主题爬虫对舆情信息的采集;接着,基于优化的行块分布正文提取算法实现对舆情信息的正文抽取,获取关键字和摘要;最后,利用HTML5对舆情信息分析结果进行可视化展示。[结果/结论]用户可根据具体需求利用构建的舆情监测系统对舆情信息实现系统的采集、处理和分析。 展开更多
关键词 领域知识库 主题爬虫 网络舆情监测 南海问题
下载PDF
网络舆情监控系统中主题网络爬虫的研究与实现 被引量:6
4
作者 方星星 鲁磊纪 徐洋 《舰船电子工程》 2014年第9期104-107,共4页
在分析比较通用网络爬虫和主题网络爬虫的定义和处理流程基础上,结合主题网络爬虫的功能,提出了网络舆情监控系统中主题网络爬虫的设计模块。针对主题爬虫要实现的目标,分别研究了系统所要实现的关键算法。基于主题爬虫的舆情监控系统... 在分析比较通用网络爬虫和主题网络爬虫的定义和处理流程基础上,结合主题网络爬虫的功能,提出了网络舆情监控系统中主题网络爬虫的设计模块。针对主题爬虫要实现的目标,分别研究了系统所要实现的关键算法。基于主题爬虫的舆情监控系统能满足面向特定领域的信息采集及监测需求,具有较强的实用价值。 展开更多
关键词 网络舆情监控系统 主题网络爬虫 信息采集
下载PDF
基于文本相关性的高校网络舆情监控系统的设计与实现 被引量:5
5
作者 刘丽员 杨昔阳 《泉州师范学院学报》 2016年第2期50-54,共5页
随着互联网的发展,高校大学生通过网络对各个热点问题发表意见和评论,一些负面的舆情信息会对高校造成巨大危害.为了实现校园网的公共安全,利用聚焦网络爬虫技术和聚类技术设计实现了一个基于文本相关性的高校网络舆情监控系统.根据高... 随着互联网的发展,高校大学生通过网络对各个热点问题发表意见和评论,一些负面的舆情信息会对高校造成巨大危害.为了实现校园网的公共安全,利用聚焦网络爬虫技术和聚类技术设计实现了一个基于文本相关性的高校网络舆情监控系统.根据高校网络舆情的特点,对聚焦爬虫和聚类算法进行一些改进,以提高热点话题发现的效率和精确度,从而有效增强对大学生网络舆情的监控. 展开更多
关键词 聚焦网络爬虫 聚类 文本相关性 舆情信息 话题发现
下载PDF
BBS舆情系统爬虫模块的研究 被引量:7
6
作者 张旭 张振江 刘云 《铁路计算机应用》 2010年第12期18-21,共4页
针对重要的舆论平台BBS论坛,提出利用网络爬虫构建适合抓取论坛数据的爬虫模块。通过分析BBS论坛以及比较不同类别爬虫的特点,介绍BBS爬虫模块的工作流程以及需要选择的策略,讨论URL的处理与重定向问题的解决方法,并提出对不同论坛模块... 针对重要的舆论平台BBS论坛,提出利用网络爬虫构建适合抓取论坛数据的爬虫模块。通过分析BBS论坛以及比较不同类别爬虫的特点,介绍BBS爬虫模块的工作流程以及需要选择的策略,讨论URL的处理与重定向问题的解决方法,并提出对不同论坛模块定制不同任务的抓取策略。 展开更多
关键词 舆情系统 聚焦爬虫 爬虫模块 定制任务
下载PDF
网络舆情主题信息采集研究 被引量:10
7
作者 黄炜 金雅博 胡昌龙 《现代图书情报技术》 CSSCI 北大核心 2012年第11期65-71,共7页
网络舆情的主题不确定性问题在网络治理中越来越突出,通过研究网络舆情的相关特征及其演化机制,在基于内容的主题选择策略上,引入时间维和空间维的主题因子,设计并实现网络舆情的主题信息爬虫。实验结果表明,该主题信息爬虫不仅执行的... 网络舆情的主题不确定性问题在网络治理中越来越突出,通过研究网络舆情的相关特征及其演化机制,在基于内容的主题选择策略上,引入时间维和空间维的主题因子,设计并实现网络舆情的主题信息爬虫。实验结果表明,该主题信息爬虫不仅执行的效率较高,而且主题约束性稳定,为后期网络群体性事件的舆情处理提供主题样本。 展开更多
关键词 网络群体性事件 网络舆情 主题爬虫 领域本体 主题因子
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部