期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种断点续传的多线程新闻组抓取方法及存储结构
被引量:
2
1
作者
杨代庆
王志苹
+2 位作者
王星
刘敏健
常迎春
《现代图书情报技术》
CSSCI
北大核心
2011年第2期29-33,共5页
针对新闻组的海量性及相关编码特点设计新闻帖抓取流程,采用多线程方式加快新闻帖的抓取及解析速度,同时设计一种便于海量数据断点续传的数据存储结构,通过实验采集验证该方法能有效达到信息检测的数据采集要求,抓取及解析新闻帖的速度...
针对新闻组的海量性及相关编码特点设计新闻帖抓取流程,采用多线程方式加快新闻帖的抓取及解析速度,同时设计一种便于海量数据断点续传的数据存储结构,通过实验采集验证该方法能有效达到信息检测的数据采集要求,抓取及解析新闻帖的速度比普通单线程抓取解析方式有显著提高。
展开更多
关键词
新闻组
多线程
海量数据
网络新闻传输协议
原文传递
题名
一种断点续传的多线程新闻组抓取方法及存储结构
被引量:
2
1
作者
杨代庆
王志苹
王星
刘敏健
常迎春
机构
中国科学技术信息研究所
中国科学院国家科学图书馆
中国科学院研究生院
出处
《现代图书情报技术》
CSSCI
北大核心
2011年第2期29-33,共5页
基金
国家十一五科技支撑计划子课题"网络科技信息监测与评价"(项目编号:2006BAH03B05)的研究成果之一
文摘
针对新闻组的海量性及相关编码特点设计新闻帖抓取流程,采用多线程方式加快新闻帖的抓取及解析速度,同时设计一种便于海量数据断点续传的数据存储结构,通过实验采集验证该方法能有效达到信息检测的数据采集要求,抓取及解析新闻帖的速度比普通单线程抓取解析方式有显著提高。
关键词
新闻组
多线程
海量数据
网络新闻传输协议
Keywords
usenet muhithread mass - data nntp
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种断点续传的多线程新闻组抓取方法及存储结构
杨代庆
王志苹
王星
刘敏健
常迎春
《现代图书情报技术》
CSSCI
北大核心
2011
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部