期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
14
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于微博API的分布式抓取技术
被引量:
7
1
作者
陈舜华
王晓彤
+3 位作者
郝志峰
蔡瑞初
肖晓军
卢宇
《电信科学》
北大核心
2013年第8期146-150,155,共6页
随着微博用户的迅猛增长,越来越多的人希望从用户的行为和微博内容中挖掘有趣的模式。针对如何对微博数据进行有效合理的采集,提出了基于微博API的分布式抓取技术,通过模拟微博登录自动授权,合理控制API的调用频次,结合任务分配控制器...
随着微博用户的迅猛增长,越来越多的人希望从用户的行为和微博内容中挖掘有趣的模式。针对如何对微博数据进行有效合理的采集,提出了基于微博API的分布式抓取技术,通过模拟微博登录自动授权,合理控制API的调用频次,结合任务分配控制器高效地获取微博数据。该分布式抓取技术还结合时间触发和内存数据库技术实现重复控制,避免了数据的重复爬取和重复存储,提高了系统的性能。本分布式抓取技术具有可扩展性高、任务分配明确、效率高、多种爬取策略适应不同的爬取需求等特点。新浪微博数据爬取实例验证了该技术的可行性。
展开更多
关键词
新浪微博
爬取策略
分布式爬取
微博
api
下载PDF
职称材料
基于API接口的腾讯微博数据挖掘
被引量:
1
2
作者
陈向阳
陈丽萍
姜振国
《现代计算机》
2015年第6期47-50,共4页
以腾讯微博为对象,介绍它提供的API接口,以及如何成为授权用户和微博信息提取及处理的方法。利用API接口可以高效迅捷地获取微博信息,但微博服务商并不完全开放API接口,而且对单位时间内的访问次数也有限制,因此对于所需的关键微博信息...
以腾讯微博为对象,介绍它提供的API接口,以及如何成为授权用户和微博信息提取及处理的方法。利用API接口可以高效迅捷地获取微博信息,但微博服务商并不完全开放API接口,而且对单位时间内的访问次数也有限制,因此对于所需的关键微博信息如果无法通过API得到时,需要结合其他方法获取。
展开更多
关键词
微博
api
接口
信息挖掘
下载PDF
职称材料
基于API的微博信息采集系统设计与实现
被引量:
4
3
作者
吴斌杰
徐子玮
虞飞华
《电脑知识与技术(过刊)》
2013年第6X期4005-4008,共4页
微博已成为网络信息的重要来源,该文分析了微博信息采集的相关方法与技术,提出了基于API的信息采集方法,然后设计了一个信息采集系统,能够对新浪微博的相关信息进行采集。实验测试表明,该信息采集系统能够快速有效地采集新浪微博信息。
关键词
新浪微博
微博接口
信息采集
C#语言
下载PDF
职称材料
社交网络数据采集技术研究与应用
被引量:
14
4
作者
徐雁飞
刘渊
吴文鹏
《计算机科学》
CSCD
北大核心
2017年第1期277-282,共6页
随着社交网络的快速发展,对其研究也逐步深入。显然,社交网络基础数据的获取对研究具有非常重要的意义。针对目前已有的数据采集方案,根据新浪授权标准以及最新的微博加密方式,研究了两种采集方案:1)经OAuth2.0认证后,通过微博API接口...
随着社交网络的快速发展,对其研究也逐步深入。显然,社交网络基础数据的获取对研究具有非常重要的意义。针对目前已有的数据采集方案,根据新浪授权标准以及最新的微博加密方式,研究了两种采集方案:1)经OAuth2.0认证后,通过微博API接口获取数据;2)在RSA2加密方式下模拟登录微博,再通过网络爬虫抓取数据。同时,还研究了通过网页采集器针对微博编写适当的采集规则进而实现对数据的获取。3种数据采集方案都能有效地对数据进行采集且各具特点,针对数据的采集需求,提出融合不同的采集方案的策略。经实验研究,方案的融合策略可快速、高效地实现大数据量的采集。
展开更多
关键词
PYTHON
微博
api
模拟登录
网络爬虫
采集器
融合策略
下载PDF
职称材料
基于多策略的新浪微博大数据抓取及应用
被引量:
16
5
作者
孙晓
叶嘉麒
+1 位作者
唐陈意
任福继
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2014年第10期1210-1215,共6页
微博数据处理属于大数据范畴,其前提是获取大量的微博数据,而由于商业利益以及安全方面的考虑,获取微博数据的途径越来越少。同时随着新浪官方API的逐步更新,数据获取的限制也日益增加。文章尝试利用现有资源,基于多策略获取机制,设计...
微博数据处理属于大数据范畴,其前提是获取大量的微博数据,而由于商业利益以及安全方面的考虑,获取微博数据的途径越来越少。同时随着新浪官方API的逐步更新,数据获取的限制也日益增加。文章尝试利用现有资源,基于多策略获取机制,设计出可稳定获得新浪微博数据的挖掘方案,并给出情感分析应用实例。实验表明,所设计的挖掘方案可以根据需要获取微博上的数据,并可以应用于微博情感分析中。
展开更多
关键词
新浪微博
api
大数据
数据挖掘
网络爬虫
多策略
下载PDF
职称材料
一种基于模拟登录的微博数据采集方案
被引量:
30
6
作者
孙青云
王俊峰
+1 位作者
赵宗渠
高梦超
《计算机技术与发展》
2014年第3期6-10,共5页
随着Web 2.0时代的到来,舆情信息在微博上能够更快速的产生和传播。为了有效地分析微博舆情信息,微博数据的获取显得尤为重要。文中以新浪微博为研究对象,提出了基于模拟登录的网络爬虫采集方案。此方案解决了调用微博API接口对开发者...
随着Web 2.0时代的到来,舆情信息在微博上能够更快速的产生和传播。为了有效地分析微博舆情信息,微博数据的获取显得尤为重要。文中以新浪微博为研究对象,提出了基于模拟登录的网络爬虫采集方案。此方案解决了调用微博API接口对开发者的次数限制,解决了传统的网络爬虫需要身份验证的问题,加快了微博数据的采集速度,可以在短时间内获得海量的微博数据。实验表明,用该方案开发的系统具有快速的微博信息采集速度,更加灵活,可以很好地为舆情系统分析提供大量准确的数据支持。
展开更多
关键词
模拟登录技术
网络爬虫
下载PDF
职称材料
基于多策略的微博位置数据获取方法研究
被引量:
4
7
作者
杨飞
江南
+2 位作者
李响
张晶
戴兵
《测绘科学技术学报》
CSCD
北大核心
2016年第2期201-207,共7页
随着Web2.0时代发展的成熟,在以微博为代表的新社交网络平台上产生了大量含有空间位置信息和时间标识的数据,即位置数据(location data)。位置数据是大数据的一个重要组成部分,现已作为一种战略性资源被广泛应用于社会生活的多个领域,...
随着Web2.0时代发展的成熟,在以微博为代表的新社交网络平台上产生了大量含有空间位置信息和时间标识的数据,即位置数据(location data)。位置数据是大数据的一个重要组成部分,现已作为一种战略性资源被广泛应用于社会生活的多个领域,而位置数据的获取是位置数据挖掘和应用的基础。深刻分析了基于API、基于网络爬虫和基于网络数据流3种目前常用的微博数据获取方法的特点,在此基础上提出了一种基于多策略的微博位置数据获取方法,详细阐述了该方法的基本原理、基本流程和主要特点。最后通过获取新浪微博的位置数据进行实验验证,结果证实,该方法可以实现全面、高效地获取微博位置数据。
展开更多
关键词
多策略
微博
位置数据
api
网络爬虫
网络数据流
新浪微博
下载PDF
职称材料
在线社会网络的数据采集方法的研究
被引量:
4
8
作者
黄蓝会
《信息技术》
2014年第2期53-55,共3页
在线社会网络是一个由亿万级用户及联接关系构成的大规模集合,其中以新浪微博为典型代表,目前已经成为人们日常交流的重要方式。如何在新浪微博中分析其用户的特征和网络拓扑结构成为研究在线社会网络的基础,利用新浪微博开放平台提供的...
在线社会网络是一个由亿万级用户及联接关系构成的大规模集合,其中以新浪微博为典型代表,目前已经成为人们日常交流的重要方式。如何在新浪微博中分析其用户的特征和网络拓扑结构成为研究在线社会网络的基础,利用新浪微博开放平台提供的API采集数据,实验证明,该方法切实可行。
展开更多
关键词
在线社会网络
新浪微博
api
下载PDF
职称材料
我国政务微博信息的归档范围和归档流程研究
被引量:
11
9
作者
肖秋会
詹欣然
《档案管理》
北大核心
2018年第1期52-54,共3页
政务微博已经成为政府服务的重要平台,政务微博的高价值性及动态性使其归档管理变得日益紧迫。探讨我国已有的电子文件管理标准对政务微博信息归档管理的适用性,分析了政务微博的归档流程,着重分析了归档过程中的信息采集、信息著录和...
政务微博已经成为政府服务的重要平台,政务微博的高价值性及动态性使其归档管理变得日益紧迫。探讨我国已有的电子文件管理标准对政务微博信息归档管理的适用性,分析了政务微博的归档流程,着重分析了归档过程中的信息采集、信息著录和信息存储这三个环节。
展开更多
关键词
社交媒体
政务微博
归档范围
归档流程
api
下载PDF
职称材料
基于在线社会网络采集数据的研究
被引量:
1
10
作者
黄蓝会
《宝鸡文理学院学报(自然科学版)》
CAS
2014年第3期57-59,共3页
目的研究新浪微博数据采集问题。方法利用新浪微博API接口和本文设计的网络爬虫模型进行数据采集。结果与结论实验证明两种方法都可以在较短时间内收集到较多用户资料,但在过滤去重方面,本文设计的算法在时间上更为高效。
关键词
在线社会网络
新浪微博
应用程序编辑接口
网络爬虫
下载PDF
职称材料
浅析J2ME与微博数据交换的实现
11
作者
钱立
《实验科学与技术》
2011年第4期46-47,共2页
分析了J2ME手机客户端程序采用轻量级数据格式JSON来实现与微博的数据交换。JSON与XML相比,简洁高效,方便生成和解析。微博API逐步开放,使得J2ME访问微博更容易。文中以新浪微博API为例介绍了其中update接口的URL访问格式和返回JSON数...
分析了J2ME手机客户端程序采用轻量级数据格式JSON来实现与微博的数据交换。JSON与XML相比,简洁高效,方便生成和解析。微博API逐步开放,使得J2ME访问微博更容易。文中以新浪微博API为例介绍了其中update接口的URL访问格式和返回JSON数据的格式,并列举了J2ME发送Http请求及解析响应的JSON数据的关键代码,实现了与微博的数据交换。
展开更多
关键词
JSON格式
微博
应用程序编程接口
下载PDF
职称材料
社交网络挖掘方案研究
被引量:
4
12
作者
俞忻峰
《现代电子技术》
北大核心
2015年第4期25-29,34,共6页
随着社交网络普及,社交网络的数据获取成为首先要解决的问题。针对如何获取社交网站的数据,提出了基于API和网络爬虫的两种方法。通过采取对比试验,分别用两种方式在单位时间内抓取微博,比较抓取的微博条数。实验结果表明,基于API抓取...
随着社交网络普及,社交网络的数据获取成为首先要解决的问题。针对如何获取社交网站的数据,提出了基于API和网络爬虫的两种方法。通过采取对比试验,分别用两种方式在单位时间内抓取微博,比较抓取的微博条数。实验结果表明,基于API抓取的速度比较快,但是稳定性和数据完整性欠佳;基于网路爬虫方式抓取的速度比较慢,但是稳定性和数据完整性较好。最后提出通过采用两种方式相结合的方式,能够进一步提高抓取效率。
展开更多
关键词
新浪微博
数据挖掘
ANDROID
SDK
新浪
api
网络爬虫
信息采集
下载PDF
职称材料
基于微博的信息处理系统设计
13
作者
孙马莉
《电脑知识与技术》
2012年第10期6714-6715,共2页
随着Web2.0的快速发展,越来越多的用户都拥有了自己的微博客及微博。微博因为其及时性、大众性而在很多新闻、公共事件中有较为突出的表现。本文主要介绍微博的特征、价值及应用,然通过新浪微博提供的API接口获取微博数据,针对整个微博...
随着Web2.0的快速发展,越来越多的用户都拥有了自己的微博客及微博。微博因为其及时性、大众性而在很多新闻、公共事件中有较为突出的表现。本文主要介绍微博的特征、价值及应用,然通过新浪微博提供的API接口获取微博数据,针对整个微博和个人用户分别进行数据的统计和分析并把最终得到的信息反馈给用户。
展开更多
关键词
微博
信息处理
api
下载PDF
职称材料
新浪微博数据挖掘方案
被引量:
120
14
作者
廉捷
周欣
+1 位作者
曹伟
刘云
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第10期1300-1305,共6页
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的...
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。
展开更多
关键词
新浪微博
新浪
api
数据检索
网页解析
原文传递
题名
基于微博API的分布式抓取技术
被引量:
7
1
作者
陈舜华
王晓彤
郝志峰
蔡瑞初
肖晓军
卢宇
机构
广东工业大学计算机学院
广州优亿信息科技有限公司
出处
《电信科学》
北大核心
2013年第8期146-150,155,共6页
文摘
随着微博用户的迅猛增长,越来越多的人希望从用户的行为和微博内容中挖掘有趣的模式。针对如何对微博数据进行有效合理的采集,提出了基于微博API的分布式抓取技术,通过模拟微博登录自动授权,合理控制API的调用频次,结合任务分配控制器高效地获取微博数据。该分布式抓取技术还结合时间触发和内存数据库技术实现重复控制,避免了数据的重复爬取和重复存储,提高了系统的性能。本分布式抓取技术具有可扩展性高、任务分配明确、效率高、多种爬取策略适应不同的爬取需求等特点。新浪微博数据爬取实例验证了该技术的可行性。
关键词
新浪微博
爬取策略
分布式爬取
微博
api
Keywords
Sina
microblog
, crawling strategy, distributed crawl,
microblog api
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于API接口的腾讯微博数据挖掘
被引量:
1
2
作者
陈向阳
陈丽萍
姜振国
机构
河北大学计算机科学与技术学院
出处
《现代计算机》
2015年第6期47-50,共4页
基金
保定科技局计划项目(No.13ZG017)
文摘
以腾讯微博为对象,介绍它提供的API接口,以及如何成为授权用户和微博信息提取及处理的方法。利用API接口可以高效迅捷地获取微博信息,但微博服务商并不完全开放API接口,而且对单位时间内的访问次数也有限制,因此对于所需的关键微博信息如果无法通过API得到时,需要结合其他方法获取。
关键词
微博
api
接口
信息挖掘
Keywords
microblog
api
Interface
Information Extraction
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于API的微博信息采集系统设计与实现
被引量:
4
3
作者
吴斌杰
徐子玮
虞飞华
机构
浙江树人大学信息科技学院
出处
《电脑知识与技术(过刊)》
2013年第6X期4005-4008,共4页
基金
2012年浙江省大学生科技创新项目(项目编号:2012R420010)研究成果之一
文摘
微博已成为网络信息的重要来源,该文分析了微博信息采集的相关方法与技术,提出了基于API的信息采集方法,然后设计了一个信息采集系统,能够对新浪微博的相关信息进行采集。实验测试表明,该信息采集系统能够快速有效地采集新浪微博信息。
关键词
新浪微博
微博接口
信息采集
C#语言
Keywords
Sina
microblog
api
Data colleticon
C# language
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
社交网络数据采集技术研究与应用
被引量:
14
4
作者
徐雁飞
刘渊
吴文鹏
机构
江南大学数字媒体学院
出处
《计算机科学》
CSCD
北大核心
2017年第1期277-282,共6页
基金
国家自然科学基金项目(61103223)资助
文摘
随着社交网络的快速发展,对其研究也逐步深入。显然,社交网络基础数据的获取对研究具有非常重要的意义。针对目前已有的数据采集方案,根据新浪授权标准以及最新的微博加密方式,研究了两种采集方案:1)经OAuth2.0认证后,通过微博API接口获取数据;2)在RSA2加密方式下模拟登录微博,再通过网络爬虫抓取数据。同时,还研究了通过网页采集器针对微博编写适当的采集规则进而实现对数据的获取。3种数据采集方案都能有效地对数据进行采集且各具特点,针对数据的采集需求,提出融合不同的采集方案的策略。经实验研究,方案的融合策略可快速、高效地实现大数据量的采集。
关键词
PYTHON
微博
api
模拟登录
网络爬虫
采集器
融合策略
Keywords
Python,
microblog api
, Simulated login, Web crawler, Collector, Fusion strategy
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多策略的新浪微博大数据抓取及应用
被引量:
16
5
作者
孙晓
叶嘉麒
唐陈意
任福继
机构
合肥工业大学计算机与信息学院
出处
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2014年第10期1210-1215,共6页
基金
国家自然科学基金资助项目(61203315)
国家高技术研究发展计划(863计划)资助项目(2012AA011103)
安徽省科技攻关计划资助项目(1206c0805039)
文摘
微博数据处理属于大数据范畴,其前提是获取大量的微博数据,而由于商业利益以及安全方面的考虑,获取微博数据的途径越来越少。同时随着新浪官方API的逐步更新,数据获取的限制也日益增加。文章尝试利用现有资源,基于多策略获取机制,设计出可稳定获得新浪微博数据的挖掘方案,并给出情感分析应用实例。实验表明,所设计的挖掘方案可以根据需要获取微博上的数据,并可以应用于微博情感分析中。
关键词
新浪微博
api
大数据
数据挖掘
网络爬虫
多策略
Keywords
Sina
microblog
ging
api
big data
data mining
Web crawler
multi-strategy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于模拟登录的微博数据采集方案
被引量:
30
6
作者
孙青云
王俊峰
赵宗渠
高梦超
机构
四川大学计算机学院
视觉合成图形图像技术重点实验室
出处
《计算机技术与发展》
2014年第3期6-10,共5页
基金
国家科技重大专项(2012ZX10004-901001)
国家自然科学基金资助项目(11102124)
文摘
随着Web 2.0时代的到来,舆情信息在微博上能够更快速的产生和传播。为了有效地分析微博舆情信息,微博数据的获取显得尤为重要。文中以新浪微博为研究对象,提出了基于模拟登录的网络爬虫采集方案。此方案解决了调用微博API接口对开发者的次数限制,解决了传统的网络爬虫需要身份验证的问题,加快了微博数据的采集速度,可以在短时间内获得海量的微博数据。实验表明,用该方案开发的系统具有快速的微博信息采集速度,更加灵活,可以很好地为舆情系统分析提供大量准确的数据支持。
关键词
模拟登录技术
网络爬虫
Keywords
微博
api
microblog api
simulated login technology
Web crawler
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于多策略的微博位置数据获取方法研究
被引量:
4
7
作者
杨飞
江南
李响
张晶
戴兵
机构
信息工程大学
石河子大学
出处
《测绘科学技术学报》
CSCD
北大核心
2016年第2期201-207,共7页
基金
国家自然科学基金项目(41271450)
国家自然科学基金青年科学基金项目(41401467)
国家科技支撑计划项目(2012BAK12B02)
文摘
随着Web2.0时代发展的成熟,在以微博为代表的新社交网络平台上产生了大量含有空间位置信息和时间标识的数据,即位置数据(location data)。位置数据是大数据的一个重要组成部分,现已作为一种战略性资源被广泛应用于社会生活的多个领域,而位置数据的获取是位置数据挖掘和应用的基础。深刻分析了基于API、基于网络爬虫和基于网络数据流3种目前常用的微博数据获取方法的特点,在此基础上提出了一种基于多策略的微博位置数据获取方法,详细阐述了该方法的基本原理、基本流程和主要特点。最后通过获取新浪微博的位置数据进行实验验证,结果证实,该方法可以实现全面、高效地获取微博位置数据。
关键词
多策略
微博
位置数据
api
网络爬虫
网络数据流
新浪微博
Keywords
multi-strategy
microblog
location data
api
web crawler
network data stream
Sina
microblog
分类号
P208 [天文地球—地图制图学与地理信息工程]
下载PDF
职称材料
题名
在线社会网络的数据采集方法的研究
被引量:
4
8
作者
黄蓝会
机构
宝鸡文理学院计算机系
出处
《信息技术》
2014年第2期53-55,共3页
基金
陕西省教育厅专项科研计划项目(12JK0550)
宝鸡文理学院院级重点项目(ZK121111)
文摘
在线社会网络是一个由亿万级用户及联接关系构成的大规模集合,其中以新浪微博为典型代表,目前已经成为人们日常交流的重要方式。如何在新浪微博中分析其用户的特征和网络拓扑结构成为研究在线社会网络的基础,利用新浪微博开放平台提供的API采集数据,实验证明,该方法切实可行。
关键词
在线社会网络
新浪微博
api
Keywords
online social network
Sina
microblog
api
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
我国政务微博信息的归档范围和归档流程研究
被引量:
11
9
作者
肖秋会
詹欣然
机构
武汉大学信息管理学院
出处
《档案管理》
北大核心
2018年第1期52-54,共3页
文摘
政务微博已经成为政府服务的重要平台,政务微博的高价值性及动态性使其归档管理变得日益紧迫。探讨我国已有的电子文件管理标准对政务微博信息归档管理的适用性,分析了政务微博的归档流程,着重分析了归档过程中的信息采集、信息著录和信息存储这三个环节。
关键词
社交媒体
政务微博
归档范围
归档流程
api
Keywords
Social media
Government
microblog
ging
Filing Range
Archiving process
api
分类号
D63 [政治法律—中外政治制度]
G272 [文化科学—档案学]
下载PDF
职称材料
题名
基于在线社会网络采集数据的研究
被引量:
1
10
作者
黄蓝会
机构
宝鸡文理学院计算机科学系
出处
《宝鸡文理学院学报(自然科学版)》
CAS
2014年第3期57-59,共3页
基金
陕西省工业攻关项目(2014K05-46)
宝鸡文理学院重点项目(ZK121111)
文摘
目的研究新浪微博数据采集问题。方法利用新浪微博API接口和本文设计的网络爬虫模型进行数据采集。结果与结论实验证明两种方法都可以在较短时间内收集到较多用户资料,但在过滤去重方面,本文设计的算法在时间上更为高效。
关键词
在线社会网络
新浪微博
应用程序编辑接口
网络爬虫
Keywords
online social network
Sina
microblog
application programming inerface (
api
)
web crawler
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
浅析J2ME与微博数据交换的实现
11
作者
钱立
机构
四川职业技术学院计算机科学系
出处
《实验科学与技术》
2011年第4期46-47,共2页
文摘
分析了J2ME手机客户端程序采用轻量级数据格式JSON来实现与微博的数据交换。JSON与XML相比,简洁高效,方便生成和解析。微博API逐步开放,使得J2ME访问微博更容易。文中以新浪微博API为例介绍了其中update接口的URL访问格式和返回JSON数据的格式,并列举了J2ME发送Http请求及解析响应的JSON数据的关键代码,实现了与微博的数据交换。
关键词
JSON格式
微博
应用程序编程接口
Keywords
JSON
microblog
api
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
社交网络挖掘方案研究
被引量:
4
12
作者
俞忻峰
机构
南京理工大学
出处
《现代电子技术》
北大核心
2015年第4期25-29,34,共6页
基金
国家社会科学基金项目(13BTQ046)
文摘
随着社交网络普及,社交网络的数据获取成为首先要解决的问题。针对如何获取社交网站的数据,提出了基于API和网络爬虫的两种方法。通过采取对比试验,分别用两种方式在单位时间内抓取微博,比较抓取的微博条数。实验结果表明,基于API抓取的速度比较快,但是稳定性和数据完整性欠佳;基于网路爬虫方式抓取的速度比较慢,但是稳定性和数据完整性较好。最后提出通过采用两种方式相结合的方式,能够进一步提高抓取效率。
关键词
新浪微博
数据挖掘
ANDROID
SDK
新浪
api
网络爬虫
信息采集
Keywords
Sina
microblog
data mining
Android
SDK
Sina
api
web crawler
information acquisition
分类号
TN911-34 [电子电信—通信与信息系统]
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于微博的信息处理系统设计
13
作者
孙马莉
机构
安徽新华学院信息工程学院
合肥工业大学计算机与信息学院
出处
《电脑知识与技术》
2012年第10期6714-6715,共2页
文摘
随着Web2.0的快速发展,越来越多的用户都拥有了自己的微博客及微博。微博因为其及时性、大众性而在很多新闻、公共事件中有较为突出的表现。本文主要介绍微博的特征、价值及应用,然通过新浪微博提供的API接口获取微博数据,针对整个微博和个人用户分别进行数据的统计和分析并把最终得到的信息反馈给用户。
关键词
微博
信息处理
api
Keywords
microblog
ing
information processing
api
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
新浪微博数据挖掘方案
被引量:
120
14
作者
廉捷
周欣
曹伟
刘云
机构
北京交通大学通信与信息系统北京市重点实验室
中国信息安全测评中心
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第10期1300-1305,共6页
基金
高等学校博士学科点专项科研基金资助项目(20100009110002)
北京市自然科学基金资助项目(4112045)
文摘
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。
关键词
新浪微博
新浪
api
数据检索
网页解析
Keywords
SINA
microblog
SINA
api
data retrieval
webpage extraction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于微博API的分布式抓取技术
陈舜华
王晓彤
郝志峰
蔡瑞初
肖晓军
卢宇
《电信科学》
北大核心
2013
7
下载PDF
职称材料
2
基于API接口的腾讯微博数据挖掘
陈向阳
陈丽萍
姜振国
《现代计算机》
2015
1
下载PDF
职称材料
3
基于API的微博信息采集系统设计与实现
吴斌杰
徐子玮
虞飞华
《电脑知识与技术(过刊)》
2013
4
下载PDF
职称材料
4
社交网络数据采集技术研究与应用
徐雁飞
刘渊
吴文鹏
《计算机科学》
CSCD
北大核心
2017
14
下载PDF
职称材料
5
基于多策略的新浪微博大数据抓取及应用
孙晓
叶嘉麒
唐陈意
任福继
《合肥工业大学学报(自然科学版)》
CAS
CSCD
北大核心
2014
16
下载PDF
职称材料
6
一种基于模拟登录的微博数据采集方案
孙青云
王俊峰
赵宗渠
高梦超
《计算机技术与发展》
2014
30
下载PDF
职称材料
7
基于多策略的微博位置数据获取方法研究
杨飞
江南
李响
张晶
戴兵
《测绘科学技术学报》
CSCD
北大核心
2016
4
下载PDF
职称材料
8
在线社会网络的数据采集方法的研究
黄蓝会
《信息技术》
2014
4
下载PDF
职称材料
9
我国政务微博信息的归档范围和归档流程研究
肖秋会
詹欣然
《档案管理》
北大核心
2018
11
下载PDF
职称材料
10
基于在线社会网络采集数据的研究
黄蓝会
《宝鸡文理学院学报(自然科学版)》
CAS
2014
1
下载PDF
职称材料
11
浅析J2ME与微博数据交换的实现
钱立
《实验科学与技术》
2011
0
下载PDF
职称材料
12
社交网络挖掘方案研究
俞忻峰
《现代电子技术》
北大核心
2015
4
下载PDF
职称材料
13
基于微博的信息处理系统设计
孙马莉
《电脑知识与技术》
2012
0
下载PDF
职称材料
14
新浪微博数据挖掘方案
廉捷
周欣
曹伟
刘云
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
120
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部