-
题名基于微博平台的用户评论数据采集
- 1
-
-
作者
黄红桃
江盈锋
-
机构
广东外语外贸大学信息学院
-
出处
《科技创新导报》
2021年第14期132-135,139,共5页
-
基金
广州市科技计划项目(项目编号:No.202002030239)。
-
文摘
微博的热点事件会产生大量评论数据,这些数据是进行舆情分析和网络水军识别等数据挖掘的基础。论文分析对比常用的网络爬虫技术和框架,分别使用Selenium框架和Json数据接口两种方法,采集新浪微博热点事件下的用户评论数据。一般网络爬虫技术多使用广度搜索,这里采用深度搜索,能够更精确地获得某个热点事件下的用户评论数据。
-
关键词
数据挖掘
微博
用户评论
网络爬虫
SELENIUM
JSON
-
Keywords
data mining
microblog
User comments
Web crawler
Selenium
Json
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
TP274.2
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于数据挖掘的投资者情绪对股市波动影响研究
被引量:5
- 2
-
-
作者
孙明璇
李莉莉
-
机构
青岛大学经济学院
-
出处
《燕山大学学报(哲学社会科学版)》
2020年第1期68-77,共10页
-
基金
国家统计科学研究项目“大数据背景下抽样统计推断方法研究”(2018LY20)
山东省社科基金项目“大数据背景下预期与经济波动的相互影响机制研究”(17CJJJ05)
-
文摘
行为金融学理论中,投资者的决策易受自身情绪等因素的影响,目前,挖掘网络平台中的信息已成为获取投资者情绪的有效方式。为揭示投资者情绪对中国股市的影响,使用基于情感词典的中文情感分析方法,从新浪微博中提取不同种类的情绪时间序列,基于ARFIMA-RV模型,研究了不同种类的投资者情绪对中国股票市场波动的影响,并以滚动时间窗方法对波动率进行样本外预测。研究结果表明,不同的投资者情绪,对股票波动率确实存在一定的显著影响。此外加入投资者情绪后能够提高对股市波动的预测精度,其中加入消极情绪解释变量的模型预测精度最高。其实际应用价值在于为股票市场波动率的估计和预测提供了新的研究思路,也为网络信息的价值提供了佐证。
-
关键词
情绪
股市
微博评论数据化
ARFIMA-RV模型
-
Keywords
sentiment
stock market
microblog comment data
ARFIMA-RV model
-
分类号
F064.1
[经济管理—政治经济学]
-
-
题名基于网络文本分析的西安市旅游形象研究
被引量:1
- 3
-
-
作者
向进
索南曲珍卓玛
赵迪先
-
机构
南京大学建筑与城市规划学院
-
出处
《湖北农业科学》
2020年第23期216-221,237,共7页
-
文摘
以使用微博人群为研究对象,采用内容分析、语义网络分析和核密度估计相结合的研究方法,从评价性旅游形象和结构性旅游形象2个层面分析西安市旅游形象,并提出相关建议。结果表明,回民街、钟楼、鼓楼、城墙是西安市核心旅游意象,遗址遗迹是游客最偏好的旅游意象主题,旅游情感评价总体以积极为主;西安市旅游意象格局形成了以观光与美食为主题的回民街-钟鼓楼旅游意象区域、以遗址遗迹为主题的大雁塔-古城墙-永兴坊旅游意象区域和以历史文化为主题的兵马俑-华清宫旅游意象区域的3大重点旅游意象区域;意象元素呈现出中心集中、外围分散的特征;城市旅游热点意象仍以物质实体意象为核心。不仅在方法上补充了以往城市旅游形象研究中存在的文本联系实际不足的局限,也为互联网时代的城市旅游发展提出了建议。
-
关键词
微博评论数据
评价性旅游形象
结构性旅游形象
内容分析
西安市
-
Keywords
microblog comment data
evaluating tourism image
structural tourism image
content analysis
Xi'an city
-
分类号
F592.7
[经济管理—旅游管理]
-