-
题名互联网搜索数据预处理方法及其在股市分析中的应用
被引量:5
- 1
-
-
作者
刘颖
吕本富
彭赓
-
机构
中国科学院研究生院管理学院
-
出处
《情报学报》
CSSCI
北大核心
2011年第10期1028-1036,共9页
-
基金
本文得到国家自然科学基金(70972104
70772103)、北京市自然科学基金(9083017)、阿里巴巴青年学者支持计划(Ali.2010.A.5)的支持.
-
文摘
互联网搜索数据与社会经济行为的相关性已被多篇文献所证实,然而对于这项研究的基础工作——数据预处理,目前尚缺乏系统的方法。本文提出一套完整的搜索数据预处理流程,包括搜索关键词的选择、时差关系判定、关键词指数合成等步骤,并对各关键步骤给出了处理方法及标准。通过该方法可以得到稳定且高拟合度的先行关键词指数。本文以股票市场中上证指数为研究对象,实证检验得出,合成后的先行关键词指数与上证指数的拟合优度高达0.979。Granger检验证实了对上证指数具有显著的预测能力,回归结果显示关键词指数每变动1个百分点,后一期的上证指数将同方向变动0.518个百分点。
-
关键词
互联网搜索数据
预处理
先行关键词指数
时差关系判定
-
Keywords
Internet search data, data preprocessing, leading keywords index, time difference measurement
-
分类号
F49
[经济管理—产业经济]
-
-
题名基于互联网搜索数据的甘肃省旅游客源地时空分析
被引量:6
- 2
-
-
作者
马威
张耀南
敏玉芳
陈玥
-
机构
中国科学院寒区旱区环境与工程研究所甘肃省资源环境科学数据工程技术研究中心
中国科学院大学
中国科学院地理科学与资源研究所
-
出处
《中国沙漠》
CSCD
北大核心
2016年第3期857-864,共8页
-
基金
国家自然科学基金项目(91125005)
国家基础科学人才培养基金冰川冻土学科点人才培养基金项目(J1210003/J0109)
-
文摘
传统的统计手段可以获得旅游城市或景点的游客量,而无法获得旅游客源地游客量,本文首先把互联网搜索数据与现实游客行为之间进行关联和映射,然后将搜索量最高关键词通过自由组合和非线性多项式拟合,发现3个词组合时与现实游客行为之间R2高达0.999,最后反演出2011—2014年中国(港澳台除外)各省、直辖市和自治区至甘肃省旅游的人数,进行甘肃省旅游客源地时空数据可视化、时空数据异常探测、时空过程分析等,帮助旅游部门了解游客的来源及去处、游客的出行规律和爱好偏向,做出有针对性的决策。
-
关键词
互联网搜索数据
客源地
时空分析
-
Keywords
Internet search data
tourist source
spatiotemporal analysis
-
分类号
F590.1
[经济管理—旅游管理]
-