-
题名大量网络游记文本中热度地名提取方法与实证研究
被引量:22
- 1
-
-
作者
李照航
郭风华
李仁杰
傅学庆
严正峰
-
机构
河北师范大学资源与环境科学学院
河北省科学院地理科学研究所
河北省环境演变与生态建设实验室
-
出处
《地理与地理信息科学》
CSCD
北大核心
2015年第1期68-73,共6页
-
基金
国家自然科学基金项目(41101105
41171105)
+1 种基金
河北省软科学研究计划项目(13406002D)
河北省高校重点学科建设项目
-
文摘
探讨网络游记文本中的地名使用特征及其研究意义,地名使用状态的定量特征能够反映游客对旅游地景观的认知结构与旅游行为的一般过程。在现有中文分词技术基础上,结合游记文本中的地名使用特点,选用ATF*PDF方法计算特征词汇在整个旅游文本集中使用状态的综合权重,设计了一种基于大量网络游记文本的热度地名自动提取方法,为不使用自定义地名库的旅游地理研究奠定了基础。以游客点评网游记为样本的实验证明,该方法能够实现旅游相关地名的快速提取,地名使用热度越高,提取准确率越高;对地名提取结果的类型结构分析发现了自然和人文旅游地游记在词汇使用方面的共性和差异,指示了旅游文本地名的分布意义及其对旅行过程其他信息解读的潜在价值,预示了网络游记文本在进一步解析旅游者的旅游地认知特征和旅游行为过程方面的科学意义。
-
关键词
网络游记文本
热度地名
atf*pdf模型
多样本集合共现
-
Keywords
text of Internet travel blog
hot-toponym
atf* pdf model
multiple sample collection co-occurrence
-
分类号
F590
[经济管理—旅游管理]
-