-
题名基于文本挖掘的线上旅游评论分析
被引量:2
- 1
-
-
作者
拓凯渊
-
机构
西安财经大学
-
出处
《西部皮革》
2020年第2期121-123,共3页
-
文摘
旅游评论作为非结构化数据,若要对其进行分析,需要先从中提取中结构化的部分,且由于旅客的规模的逐步扩大,旅客的评论数量也随之增大,从其中获得有效的、准确的、重要的信息显得十分困难。本文运用python网络爬虫技术对美团网上陕西省六个最具代表性的5A级景区的评论进行爬取,然后通过对数据进行处理,基于LDA模型得到主题类别,再根据主题类别进一步进行情感分析,以此挖掘出游客们对陕西省景区评价隐含的语义,为旅游景点管理者提供决策依据。本文使用LDA模型从旅游的网络评价文本中获取了文本中隐含的游客关注的问题,以及游客对于不同维度的情感倾向。使用LDA模型分析评论数据后得到了五个主题,还得到了各个主题下最有可能出现的特征词,可以直接反应出游客对陕西省景区的情感,从而总结出陕西省景区的网络口碑,了解到陕西省景区的优势与不足,并给出了相应的建议。
-
关键词
网络评论
文本挖掘
陕西省景区
LDA主题分析
-
分类号
F590.3
[经济管理—旅游管理]
-