期刊文献+

基于客户评论和语料库的在线酒店信誉维度挖掘 被引量:7

Exploration of Dimensions of the Online Hotel Reputation Based on Customers' Text Comments and Corpus
原文传递
导出
摘要 以携程网上消费者对酒店的文本评论为研究对象,通过对文本评论中的词语进行聚类,得到其中隐含的消费者最关注的酒店评价维度。为保证词语聚类的效果,引入语料库作为对比文档,通过分词、特征项表示、特征词编码标注、词义相似度计算以及基于DBSCAN的文本聚类过程,得到最后的评价维度,并以实例详细说明每个过程中所采用的方法及步骤。 This paper aims to explore the most important issues considered by consumers on the basis of corpus and consumers' online feedback, which are implied in the consumers' text comments. After the process of grabbing text comments data, words segmentation, the generation of characteristics collection, code marking, semantic similarity calculation and machine clustering, the dimensions of online hotel reputation are generated. And then an example is used to elaborate the detailed procedures and methods. The paper provides a new perspective to explore online feedback system. From a practical perspective, it also provides decision support to the manager of hotels and online hotel booking websites.
出处 《图书情报工作》 CSSCI 北大核心 2012年第12期124-129,共6页 Library and Information Service
基金 国家自然科学基金项目"基于文本挖掘的在线零售商信誉评价模型研究"(项目编号:70871048)研究成果之一
关键词 信誉维度 词语聚类 文本评论 词义相似度 语料库 reputation dimensions words clustering text comments semantic similarity corpus
  • 相关文献

参考文献13

  • 1中青网.中国在线旅游三分天下市场发展速度惊人[OL].[2010-10-21].http://news.iresearch.en/0468/20101021/126157.shtml.
  • 2Resnick P, Zeckhauser R, Kuwabara K,et al. Reputation systems [ J]. Communications of the ACM, 2000, 43 (12) : 45 -48.
  • 3Miller N, Resnick P. Eliciting informative feedback: The peer-pre- diction method[ J]. Management Science, 2005, 51 (9) : 1359 - 1373.
  • 4赵学锋,陈传红,陈获帆,张金隆,周敏.基于文本聚类的电子零售商信誉维度发现研究[J].情报学报,2011,30(1):69-75. 被引量:4
  • 5Cabral L, Hortacsu A. The dynamics of seller reputation: Theory" and evidence from eBay [ R/OL ]. [ 2012 - 04 - 12 ]. http ://pa- ges. stem. nyu. edu/- leabral/papers/ebay, pdf.
  • 6携程网.写点评[OL].[2010-10-26].http://www.1vping.com/members/WriteReview.aspx?type=hotel.
  • 7Sahon G, Buckley B. Term-weighting approaches in automatic text retrieval[ J]. Information Processing and Management , 1998, 24( 5) :513- 523.
  • 8刘群 李素建.基于《知网》的词汇语义相似度计算[C]..第三界汉语词汇语义研讨会[C].台北,2002..
  • 9索红光,王玉伟.基于参考区域的k-means文本聚类算法[J].计算机工程与设计,2009,30(2):401-403. 被引量:9
  • 10杨峰,周宁,吴佳鑫.基于信息可视化技术的文本聚类方法研究[J].情报学报,2005,24(6):679-683. 被引量:18

二级参考文献35

共引文献149

同被引文献79

引证文献7

二级引证文献84

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部