期刊文献+

产品评论挖掘中特征同义词的识别 被引量:4

Recognizing the Feature Synonyms in Product Review
下载PDF
导出
摘要 随着电子商务的飞速发展,电子商务网站上的各种产品评论数量也在飞速增长。如何从Web中大量存在的产品评论中挖掘出对消费者和生产厂商都有价值的信息,已经成为一个非常重要的研究领域。在产品评论中,用户往往会用不同的词语描述同一产品特征。识别这些产品特征同义词才能更好地进行观点汇总。该文经过对产品评论的分析,抽取了must-link和can-not-link两类约束,并使用约束层次聚类算法识别产品特征同义词。同时,比较了几种不同产品特征相似度计算方法的结果。实验结果表明,该文的方法在实际产品评论数据集上取得了较好的效果。 With the great development of e-commerce,the product review mining has recently received a lot of attention.In product reviews,people often use different words and phrases to describe the same product feature,which are necessary to be recognized as synonyms for effective opinion summary.In this paper,we first calculate the similarity of product features.Then the must-link and cannot-link constraints are exacted based on the analysis of product reviews.Finally,the constrained hierarchical clustering algorithm and the extracted constraints are applied to recognize product feature synonyms.Experiments on diverse real-life datasets show promising results.
作者 郗亚辉 XI Yahui(College of Mathematics and Computer Science, HeBei University, Baoding, Hebei 071002, China)
出处 《中文信息学报》 CSCD 北大核心 2016年第4期150-158,共9页 Journal of Chinese Information Processing
基金 国家自然科学基金(61170039)
关键词 产品评论挖掘 产品特征同义词 相似度 约束层次聚类算法 product review mining product feature synonyms similarity constrained hierarchical clustering algorithm
  • 相关文献

参考文献2

二级参考文献20

  • 1余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量:25
  • 2程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报(自然科学版),2007,25(2):145-148. 被引量:11
  • 3关毅,王晓龙.基于统计的汉语词汇间语义相似度计算[C]//全国第七届计算语言学联合学术会议论文集,哈尔滨,2003:221-227.
  • 4YU Sheng-quan,HE Ke-kang.The Research of Adaptive Learning System Based on Internet[C] ∥The Third Global Chinese Computer Application Conference Analects.Macao,China:Macao University Press,1999:34-40.
  • 5梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1993:106-108.
  • 6刘群,李素建.基于"知网"的词汇语义相似度计算[C] ∥计算语言学与中文语言处理--第三届汉语词汇语义学研讨会论文集.台北:台北市中研院语言学研究所,2002:59-76.
  • 7Carenini G.,R.Ng,E.Zwart.Extracting knowledgefrom evaluative text[C] //Proceedings of InternationalConference on Knowledge Capture,Banff,Canada,2005:8-15.
  • 8Lee L.Measures of distributional similarity[C] //Proceedings of ACL.Maryland,USA,1999:25-32.
  • 9Guo H.,H.Zhu,Z.Guo,et al.Product featurecategorization with multilevel latent semanticassociation[C] //Proceedings of CIKM.Hong Kong,2009:1087-1096.
  • 10Andrzejewski D.,X.Zhu,M.Craven.Incorporatingdomain knowledge into topic modeling via Dirichletforest priors[C] //Proceedings of ICML.Montreal,Quebec,Canada,2009:25-33.

共引文献193

同被引文献47

引证文献4

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部