中文在线评论中的商品特征聚类研究

RESEARCH ON COMMODITY FEATURES CLUSTERING IN CHINESE ONLINE COMMENTS

下载PDF

导出

摘要针对评论中蕴含的商品特征数目繁多且同一特征具有多种不同描述的情况,提出一种基于语义相似度的商品特征聚类算法。算法包括"分配"和"转移"两个过程。"分配"过程对特征词进行聚类得到初始簇序列;"转移"过程依次遍历初始簇序列将簇内可能存在的与其他簇语义相似度更高的特征词转移到对应的簇。实验结果表明该算法聚类质量高、时间复杂度小且对数据输入次序不敏感。 In light of the situation that in comments there are so many commodity feature numbers while multiple different descriptions are just for one feature,we proposed a semantic similarity-based commodity features clustering algorithm. The algorithm includes two processes,the 'allocation'and the 'transfer'. The'allocation'process clusters the feature words to get primary clusters sequence; and the'transfer'process traverses the primary clusters sequence in turn and transfers the feature words within a cluster which possibly have higher similarity in semantics as of other clusters to the corresponding cluster. Experimental results indicate that the algorithm has high quality,small time complexity and is insensitive to data input order.

作者秦成磊魏晓

机构地区上海应用技术大学计算机科学与信息工程学院

出处《计算机应用与软件》 CSCD 2016年第7期64-67,共4页 Computer Applications and Software

关键词商品特征聚类特征聚类语义相似度评论挖掘 Commodity features clustering Features clustering Semantic similarity Comment mining

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献4

1李爱清,何烁,郗亚辉.产品评论挖掘可视化实验平台的开发[J].河北大学学报（自然科学版）,2012,32(2):212-217. 被引量：7
2田久乐,赵蔚.基于同义词词林的词语相似度计算方法[J].吉林大学学报（信息科学版）,2010,28(6):602-608. 被引量：177
3代六玲,黄河燕,陈肇雄.中文文本分类中特征抽取方法的比较研究[J].中文信息学报,2004,18(1):26-32. 被引量：228
4李实,叶强,李一军,RobLaw.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报,2009,12(2):142-152. 被引量：129

二级参考文献21

1YE Qiang LI Yijun ZHANG Yiwen.Semantic-Oriented Sentiment Classification for Chinese Product Reviews: An Experimental Study of Book and Cell Phone Reviews[J].Tsinghua Science and Technology,2005,10(z1):797-802. 被引量：7
2王永贵,韩顺平,邢金刚,于斌.基于顾客权益的价值导向型顾客关系管理——理论框架与实证分析[J].管理科学学报,2005,8(6):27-36. 被引量：32
3余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量：25
4程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报（自然科学版）,2007,25(2):145-148. 被引量：11
5黄昌宁等.对自动分词的反思[A]..语言计算与基于内容的文本处理[C].北京:清华大学出版社,2003,7.26-38.
6关毅,王晓龙.基于统计的汉语词汇间语义相似度计算[C]//全国第七届计算语言学联合学术会议论文集,哈尔滨,2003:221-227.
7YU Sheng-quan,HE Ke-kang.The Research of Adaptive Learning System Based on Internet[C] ∥The Third Global Chinese Computer Application Conference Analects.Macao,China:Macao University Press,1999:34-40.
8梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1993:106-108.
9刘群,李素建.基于"知网"的词汇语义相似度计算[C] ∥计算语言学与中文语言处理--第三届汉语词汇语义学研讨会论文集.台北:台北市中研院语言学研究所,2002:59-76.
10LIU Bing,HU Mingqing,CHENG Junsheng.Opinion observer:analyzing and comparing opinions on the web[Z].Interna-tional World Wide Web Conference Committee(IW3C2),Chiba,2005.

共引文献532

1龚丽娟,王昊,张紫玄,朱立平.Word2Vec对海关报关商品文本特征降维效果分析[J].数据分析与知识发现,2020,4(2):89-100. 被引量：7
2熊回香,陈子薇,叶佳鑫.基于共现关系的关键词层次结构构建研究[J].知识管理论坛,2022(4):443-451. 被引量：1
3骆魁永.一种面向不均衡数据集的CHI特征选择改进算法[J].商丘师范学院学报,2021,37(6):9-13.
4马林兵,张宇菲,谭婷,杨宗和.基于本体论空间搜索引擎研究——以地震灾害为例[J].计算机应用研究,2020,37(S02):202-204. 被引量：1
5叶强,詹宝强,马笑晨,李永立.基于文本挖掘和多模块融合的金融数据分类分级方法[J].信息技术与管理应用,2022(1):120-133.
6张莉.网页自动分类技术概念分析[J].娄底职业技术学院学报（职教与经济研究）,2007(2):58-62.
7张培颖.基于Web内容和日志挖掘的个性化网页推荐系统[J].计算机系统应用,2008,17(9):9-11. 被引量：6
8贾志洋,高炜,王勇刚.结合信息检索技术的半监督文本分类方法[J].苏州大学学报（自然科学版）,2012,28(1):34-39. 被引量：1
9尤晶晶.基于贝叶斯的垃圾邮件过滤优化算法[J].烟台职业学院学报,2008(2):80-83.
10伍洋,钟鸣,姜艳,李石君.面向审计领域的短文本分类技术研究[J].微电子学与计算机,2015,32(1):5-10. 被引量：7

1施国良,石桥峰.基于文本挖掘的不同购物网站商品评论一致性研究[J].现代图书情报技术,2011(12):64-68. 被引量：6
2王纪辉,赵卓宁.基于协同过滤算法的电子商务网站个性化推荐系统设计[J].成都信息工程学院学报,2007,22(z1):161-167. 被引量：3
3赵鸣,吴磊.改进性的文本聚类算法研究[J].长江大学学报（自科版）（上旬）,2009,6(2):73-75.
4孟庆庆,张胜男,卢楚雍.基于用户特征和商品特征的组合协同过滤算法[J].软件导刊,2015,14(3):41-43. 被引量：4
5李峰,李军怀,王瑞林,张璟.基于商品特征的个性化推荐算法[J].计算机工程与应用,2007,43(17):194-197. 被引量：9
6刘海旭,郑岩.基于语义的标签关联算法[J].软件,2012,33(12):136-138. 被引量：1
7周民,李蕊.基于商品特征的商品评论信息挖掘方法[J].计算机与现代化,2014(6):98-101. 被引量：1
8彭云,万常选,江腾蛟,刘德喜,刘喜平.一种词聚类LDA的商品特征提取算法[J].小型微型计算机系统,2015,36(7):1458-1463. 被引量：12
9冯少荣.一种提高文本聚类算法质量的方法[J].同济大学学报（自然科学版）,2008,36(12):1712-1718. 被引量：3
10包增辉,宋余庆.协同过滤算法的多样性研究[J].无线通信技术,2013,22(3):5-9. 被引量：4

计算机应用与软件

2016年第7期

浏览历史

内容加载中请稍等...

中文在线评论中的商品特征聚类研究

参考文献4

二级参考文献21

共引文献532

相关作者

相关机构

相关主题

浏览历史