基于词性分析的产品评价信息挖掘被引量：4

Information of product review mining based on analyzing of part of speech

下载PDF

导出

摘要在对语料库中表达产品特征及相应评价的词的词性进行分析的基础上,确定了表达产品特征及评价最为常见的词性和词性的重要程度顺序,提出了一种产品特征及其相应评价的信息抽取规则,并根据规则建立评价语句的语义倾向的计算公式。实验结果表明,该方法在产品特征抽取及其相应评价的语义倾向判断上具有很高的准确性。通过对产品特征及其相应的评价信息进行挖掘可以为企业新产品的开发和产品的推荐提供重要的参考价值,是进行下一步生产决策的重要的理论依据。 Based on analysis of part of speech of word which can express the character of product and the corresponding review in corpus, the most frequent part of speech and the corresponding order of importance is determinted, a new information extraction rules of the character of product and the corresponding review is proposed, and the formula of computering of semantic of sen- tence is established according to the rules. Experiment show that this method have a high accuracy in extracting of the character of product and computing of semantic orientation of the corresponding of review. It will provide a huge value of new product＇s development and product recommendation in enterprise and as a important theoretical for the next step of product decision.

作者冯秀珍郝鹏

机构地区北京工业大学软件学院

出处《计算机工程与设计》 CSCD 北大核心 2013年第1期283-288,共6页 Computer Engineering and Design

基金北京市哲学社会科学"十一五"规划基金项目(10AbJG389)

关键词抽取规则分词语义倾向同义词替换信息挖掘 extraction rules segment semantic orientation synonymous substitutiom information mining

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1Liu B,Hu M,Cheng J. Opinion observer:Analyzing and comparing opinions on the web[A].Chiba,Japan,2005.342-351.
2Luchaichana O,Korkerd W,Tuchinda R. Classifying semantic orientation of domain-dependent words with unknown sentiments[A].Chaing Mai,2010.1055-1059.
3Wenqian Shang;Youli Qu;Houkuan Huang.A Rolebased customer review mining system[A]台湾台北,20064855-4860.
4Singh V K. An automated course feedback system using opinion mining[A].Mumbai,2011.72-76.
5Hui Yang;Xu Zhou;Tong Zhou.Semantic inclination mining based on dependency grammar for Chinese BIOG[A]湖南长沙,2010880-884.
6Chang Chia-Hui,Tsai Kun-Chang. Aspect summarization from Blogsphere for social study[A].Omaha,NE,2007.9-14.
7杨春明,韩永国.快速的领域文档关键词自动提取算法[J].计算机工程与设计,2011,32(6):2142-2145. 被引量：12
8刘博,郑家恒,张虎.规则与统计相结合的分词一致性检验[J].计算机工程与设计,2008,29(7):1814-1816. 被引量：7
9张华平;刘群.ictclastj.
10DLSI;Univ.Alicante,Alicante.A feature dependent method for opinion mining and classificationA feature dependent method for opinion mining and classification[A].北京,20081-7.

二级参考文献23

1孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量：20
2李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
3刘江,郑家恒,张虎.中文文本语料库分词一致性检验技术的初探[J].计算机应用研究,2005,22(9):52-54. 被引量：10
4苗玺,郑家恒.中文语料库分词不一致的分类处理研究[J].山西大学学报（自然科学版）,2006,29(1):22-25. 被引量：7
5张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：120
6张庆国,薛德军,张振海,张君玉.海量数据集上基于特征组合的关键词自动抽取[J].情报学报,2006,25(5):587-593. 被引量：17
7刘华.基于文本分类中特征提取的领域词语聚类[J].语言文字应用,2007(1):139-144. 被引量：21
8刘佳宾,陈超,邵正荣,吉翔华.基于机器学习的科技文摘关键词自动提取方法[J].计算机工程与应用,2007,43(14):170-172. 被引量：15
9刘华.基于分类标注语料库的关键词标引知识自动获取[J].图书情报工作,2007,51(7):41-43. 被引量：5
10Xie F, Wu X,Hu X G,et al.Keyphrase extraction from Chinese news web pages based on semantic relations[J].Intelligence and Security Informatics,LNCS 5075,2008:490-495.

共引文献17

1魏莉,谭红叶,郑家恒,孙健.汉语句法树库一致性检验方法研究[J].广西师范大学学报（自然科学版）,2010,28(1):139-142. 被引量：2
2梅全亭,史亮,梅岩,曹琦,张江水.抢险救灾工程破碎机械保障效能评估[J].后勤工程学院学报,2011,27(4):13-18.
3蒋建洪,赵嵩正,罗玫.词典与统计方法结合的中文分词模型研究及应用[J].计算机工程与设计,2012,33(1):387-391. 被引量：18
4杨春明,韩永国.地方政府网络舆情监测系统研究[J].西南科技大学学报,2012,27(3):92-96. 被引量：1
5陈开慧.本体与分众分类的融合模型研究[J].图书馆学研究,2013(5):73-77. 被引量：8
6何晓阳,张精理,丁婷.医学新闻关键词自动提取策略[J].中华医学图书情报杂志,2014,23(4):13-17. 被引量：2
7陈金梁,李青.基于本体的领域文档主题抽取方法研究[J].电脑开发与应用,2014,27(9):44-47.
8王庆,陈泽亚,郭静,陈晰,王晶华.基于词共现矩阵的项目关键词词库和关键词语义网络[J].计算机应用,2015,35(6):1649-1653. 被引量：11
9宇文姝丽.基于词性分析的数据流程图快速绘制方法[J].电子商务,2016,17(1):64-65. 被引量：2
10张杨,张精理,何晓阳.互联网军事医学信息资源采集与鉴选策略研究[J].中华医学图书情报杂志,2018,27(4):62-66.

同被引文献49

1魏勇刚,张国春,常勇,袁方.基于词性分析和领域知识的Deep Web语义标注[J].郑州大学学报（理学版）,2009,41(1):52-55. 被引量：7
22012年中国网络购物市场研究报告[R/OL].[2013-11-16].http://www.cnnic.cn/hlwfzyj/hlwxzbg/dzswbg/201304/t2013041739290.htm.
3淘宝评价体系介绍[EB/OL].[2013-10-18].http://service.taobao.corn/support/knowledge一4781666.htm?spm.0.0.0.49.x2xxVE&dkey=searchview.
4Jindal N, Liu B. Opinion Spam and Analysis [C]. In: Proceedings of International Conference on Web Search and Web Data Mining, California, USA. New York, NY, USA: ACM, 2008: 219-229.
5Liu J J, Cao Y B, Lin C Y, et al. Low-Quality Product Review Detection in Opinion Summarization [C]. In: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, Prague, Czech Republic. 2007: 334-342.
6ICTCLAS汉语分词系统[CP/OL].[2013-11-05].http://www.ictclas.org/.
7知网[DB/OL].[2013-11-05].http://www.keenage.com/.
8酷酷词[EB/OL].[2013-12-08].http://www.kukuci.com/.
9Wei W, Liu H Y, He J, et al. Extracting Feature and Opinion Words Effectively from Chinese Product Reviews [C]. In: Proceedings of the 5th International Conference on Fuzzy Systems and Knowledge Discovery, Ji'nan, Shandong.IEEE, 2008: 170-174.
10STEYX [EB/OL]. [2013-11-20]. http://office.microsoft.com/ zh-cn/excel-help/HP010342925.aspx.

引证文献4

1游贵荣,吴为,钱沄涛.电子商务中垃圾评论检测的特征提取方法[J].现代图书情报技术,2014(10):93-100. 被引量：14
2杜思奇,李红莲,吕学强.汉语组块分析在情感分类中的应用研究[J].计算机应用与软件,2016,33(10):167-171.
3邵允学,周建涛.智能化方法在课程评价中的应用前景[J].计算机教育,2017(8):152-154. 被引量：2
4胡晓欧.词性分析C4.5算法的候选属性规则优化[J].科技通报,2016,32(7):172-175.

二级引证文献16

1汪俊,赵坤坤,计一凡.垃圾评论识别的数学建模[J].科技创新与应用,2015,5(26):28-29.
2陈元,赵静.基于WEB用户产品评论的企业竞争情报挖掘实证研究[J].情报科学,2016,34(4):80-85. 被引量：11
3梁曌,陈思宇,梁小林,康欣.基于KNN和Bayes算法的组合分类器的垃圾评论识别研究[J].经济数学,2016,33(1):36-41. 被引量：1
4张艳丰,李贺,翟倩,彭丽徽.基于模糊TOPSIS分析的在线评论有用性排序过滤模型研究——以亚马逊手机评论为例[J].图书情报工作,2016,60(13):109-117. 被引量：13
5昝红英,毕银龙,石金铭.基于Adaboost算法与规则匹配的垃圾评论识别[J].郑州大学学报（理学版）,2017,49(1):24-28. 被引量：2
6董敏,王琨.基于语义分析的电子商务产品用户评价分析与研究[J].商场现代化,2017,0(11):64-65. 被引量：1
7彭丽徽,李贺,张艳丰,陈远方.基于品牌声誉感知差异的在线评论有用性影响因素实证研究[J].情报科学,2017,35(9):159-164. 被引量：24
8游贵荣,陈杰.一种高校图书馆新书个性化推荐方法[J].兰州文理学院学报（自然科学版）,2017,31(5):66-70. 被引量：1
9魏伟,康准.基于随机森林和规则匹配的垃圾评论识别[J].软件,2017,38(12):90-94.
10王志波,胡佳慧,王骞.基于众包思想的实时教学评价模式探索[J].计算机教育,2018(1):36-38. 被引量：3

1胡晓欧.词性分析C4.5算法的候选属性规则优化[J].科技通报,2016,32(7):172-175.
2田凯.试析企业的新产品研发管理[J].中国科技博览,2013(37):68-68.
3黄小斌,余悦蒙.一种词法分析与字标注分词结合的方法[J].电脑知识与技术（过刊）,2012,18(3X):1814-1817. 被引量：1
4余小军,刘峰,张春.基于N-Gram文本特征提取的改进算法[J].现代计算机,2012,18(23):3-7. 被引量：9
5宇文姝丽.基于词性分析的数据流程图快速绘制方法[J].电子商务,2016,17(1):64-65. 被引量：2
6魏勇刚,张国春,常勇,袁方.基于词性分析和领域知识的Deep Web语义标注[J].郑州大学学报（理学版）,2009,41(1):52-55. 被引量：7
7徐卫英.信息发布系统的设计与实现[J].电脑知识与技术,2012,8(10):6867-6868.
8于娟,党延忠.结合词性分析与串频统计的词语提取方法[J].系统工程理论与实践,2010,30(1):105-111. 被引量：19
9崇阳.云计算的数据挖掘应用分析[J].计算机光盘软件与应用,2014,17(9):30-31. 被引量：4
10王劼.三维测量技术在新产品开发中的应用[J].河南科技,2010,29(10):69-70. 被引量：1

计算机工程与设计

2013年第1期

浏览历史

内容加载中请稍等...

基于词性分析的产品评价信息挖掘被引量：4

参考文献13

二级参考文献23

共引文献17

同被引文献49

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于词性分析的产品评价信息挖掘 被引量：4

参考文献13

二级参考文献23

共引文献17

同被引文献49

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于词性分析的产品评价信息挖掘被引量：4