基于互自扩展模式的中文产品属性提取算法被引量：3

Feature extraction method based on mutual self-expanding mode

下载PDF

导出

摘要针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法。利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词;在每一轮迭代中,通过计算提取词与提取模式的置信度确保了算法的准确性,同时避免了主题偏移。最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率。实验结果表明,该算法对产品属性提取的F值可以达到78.97%,结果优于其他类似的提取算法。 This paper proposed a feature extraction method based on mutual self-expanding in Chinese product comment. With little manual work, this method found seed features by FP-Growth, then found the other new features by an incremental iterative procedure. During the iteration, the confidence coefficient of the extracted-word and the extracted-mode insured a high precision, avoided deviating theme at the same time. At last, this method found combination extracted-word by similarity ex- tracted-mode. It could reduce many feature extraction mistakes caused by word segmentation technology and part-of-speech tagging technology, and got a high precision with reducing little recall rate. The experimental results indicate that the F-score of the proposed method for product feature extraction can be 78.97%, is better than the other method of the literatures of this paper.

作者于明朕那日萨

机构地区大连理工大学管理与经济学部

出处《计算机应用研究》 CSCD 北大核心 2017年第4期977-980,共4页 Application Research of Computers

基金国家自然科学基金面上项目(61471083) 国家教育部人文社科研究规划基金资助项目(14YJA630044)

关键词在线评论产品属性提取互自扩展 FP-GROWTH算法置信度 online comment product features extraction mutual sel-expanding FP-Growth method confidence coefficient

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1栗春亮,朱艳辉,徐叶强.中文产品评论中属性词抽取方法研究[J].计算机工程,2011,37(12):26-28. 被引量：12
2李实,叶强,李一军,罗嗣卿.挖掘中文网络客户评论的产品特征及情感倾向[J].计算机应用研究,2010,27(8):3016-3019. 被引量：69
3刘鸿宇,赵妍妍,秦兵,刘挺.评价对象抽取及其倾向性分析[J].中文信息学报,2010,24(1):84-88. 被引量：99

二级参考文献34

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
2姚天昉,聂青阳,李建超,李林琳,陈柯,付宁.一个用于汉语汽车评论的意见挖掘系统[C]//中文信息处理前沿进展-中国中文信息学会二十五周年学术会议论文集.北京:清华大学出版社,2006:260-281.
3赵军,许洪波,黄萱菁,谭松波,刘康,张奇.中文倾向性分析评测技术报告[C]//第一届中文倾向性分析评测会议(The First Chinese Opinion Analysis Evaluation).COAE,2008.
4Hong Yu, Vasileios Hatzivassiloglou. Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences [C]//Proceedings of EMNLP 2003,2003: 129-136.
5Ellen Riloff, Janyce Wiebe, William Phillips. Exploiting subjectivity classification to improve information extraction [ C ]//Proceedings of AAAI-2005, 2005: 1106-1111.
6Minqing Hu,Bing Liu. Mining opinion features in customer reviews[C]//Proceedings of AAAI-2004,2004: 755-760.
7倪茂树,林鸿飞.基于关联规则和极性分析的商品评论挖掘[C]//第三届全国信息检索与内容安全学术会议,2007:635-642.
8Soo-Min Kim,Eduard Hovy. Automatic detection of opinion bearing words and sentences[C]//Proceedings of IJCNLP-2005,2005 : 61-66.
9Jun Zhao,Kang Liu,GenWang. Adding redundant features for crfs based sentence sentiment classification [C]//Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing, 2008: 117-126.
10Minqing Hu, Bing Liu. Mining and summarizing customer reviews [C]//Proceedings of KDD-2004, 2004 : 168-177.

共引文献173

1吴杭鑫,张云华.基于词嵌入和自注意力机制的方面提取算法[J].智能计算机与应用,2021,11(4):25-29.
2赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：539
3文能,丁晟春.商品主观评论信息的倾向性分析综述[J].情报杂志,2010,29(12):70-74. 被引量：2
4张莉,钱玲飞,许鑫.基于核心句及句法关系的评价对象抽取[J].中文信息学报,2011,25(3):23-29. 被引量：22
5孙文俊,潘明暘,叶强.基于T统计量的一种改进关联规则挖掘方法[J].计算机应用研究,2011,28(6):2073-2077. 被引量：6
6张丽,张蕾,张阳,戢妍.基于中文分词和词频统计的图书在线评论文本分析[J].信息系统工程,2011,24(7):71-73. 被引量：14
7徐冰,赵铁军,王山雨,郑德权.基于浅层句法特征的评价对象抽取研究[J].自动化学报,2011,37(10):1241-1247. 被引量：48
8魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323. 被引量：70
9邱云飞,王雪,邵良杉.基于中文网络客户评论的消费者行为分析方法[J].现代情报,2012,32(1):8-11. 被引量：6
10王素格,吴苏红.基于依存关系的旅游景点评论的特征-观点对抽取[J].中文信息学报,2012,26(3):116-121. 被引量：17

同被引文献23

1涂鼎,陈岭,陈根才,吴勇,王敬昌.基于多路层次聚类的商品评论数据概念分类构建[J].计算机研究与发展,2013,50(S2):208-215. 被引量：3
2姚天昉,程希文,徐飞玉,汉思·乌思克尔特,王睿.文本意见挖掘综述[J].中文信息学报,2008,22(3):71-80. 被引量：106
3李实,叶强,李一军,RobLaw.中文网络客户评论的产品特征挖掘方法研究[J].管理科学学报,2009,12(2):142-152. 被引量：129
4田久乐,赵蔚.基于同义词词林的词语相似度计算方法[J].吉林大学学报（信息科学版）,2010,28(6):602-608. 被引量：178
5陈炯,张虎,曹付元,张永奎.面向中文客户评论的产品属性抽取方法研究[J].计算机工程与设计,2012,33(3):1245-1250. 被引量：4
6王振宇,吴泽衡,胡方涛.基于HowNet和PMI的词语情感极性计算[J].计算机工程,2012,38(15):187-189. 被引量：31
7王祖辉,姜维.基于粗糙集的在线评论情感分析模型[J].计算机工程,2012,38(16):1-4. 被引量：3
8陆军,洪宇,陆剑江,姚建民,朱巧明.基于全局用户意图的评论自动估价方法研究[J].中文信息学报,2012,26(5):79-87. 被引量：5
9谭文堂,朱洪,葛斌,李芳芳,肖卫东.垃圾评论自动过滤方法[J].国防科技大学学报,2012,34(5):153-157. 被引量：15
10姜巍,张莉,戴翼,蒋竞,王刚.面向用户需求获取的在线评论有用性分析[J].计算机学报,2013,36(1):119-131. 被引量：56

引证文献3

1谭文斌.基于产品属性的评论语句聚类分析算法[J].贵州科学,2017,35(6):79-82.
2冯进展,蔡淑琴.融合信息增益和梯度下降算法的在线评论有用程度预测模型[J].计算机科学,2020,47(10):69-74. 被引量：3
3薛晨杰,黄义兵,王召义.在线评论产品属性提取文献综述[J].现代商业,2023(1):168-172. 被引量：1

二级引证文献4

1张瑞,何禄鑫,黄炜.多特征融合下视频网站弹幕信息有用性检测研究[J].现代情报,2022,42(4):99-109. 被引量：4
2白宁.酒店服务机器人拟人化与在线评论类型对顾客消费意愿的影响[J].商业经济研究,2023(12):181-184. 被引量：3
3吴健健,李文畅,时宏伟.利用多维评分进行在线评论的有用性预测[J].计算机系统应用,2023,32(12):21-31.
4杨知玲,谭树杰.不确定大数据流分类的决策树模型构建仿真[J].计算机仿真,2024,41(5):532-535.

1苗晴,唐斌兵,周海银.基于最小二乘增量迭代正则化方法的图像复原[J].计算机应用,2005,25(12):2827-2829. 被引量：4
2韩承双.增量迭代的软件开发方法[J].合肥工业大学学报（自然科学版）,2004,27(6):714-717. 被引量：2
3吉文龙,刘耀军.一种基于信誉兴趣区间划分的数据优化查询算法[J].科技通报,2012,28(12):116-118.
4罗晓东,王换招,和海莲.UML建模过程中获取用例的增量迭代方法[J].微型电脑应用,2007,23(8):58-61.
5梁俊卿.基于动作图像特征的人体运动行为挖掘算法[J].计算机仿真,2013,30(9):424-427. 被引量：2
6陈玥文,赵亮.浅谈增量迭代模型中的基线管理活动[J].中小企业管理与科技,2016,0(13):39-40.
7黄复贤.游戏软件的一种敏捷开发方法[J].电子科技,2005,18(7):53-56.
8马莹莹,王黎明,王世卿.基于MapReduce的并行增量迭代支持向量机算法[J].计算机应用与软件,2015,32(4):288-291. 被引量：1
9熊皓,刘群,吕雅娟.基于图模型的语义角色标注重排序[J].中文信息学报,2013,27(5):51-59.
10王世安.基于敏捷开发的构件化软件可靠性研究[J].微电子学与计算机,2011,28(3):119-122. 被引量：6

计算机应用研究

2017年第4期

浏览历史

内容加载中请稍等...

基于互自扩展模式的中文产品属性提取算法被引量：3

参考文献3

二级参考文献34

共引文献173

同被引文献23

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于互自扩展模式的中文产品属性提取算法 被引量：3

参考文献3

二级参考文献34

共引文献173

同被引文献23

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于互自扩展模式的中文产品属性提取算法被引量：3