摘要
近年来,如何利用计算机自动、快速、准确地识别大量文本产品评论数据情感倾向是自然语言处理领域关注的重点话题。使用数据抓取软件,抓取亚马逊官网华为honor畅玩版4X手机在线评论进行实验,实验中按照一定的语法规则将每条完整的在线产品评论分成若干子句,识别其中有效子句,提取有效子句评论中多种特征进行组合,然后选用C4.5决策树机器学习法来识别子句的情感倾向,并对多组实验结果进行分析对比。实验结果表明,选择子句中情感词数量和否定词数量作为特征组合时,加权后模型的查准率和查全率均达到96%;程度副词和特殊符号对模型的作用比较微弱,仅有1%的影响;程度副词的作用略优于特殊符号。
出处
《软件导刊》
2017年第5期1-5,共5页
Software Guide
基金
国家社会科学基金项目(71302087)