-
题名不平衡数据集上在线评论有用性识别研究
被引量:1
- 1
-
-
作者
刘嘉宇
李贺
谷莹
时倩如
杨心苗
-
机构
吉林大学商学与管理学院
-
出处
《情报理论与实践》
北大核心
2023年第11期119-125,153,共8页
-
基金
国家自然科学基金面上项目“基于图模型的多源异构在线产品评论数据融合与知识发现研究”的成果,项目编号:71974075。
-
文摘
[目的/意义]先前研究在识别有用性在线评论时假设数据集类是平衡的,但真实数据往往不符合这一假定。为克服这一局限,文章从真实情景出发提出了在不平衡数据集上识别在线评论的有用性,以提升在线评论的效用。[方法/过程]提出不平衡数据集上在线评论有用性识别模型,该模型包括在线评论有用性特征集构建、融合SMOTE和Boosting的有用性识别算法以及识别效果评价等模块,并从真实数据集出发验证了模型的识别效果。[结果/结论]模型在解决类不平衡后准确识别在线评论有用性的综合性能超过89%,优于未解决类不平衡的分类识别算法,为在线评论有用性识别提供了有效的方法和工具。
-
关键词
在线评论
有用性识别
集成学习
不平衡数据集
文本分类
-
Keywords
online reviews
helpfulness identification
ensemble learning
imbalanced dataset
text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多维度图卷积网络的旅游评论有用性识别
- 2
-
-
作者
刘洋
丁星辰
马莉莉
王淳洋
朱立芳
-
机构
武汉大学信息管理学院
武汉大学大数据研究院
武汉大学国家网络安全学院
武汉大学经济与管理学院
广东财经大学人文与传播学院
-
出处
《数据分析与知识发现》
CSCD
北大核心
2023年第8期95-104,共10页
-
基金
国家自然科学基金青年项目(项目编号:72204190)
教育部人文社会科学研究青年基金项目(项目编号:22YJZH114)的研究成果之一。
-
文摘
【目的】利用深度学习模型识别旅游评论的有用性,给予消费者和酒店管理者商业决策参考。【方法】提出多维度图卷积网络和多模态融合的有用性识别模型,使用BERT和MAE模型分别对文本和图片进行预训练,利用多维度图卷积网络对多模态特征进行建模,再通过注意力机制捕捉多模态间的交互信息,最后融入文本特征进行评论有用性识别。【结果】在Yelp数据集上进行对比实验,结果表明所提模型识别准确率为73.21%,相较于传统单模态和现有多模态模型平均提升了10%。【局限】仅在Yelp数据集上尝试文本和图片两种模态,其他数据融合以及更多模态有待研究。【结论】所提模型将多维度的图卷积网络和多模态特征融入评论有用性识别中,可以有效提升识别的效果。
-
关键词
多模态特征
多维度
图卷积网络
旅游评论
有用性识别
-
Keywords
Multi-modal Features
Multi-dimensional
Graph Convolutional Network
Travel Reviews
Usefulness Detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
G350
[文化科学—情报学]
-