期刊文献+
共找到141篇文章
< 1 2 8 >
每页显示 20 50 100
基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法
1
作者 刘丹 《微型电脑应用》 2024年第4期195-197,201,共4页
为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表... 为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表,完成社交媒体大数据向量转换的预处理。将预处理获取的向量列表输入CNN网络,得到评论文本情感元最终局部特征值。将该值传至LSTM,通过遗忘门、输入门、输出门调节,获取评论文本情感元特征表征结果,经Softmax分类器分类后,实现情感元自动识别。实验结果表明,该方法能有效完成实验数据预处理,用文字和标签的形式标记正面、负面情感元,并准确识别情感元,间接反映社会问题,应用性较强。 展开更多
关键词 社交媒体数据 评论文本 情感元 向量列表 CNN-LSTM 自动识别
下载PDF
基于Plutchik情感轮的剧集网络评论文本的离散情感评价及有效性分析 被引量:1
2
作者 张鹏 丘萍 丁又专 《中国传媒大学学报(自然科学版)》 2024年第2期44-51,共8页
看剧是一种高强度的情感休闲行为,剧集会激发受众多样而密集的情感,因此对看剧等文化消费的情感体验进行评价时,以离散情感模型作为理论基础会更有效,但目前对影视体验进行情感评价时以PANAS模型为主。基于Plutchik情感轮和NRC情感词典... 看剧是一种高强度的情感休闲行为,剧集会激发受众多样而密集的情感,因此对看剧等文化消费的情感体验进行评价时,以离散情感模型作为理论基础会更有效,但目前对影视体验进行情感评价时以PANAS模型为主。基于Plutchik情感轮和NRC情感词典,构建了影评情感词库。使用Python软件抓取并评价了53部仙侠类、剧情类剧集豆瓣评论文本的离散情感,最后对离散情感评价结果进行了有效性分析。结果发现,一方面剧集网络短评可以用于衡量剧集情感,另一方面基于Plutchik情感轮的离散情感评价方法既可以对剧集进行分类,也比PANAS情感评价方法对剧集质量有更强的解释能力。研究结论可用于影视制片、剧集质量评价和情感营销。 展开更多
关键词 剧集 评论文本 情感评价 Plutchik情感轮
下载PDF
融合注意力机制和评论文本特征的推荐算法
3
作者 潘莹 李浩 +1 位作者 王世辉 许杏 《计算机工程与设计》 北大核心 2024年第9期2764-2770,共7页
为区分基于评论文本推荐算法中不同评论文本数据对不同用户或物品的差异,提出一种融合注意力机制和评论文本特征的推荐算法(RAAM)。在卷积神经网络中加入三级注意力机制,分别从单词级别、语句级别和评论级别为不同用户或物品区分评论数... 为区分基于评论文本推荐算法中不同评论文本数据对不同用户或物品的差异,提出一种融合注意力机制和评论文本特征的推荐算法(RAAM)。在卷积神经网络中加入三级注意力机制,分别从单词级别、语句级别和评论级别为不同用户或物品区分评论数据的重要性,引入共同注意力网络模拟用户与物品之间的交互,获取更多用户和物品的交互信息,提高推荐效果。在Amazon的5个数据集上的对比实验结果验证了算法的有效性。 展开更多
关键词 推荐算法 注意力机制 共同注意力网络 评论文本 评分预测 文本特征 卷积神经网络
下载PDF
基于电影评论文本的LSTM情感分析
4
作者 刘晏男 杨凯 董小刚 《长春工业大学学报》 CAS 2024年第3期233-240,共8页
首先使用CBOW算法对通过Python爬取的评论进行了高效且低维的向量表示,然后采用LSTM模型对这些向量进行训练。通过实验对比了LSTM模型与朴素贝叶斯、决策树、随机森林以及RNN在预测能力方面的表现,并提供了全面的模型比较。实验结果表明... 首先使用CBOW算法对通过Python爬取的评论进行了高效且低维的向量表示,然后采用LSTM模型对这些向量进行训练。通过实验对比了LSTM模型与朴素贝叶斯、决策树、随机森林以及RNN在预测能力方面的表现,并提供了全面的模型比较。实验结果表明,LSTM模型的准确率更高,具有一定的适用性。 展开更多
关键词 长短期记忆神经网络模型 Word2vec 评论文本 情感分析
下载PDF
基于评分矩阵与评论文本融合的混合推荐模型
5
作者 周梁 《蚌埠学院学报》 2024年第2期107-113,共7页
推荐系统已在电子商务中迅速推广应用,其带来的数据稀疏性增加了评分预测的不准确因素。提出了一种将评分和评论文本相融合的混合推荐模型(MRB),将用户偏好影响因子引入用户评分预测模型(UBP)中,将项目-时间因子引入项目评分预测模型(I... 推荐系统已在电子商务中迅速推广应用,其带来的数据稀疏性增加了评分预测的不准确因素。提出了一种将评分和评论文本相融合的混合推荐模型(MRB),将用户偏好影响因子引入用户评分预测模型(UBP)中,将项目-时间因子引入项目评分预测模型(IBP)中,通过推荐结果平均绝对误差(MAE)实验验证,当近邻数为50时,该模型明显优于传统的模型。 展开更多
关键词 评分矩阵 矩阵分解 评论文本 平均绝对误差
下载PDF
融合评分矩阵与评论文本的商品推荐模型 被引量:28
6
作者 李琳 刘锦行 +3 位作者 孟祥福 苏畅 李鑫 钟珞 《计算机学报》 EI CSCD 北大核心 2018年第7期1559-1573,共15页
随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文... 随着电子商务的迅速发展和Web上信息的不断增长,推荐系统成为有效帮助用户做出决策的重要智能软件之一.基于评分数据的矩阵分解推荐模型被广泛研究和应用,但数据稀疏性问题影响了该模型的推荐质量.另一方面推荐系统中用户撰写的评论文本可以反映用户的兴趣偏好,有研究工作提出了相应的文本分析及观点挖掘方法来缓解评分数据的稀疏性.评分矩阵分解模型与评论文本挖掘模型的融合有助于提高推荐质量,因此该文首先提出了一种融合评分数值和评论文本的推荐模型DTMF(Double Topics with Matrix Factorization),将用户评论集和商品评论集各自的潜在主题向量分别与传统矩阵分解的用户潜在因子向量和商品潜在因子向量建立正向映射关系,然后通过添加潜在主题为预测评分引导项进一步优化DTMF模型提出了DTMF+模型.在两组公开数据集上,以推荐结果的均方误差(MSE)为评估指标进行了实验验证.实验结果表明本文提出的DTMF和DTMF+两个模型整体上优于仅融入商品评论集的HFT(Hidden Factors as Topics)(item)模型,在子类数据上预测误差最大分别降低了3.68%和7.31%.该文最后探讨了有用性评论排序问题来增强推荐结果的可解释性. 展开更多
关键词 评分矩阵 评论文本 矩阵分解 主题模型 均方误差
下载PDF
一种基于LDA主题模型的评论文本情感分类方法 被引量:8
7
作者 王伟 周咏梅 +2 位作者 阳爱民 周剑峰 林江豪 《数据采集与处理》 CSCD 北大核心 2017年第3期629-635,共7页
针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信... 针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信息中的关键特征,并融入到情感向量空间中。最后利用机器学习分类算法,实现中文评论文本的情感分类。实验结果表明,提出的方法有效降低了特征向量的维度,并且在文本情感分类上有很好的效果。 展开更多
关键词 评论文本 情感单元 潜在主题 情感分析 机器学习
下载PDF
E-learning评论文本的情感分类研究 被引量:8
8
作者 潘怡 叶辉 邹军华 《开放教育研究》 CSSCI 北大核心 2014年第2期88-94,共7页
自本世纪初起,E—learning作为一种灵活、丰富、高效的学习方式,被越来越多的学习者接受,而伴随着学习技术的逐步成熟,学习者对E—learning应用的要求也从最初的知识推送提升到能够在讲授者与学习者之间搭建有效的沟通桥梁,将零反馈的... 自本世纪初起,E—learning作为一种灵活、丰富、高效的学习方式,被越来越多的学习者接受,而伴随着学习技术的逐步成熟,学习者对E—learning应用的要求也从最初的知识推送提升到能够在讲授者与学习者之间搭建有效的沟通桥梁,将零反馈的封闭式学习变成多反馈的协作学习。E—learning的评论信息隐含了学习者在学习中遇到的问题和建议,从中可挖掘学习者对学习资源及授课者的意见。这对改善教学模式、完善教学支持服务意义重要。现有E—learning系统所提供的海量评论信息中正面评论与负面评论夹杂,给挖掘学习者的真实意见和需求带来困难。本文对文本情感分类过程进行归纳,构建了一种情感分类应用模型,在完成预处理、创建词典、提取情感特征后实现了一个情感分类引擎,并将该引擎与实际系统整合。改进后的系统能够将学习者的评论文本自动分为正面评论、负面评论和中性评论,实际性能及用户体验评价结果表明,新的基于情感单元的情感分类方法能满足E—learning评论文本的情感分类需求。 展开更多
关键词 E-LEARNING 评论文本 情感分类 情感单元
下载PDF
针对评论文本的情感分析方法 被引量:11
9
作者 杨玉娟 袁欢欢 王永利 《南京理工大学学报》 EI CAS CSCD 北大核心 2019年第3期280-285,291,共7页
为了克服传统基于机器学习的情感分析算法依赖手工建立情感词典、需要进行人工干预的缺点,该文提出1种加权word2vec注意力长短记忆网络(WWAL)情感分析模型。突出评论文本中关键词的作用,在word2vec的基础上引入了术语频率-逆文档频率(TF... 为了克服传统基于机器学习的情感分析算法依赖手工建立情感词典、需要进行人工干预的缺点,该文提出1种加权word2vec注意力长短记忆网络(WWAL)情感分析模型。突出评论文本中关键词的作用,在word2vec的基础上引入了术语频率-逆文档频率(TFIDF)算法形成词向量,同时在长期短期记忆(LSTM)网络模型中加入了注意力机制。在标准数据集上的实验证明,该文WWAL模型的查准率、召回率和F1指标等实验衡量指标均优于传统机器学习方法。 展开更多
关键词 评论文本 情感分析 术语频率-逆文档频率 长期短期记忆 注意力
下载PDF
融合评论文本层级注意力和外积的推荐方法 被引量:10
10
作者 邢长征 赵宏宝 +1 位作者 张全贵 郭亚兰 《计算机科学与探索》 CSCD 北大核心 2020年第6期947-957,共11页
在协同过滤算法中,基于评分数据的矩阵分解方法得到广泛应用和发展,但评分数据稀疏性问题影响了该方法的推荐质量。针对此问题,提出一种联合评论文本层级注意力和外积的推荐方法(RHAOR)。采用两个并行网络,分别处理用户评论集和物品评... 在协同过滤算法中,基于评分数据的矩阵分解方法得到广泛应用和发展,但评分数据稀疏性问题影响了该方法的推荐质量。针对此问题,提出一种联合评论文本层级注意力和外积的推荐方法(RHAOR)。采用两个并行网络,分别处理用户评论集和物品评论集。对评论文本的内容应用主题级注意力机制,标记多组带有主题信息的单词(或短语),对评论集应用评论级注意力机制,标记有效的评论。采用外积为用户偏好和物品特征建立外积交互矩阵,并对此矩阵采用多层卷积神经网络提取外积交互特征。将外积交互特征引入改进的潜在因子模型(LFM)中,进行评分预测。实验结果表明,在Amazon和Yelp数据集上,提出的方法在均方根误差(RMSE)上优于传统基于评分和评论的方法。 展开更多
关键词 协同过滤 数据稀疏性 评论文本 注意力机制 外积
下载PDF
中文在线评论文本分析对生鲜农产品电商影响研究综述 被引量:8
11
作者 冯建英 吴丹丹 +2 位作者 王博 王智 穆维松 《农业机械学报》 EI CAS CSCD 北大核心 2021年第S01期504-512,共9页
深入挖掘和分析生鲜农产品的电商评论数据对于降低消费者的感知风险、辅助消费者决策具有重要意义。首先阐述了中文在线评论文本数据的获取方式、预处理方法、文本表示方法、基于不同模型和技术的文本情感分析等研究进展,然后重点分析... 深入挖掘和分析生鲜农产品的电商评论数据对于降低消费者的感知风险、辅助消费者决策具有重要意义。首先阐述了中文在线评论文本数据的获取方式、预处理方法、文本表示方法、基于不同模型和技术的文本情感分析等研究进展,然后重点分析了评论文本对生鲜农产品销量的影响机制、评论的信息属性和情感属性以及评论矛盾性对生鲜农产品网络销量影响的最新研究成果,并提出未来研究将进一步注重提升评论数据的质量、融合评论中的多模态数据和研究表情符号在情感表达中的作用。 展开更多
关键词 在线评论 评论文本 生鲜农产品 产品销量 情感分析
下载PDF
基于评分矩阵与评论文本的深度推荐模型 被引量:42
12
作者 冯兴杰 曾云泽 《计算机学报》 EI CSCD 北大核心 2020年第5期884-900,共17页
基于评分矩阵的矩阵分解模型被广泛研究与应用,但是数据稀疏性问题严重制约了该模型的推荐效果.基于评论文本的推荐模型能够从文本信息中刻画用户偏好和商品特征,有效缓解了评分数据的稀疏性,但忽略了评分矩阵中用户和商品的潜在因子.... 基于评分矩阵的矩阵分解模型被广泛研究与应用,但是数据稀疏性问题严重制约了该模型的推荐效果.基于评论文本的推荐模型能够从文本信息中刻画用户偏好和商品特征,有效缓解了评分数据的稀疏性,但忽略了评分矩阵中用户和商品的潜在因子.为了进一步提高推荐质量,融合评分矩阵和评论文本的推荐模型被相继提出,但其仅仅局限在浅层线性特征层面,而且用户特征与商品的高级抽象特征未被充分挖掘,因此本文提出深度学习模型DeepCLFM(Deep Collaborative Latent Factor Model).该模型基于预训练的BERT模型,结合双向GRU和注意力机制从用户评论和商品评论中提取用户和商品的深层非线性特征向量,并根据用户和商品的编号映射出用户和商品的潜在隐向量.为了充分融合深层非线性特征和隐特征,DeepCLFM将用户和商品的深层特征向量与潜在隐向量以一、二阶特征项的方式产生深度特征项来预测出用户对商品的评分.在5组公开数据集上,以推荐结果的均方误差MSE作为评估指标进行对比实验,结果表明DeepCLFM的预测误差比多个优秀的基准算法更低,且平均预测误差最大降低了6.402%. 展开更多
关键词 推荐系统 评论文本 评分矩阵 神经网络 冷启动
下载PDF
注意力机制在评论文本情感分析中的应用研究 被引量:5
13
作者 申静波 李井辉 孙丽娜 《计算机技术与发展》 2020年第7期169-173,共5页
长短期记忆神经网络(long short term memory,LSTM)在文本情感分类的准确率方面拥有优秀的表现,能够解决基于长文本序列的模型训练过程中的梯度消失和梯度爆炸等问题。针对传统的LSTM分类模型不能突出体现输出的某个词语对分类类别的贡... 长短期记忆神经网络(long short term memory,LSTM)在文本情感分类的准确率方面拥有优秀的表现,能够解决基于长文本序列的模型训练过程中的梯度消失和梯度爆炸等问题。针对传统的LSTM分类模型不能突出体现输出的某个词语对分类类别的贡献程度和重要性的现象,在循环神经网络(RNN)变体长短期记忆人工神经网络(LSTM)隐藏层和输出层之间引入注意力机制,其主要目的是在模型做最后的极性分类预测时,在重要的句子成分加上权重,加大了对最后分类的预测概率的影响因素。实验证明LSTM与注意力机制的融合可突出模型产生动态变化的背景向量以表现出不同输入词语对于输出词语分类的重要性,从而有效提高了分类速率和准确率。 展开更多
关键词 评论文本 情感分析 长短期记忆网络 Seq2Seq模型 注意力机制
下载PDF
联合BiLSTM和CNN的评论文本情感分类模型 被引量:6
14
作者 原福永 常艳鹏 +2 位作者 刘宏阳 雷瑜 黄国言 《燕山大学学报》 CAS 北大核心 2020年第5期502-507,518,共7页
现有的基于神经网络的评论文本分析方法大多数只关注评论的文本信息,而忽略了用户特征和产品特征在确定评论文本情感中的作用。本文提出基于神经网络的模型,采用BiLSTM与CNN结合的方法,把用户特征和产品特征考虑进来,以充分利用用户特... 现有的基于神经网络的评论文本分析方法大多数只关注评论的文本信息,而忽略了用户特征和产品特征在确定评论文本情感中的作用。本文提出基于神经网络的模型,采用BiLSTM与CNN结合的方法,把用户特征和产品特征考虑进来,以充分利用用户特征和产品特征进行情感分析。首先,BiLSTM对文本进行单词级语义编码,在BiLSTM输出层引入注意力机制对用户特征编码,得到评论文本在用户方面的句子表示。然后,使用CNN对句子表示进行句子级语义编码,得到评论文本在用户方面的文档表示。同理,可以得到评论文本在产品方面的文档表示。最后将评论文本在用户和产品方面的文档表示编码在一起,进行情感分类。实验结果表明,在IMDB和Yelp真实数据集的情感分类任务上,本文模型的准确率比对比算法的准确率提高了4.2%~7.8%,验证了用户和产品信息在评论文本分析中的重要性。 展开更多
关键词 卷积神经网络 长短期记忆网络 注意力机制 评论文本 情感分类
下载PDF
基于学习者在线评论文本的MOOC质量评判——以“中国大学MOOC”网的在线评论文本为例 被引量:15
15
作者 张新香 段燕红 《现代教育技术》 CSSCI 北大核心 2020年第9期56-63,共8页
研究在线评论文本,能从学习者角度科学提炼MOOC质量的影响因素,客观评判MOOC的教学效果。基于此,文章提出了基于学习者在线评论文本的MOOC质量评判新思路:按照MOOC质量评判的流程框架,以“中国大学MOOC”网的在线评论文本为例,基于灰色... 研究在线评论文本,能从学习者角度科学提炼MOOC质量的影响因素,客观评判MOOC的教学效果。基于此,文章提出了基于学习者在线评论文本的MOOC质量评判新思路:按照MOOC质量评判的流程框架,以“中国大学MOOC”网的在线评论文本为例,基于灰色关联分析实施MOOC质量评判,并选取10门案例课程检验评判效果。实验结果表明:“视频制作”、“课程内容”、“知识量”、“教学风格”、“学习感受”这5大主题影响学习者对MOOC质量的评判;基于学习者在线评论文本的MOOC质量评判结果与事实基本相符,具有较好的精确度和可操作性,能合理地对课程质量进行评判和排序,对MOOC课程的建设和改善具有重要意义。 展开更多
关键词 MOOC 质量评判 在线评论文本 主题提取 灰色关联分析
下载PDF
融合Sentence-BERT和LDA的评论文本主题识别 被引量:13
16
作者 阮光册 黄韵莹 《现代情报》 CSSCI 2023年第5期46-53,共8页
[目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的... [目的/意义]为了解决评论文本主题识别时语义描述不充分以及学习到的主题语义连贯性不强等问题。本文将Sentence-BERT句子嵌入模型和LDA模型相结合,提升评论文本主题的语义性。[方法/过程]采用Sentence-BERT模型获取评论文本句子层面的向量特征,同时,采用LDA模型获取评论文本的概率主题向量,随后使用自动编码器连接两组向量,运用K-means算法对潜在空间向量进行聚类,从类簇中获取上下文主题信息。[结果/结论]通过对评论文本数据集的实验,本文方法可以较好地获得具有语义信息的主题词。Sentence-BERT模型与LDA结合,增加了模型的复杂性。通过对比,本文方法获得的主题一致性指标(Coherence)优于目前常见的评论文本主题识别方法。 展开更多
关键词 Sentence-BERT LDA模型 评论文本 主题识别
下载PDF
基于密度Canopy的评论文本主题识别方法 被引量:1
17
作者 刘滨 詹世源 +7 位作者 刘宇 雷晓雨 杨雨宽 陈伯轩 刘格格 高歆 皇甫佳悦 陈莉 《河北科技大学学报》 CAS 北大核心 2023年第5期493-501,共9页
融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进... 融合Sentence-BERT和LDA的评论文本主题识别(SBERT-LDA)方法,将LDA的主题数作为K-means算法中的k值,导致算法可解释性较差、主题一致性较低。为了解决上述问题,提出基于密度Canopy的SBERT-LDA优化方法(SBERT-LDA-DC),利用密度Canopy改进Kmeans算法。实验结果表明,提出的方法在一致性指标上要优于使用K-means以及K-means++对特征向量聚类的同类方法;与SBERT-LDA方法相比,在1852条戏剧评论数据集上,一致性指标值提高了22.9%。因此,所提出的SBERT-LDA-DC方法是有效的,对产品或服务提供者更好地了解用户意见、完善自身产品或提升服务水平提供了新方法,具有较强的实际应用价值。 展开更多
关键词 自然语言处理 主题识别 评论文本 Sentence-BERT LDA
下载PDF
融合评分矩阵和评论文本的深度神经网络推荐模型 被引量:7
18
作者 周传华 于猜 鲁勇 《计算机应用研究》 CSCD 北大核心 2021年第4期1058-1061,1068,共5页
针对个性化推荐中用户评分矩阵数据集稀疏,用户和项目描述信息未充分利用的问题,提出融合评分矩阵和评论文本的深度神经网络推荐模型(deep neural network recommendation model,DeepRec)。首先将通过数据预处理得到的用户偏好特征和项... 针对个性化推荐中用户评分矩阵数据集稀疏,用户和项目描述信息未充分利用的问题,提出融合评分矩阵和评论文本的深度神经网络推荐模型(deep neural network recommendation model,DeepRec)。首先将通过数据预处理得到的用户偏好特征和项目属性特征的文本集合分别输入到卷积神经网络进行训练,得到用户和项目的深层次非线性特征,同时将评分矩阵输入多层感知机得到用户偏好隐表示,并对两种模型提取的用户偏好隐表示进行融合;其次利用多层感知机建模用户和项目隐表示对用户进行个性化推荐;最后基于三组数据集以均方根误差为评估指标进行对比实验。结果表明DeepRec的预测误差更低,有效提高了推荐的精准度。 展开更多
关键词 评分矩阵 评论文本 卷积神经网络 多层感知机 数据稀疏
下载PDF
融合信任关系与评论文本的矩阵分解推荐算法 被引量:4
19
作者 李昆仑 翟利娜 +1 位作者 赵佳耀 王萌萌 《小型微型计算机系统》 CSCD 北大核心 2021年第2期285-290,共6页
针对推荐系统中用户评分数据稀疏所导致推荐结果不精确的问题,本文尝试将用户评分、信任关系和项目评论文本信息融合在概率矩阵分解方法中以缓解评分数据稀疏性问题.首先以共同好友数目及项目流行度改进皮尔逊用户偏好相似程度并将其作... 针对推荐系统中用户评分数据稀疏所导致推荐结果不精确的问题,本文尝试将用户评分、信任关系和项目评论文本信息融合在概率矩阵分解方法中以缓解评分数据稀疏性问题.首先以共同好友数目及项目流行度改进皮尔逊用户偏好相似程度并将其作为用户间的直接信任值,然后考虑用户间信任传播过程中所有路径的影响构建新的信任网络;其次通过BERT预训练(Pre-training of Deep Bidirectional Transformers for Language Understanding)模型提取项目的评论文本向量,构造项目的评论文本特征矩阵;最后基于概率矩阵分解(Probabilistic Matrix Factorization,PMF)模型融合用户的评分数据、用户的信任关系以及项目的评论文本信息进行推荐.通过不断的理论分析并在真实的Yelp数据集上进行实验验证,均表明本文算法的有效性. 展开更多
关键词 推荐算法 概率矩阵分解 BERT 直接信任 信任传播 评论文本
下载PDF
结合短文本扩展和BERT的商品评论文本自动分类 被引量:4
20
作者 李湘东 孙倩茹 石健 《信息资源管理学报》 CSSCI 2023年第1期129-139,共11页
针对商品评论文本具有短文本及表述用词不规范的特点,探讨如何实现商品评论文本按照商品种类进行自动归类并提高其分类效果。通过TF-IDF和LDA构建训练集的核心词集,利用Word2Vec相似度计算方式对短文本进行特征扩展获得的商品评论文本... 针对商品评论文本具有短文本及表述用词不规范的特点,探讨如何实现商品评论文本按照商品种类进行自动归类并提高其分类效果。通过TF-IDF和LDA构建训练集的核心词集,利用Word2Vec相似度计算方式对短文本进行特征扩展获得的商品评论文本作为分类对象,基于BERT模型实现分类,并设计相应的对比实验证明本方法的有效性。对商品评论文本扩展后使用BERT分类时,本文方法比未扩展时的F1值提升2.1%,比使用Hownet相似度计算方式扩展时的F1值提升0.9%。从基本原理、不同相似度计算方法以及用词方式等方面分析本方法有效性的原因。本文提出的方法能有效提升商品评论文本按照商品进行信息组织时的分类效果,可以应用于电子商务信息的信息组织及其相关理论方法研究等领域。 展开更多
关键词 商品评论文本 文本 特征扩展 Word2Vec BERT
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部