期刊文献+

基于BERT和LDA模型的酒店评论文本挖掘 被引量:6

HOTEL REVIEW TEXT MINING BASED ON BERT AND LDA MODEL
下载PDF
导出
摘要 通过主题模型对酒店评论文本进行文本挖掘,有利于引导酒店管理者和客户对评论信息做出合适的鉴别和判断。提出一种基于预训练的BERT语言模型与LDA主题聚类相结合的方法;利用中文维基百科语料库训练BERT模型并从中获取文本向量,基于深度学习算法对评论文本进行情感分类;通过LDA模型对分类后的文本进行主题聚类,分别获取不同情感极性文本的特征主题词,进而挖掘出酒店客户最为关注的问题,并对酒店管理者提出具有参考价值的建议。实验结果表明,通过BERT模型获取的文本向量在情感分类任务中表现较好,且BERT-LDA文本挖掘方法能使酒店评论文本的主题更具表达性。 Text mining of hotel review texts through topic models helps guide hotel managers and customers to make appropriate identification and judgments on review information.This paper proposes a method based on the combination of pre-trained BERT language model and LDA topic clustering.We used Chinese Wikipedia corpus to train the BERT model,obtained the text vectors from the BERT structure,and made a sentiment classification of review text by using deep learning algorithms.We established a LDA model to cluster the classified texts to obtain the feature topic words of the texts with different sentiment polarity,digged out the most concerned issues of hotel customers,and put forward suggestions with reference value for hotel managers.The experimental results show that the vectors obtained by the BERT model performs better in sentiment classification task and the proposed BERT-LDA text mining method makes the topic of hotel review texts more expressive.
作者 綦方中 田宇阳 Qi Fangzhong;Tian Yuyang(School of Management,Zhejiang University of Technology,Hangzhou 310023,Zhejiang,China)
出处 《计算机应用与软件》 北大核心 2023年第7期71-76,90,共7页 Computer Applications and Software
基金 国家社科基金项目(18BJY148)。
关键词 BERT LDA主题模型 情感分类 文本挖掘 酒店评论 BERT LDA topic model Sentiment classification Text mining Hotel reviews
  • 相关文献

参考文献12

二级参考文献119

共引文献242

同被引文献59

引证文献6

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部