-
题名融合BERT与LDA的在线课程评论关键词提取方法
被引量:1
- 1
-
-
作者
尼格拉木·买斯木江
艾孜尔古丽·玉素甫
-
机构
新疆师范大学计算机科学技术学院
新疆师范大学计算机科学技术学院国家语言资源监测与研究少数民族语言中心
-
出处
《现代电子技术》
2022年第6期99-104,共6页
-
基金
新疆维吾尔自治区创新环境(人才、基地)建设专项-自然科学计划(少数民族科技人才特殊培养)项目(2022D03004)
国家自然科学基金项目(61662081)
+1 种基金
新疆维吾尔自治区社会科学基金(2016CYY067)
国家社会科学基金项目(14AZD11)。
-
文摘
为了高效提取高度集中、覆盖范围广和差异性明显的慕课网用户评论关键词,文中提出一种融合BERT和LDA⁃TextRank的关键词提取方法。实现关键词提取的第一步是获取候选关键词,在获得候选关键词之前需对爬取的课程评语进行预处理,再通过BERT模型训练得到慕课网在线评语的词向量;然后利用LDA主题模型得到候选关键词的主题分布;最后结合TextRank算法计算各主题的关系词及生成评论文本的词主题挖掘。基于此,文中利用BERT文本表示方法,能够更好地联系不同词语之间的相关性;在传统的LDA主题抽取模型的基础上结合TextRank方法,并在节点运算中通过迭代算法计算各词的得分,将权值的转移概率作为词语之间的相似度,使得关键词提取性能得到了提升。实验结果表明,与传统方法相比,所提方法的困惑程度值明显降低,证实了该方法的有效性。
-
关键词
在线课程评论
关键词提取
语义分析
文本挖掘
相似度计算
结果分析
-
Keywords
online course review
keyword extraction
semantic analysis
text mining
similarity calculation
result analysis
-
分类号
TN915-34
[电子电信—通信与信息系统]
-