-
题名基于词对主题模型的题名信息自动分类方法研究
- 1
-
-
作者
刘爱琴
董婕
梁雅琨
-
机构
山西大学经济与管理学院
东北大学秦皇岛分校管理学院
山西大学文学院
-
出处
《晋图学刊》
2023年第4期29-38,共10页
-
文摘
从题名抽取关键词,把题名作为基于本体自动分类的文本主体,实现海量科技论文高效、精准地分类,已经成为图书馆事业发展的重要课题。本文利用文本内部词汇的语义关联特性,在高频词和隐含主题两个不同粒度层面,构建了基于BTM模型的题名信息自动分类方法:首先从细粒度层面进行词频统计,提取领域高频词;随后从粗粒度层面进行BTM模型分析,得到主题关键词;之后,将两者去重合并获得领域核心词集;最后,利用SVM算法进行文本分类。该方法有效地实现了知识的快速聚类和关联自动分类,为用户提供了满意度更高的知识发现及相关扩展服务。
-
关键词
题名分类
词对主题模型
支持向量机算法
-
Keywords
title classification
BTM model
SVM algorithm
-
分类号
G254.1
[文化科学—图书馆学]
-