摘要
文章提出一种基于词嵌入和主题建模技术的科学研究前沿识别方法,利用深度学习模型word2vec中词嵌入技术抽取语义近似或同语义概率分配词汇,然后结合LDA主题建模技术进行语义主题建模,对数字人文领域的语义主题建模与前沿主题进行探测,揭示国际数字人文领域在时间维度的动态演变机制和研究热点信息,为我国数字人文的学科部署重点和未来发展提供信息支撑。
In this paper,we propose a method of scientific research frontier recognition based on word embedding and topic modelling technology.We use word embedding technology in word2vec to extract words with similar or similar semantic probability,and then use LDA topic modelling technology to carry out semantic topic modelling and frontier topic detection in the field of digital humanities,and reveal the dynamic evolution mechanism and research hotspot information in time dimension of international digital humanities to provide information support for the development focus and future information development of digital humanities in China.
作者
李晚莲
田俊钦
Li Wanlian;Tian Junqin(Hunan Agricultural University,Changsha,Hunan 410128,China)
出处
《高校图书馆工作》
2021年第3期22-28,共7页
Library Work in Colleges and Universities
基金
国家社会科学基金项目“突发公共事件非理性网络舆论扩散的阻断机制研究”(17BGL180)研究成果之一。
关键词
数字人文
研究前沿
词嵌入
LDA主题建模
趋势分析
Digital humanities
Research frontier
Word embedding
LDA topic modelling
Trend analysis