-
题名基于LDA与新兴主题特征分析的新兴主题探测研究
被引量:61
- 1
-
-
作者
范云满
马建霞
-
机构
中国科学院兰州文献情报中心
中国医学科学院医学信息研究所
-
出处
《情报学报》
CSSCI
北大核心
2014年第7期698-711,共14页
-
基金
中国科学院西部之光联合学者项目“基于计算情报方法的甘肃省战略新兴产业技术创新竞争与发展研究”
国家自然科学基金项目(项目编号:71373260)的研究成果之一
-
文摘
本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.
-
关键词
隐狄利克雷分布
主题模型
新兴主题
主题特征
新颖度指标
发文量指标
被引量指标
生命周期
-
Keywords
LDA( Latent Diriehlet Allocation) , topic model, emerging topic, topic feature, novelty index, published volume index, citation volume index, life cycle
-
分类号
G353.1
[文化科学—情报学]
-