期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
我国省级科技管理部门官网文本数据的主题建模分析研究 被引量:2
1
作者 赵钰潇 化柏林 《情报理论与实践》 CSSCI 北大核心 2020年第11期116-121,168,共7页
科技情报领域的文本呈现出多源异构的特征,且对于不同省份的科技情报数据,往往同时包含多种不同的主题。文章使用各个省、自治区和直辖市的科技厅局公开数据,使用经过Word2vec进行词向量转换后的LDA2vec进行主题建模,并对结果进行分析... 科技情报领域的文本呈现出多源异构的特征,且对于不同省份的科技情报数据,往往同时包含多种不同的主题。文章使用各个省、自治区和直辖市的科技厅局公开数据,使用经过Word2vec进行词向量转换后的LDA2vec进行主题建模,并对结果进行分析。首先从科技厅官网上爬取多种数据,并进行整合与清洗。随后对数据进行分词和词性标注以进行进一步的筛选。最后通过LDA2vec方法进行建模,并针对各省主题词进行共性分析和差异性分析。通过分析,各个省份的科技情报主题呈现"大同小异"的特点,既有共同的热点主题,反映出对国家政策的一致性和科技发展的时代特点,也有各自突出的主题,反映出区域的管理侧重和发展特色。 展开更多
关键词 科技情报 文本分析 政策文本计算 主题建模 科技管理部门
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部