期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于ARIMA模型的信息构建研究主题趋势预测研究 被引量:21
1
作者 岳丽欣 周晓英 陈旖旎 《图书情报知识》 CSSCI 北大核心 2019年第5期54-63,72,共11页
[目的/意义]识别某学科领域期刊论文中蕴含的主要研究主题并预测其发展趋势,有助于掌握学科领域的研究热点和研究动态,对于深入分析领域发展趋势具有一定的意义。[研究设计/方法]首先利用LDA模型进行主题识别,并通过自定义函数获取各个... [目的/意义]识别某学科领域期刊论文中蕴含的主要研究主题并预测其发展趋势,有助于掌握学科领域的研究热点和研究动态,对于深入分析领域发展趋势具有一定的意义。[研究设计/方法]首先利用LDA模型进行主题识别,并通过自定义函数获取各个主题的年度概率分布,从而得到主题变化时间序列数据;而后建立ARIMA模型对信息构建领域的主要主题时间序列进行预测分析。[结论/发现]目前国内信息构建领域信息构建评价指标、信息组织、网络信息和知识构建等研究主题呈现良好的发展势头。[创新/价值]将ARIMA模型应用于信息构建领域,一方面对近20年国内信息构建领域研究主题加以识别并对主要主题的演变趋势进行预测,为信息构建与主题预测有关研究提供参考借鉴,另一方面也验证了本文提出的主题预测方法的可行性和有效性。 展开更多
关键词 差分整合移动平均回归模型(ARIMA模型) 信息构建 研究主题识别 趋势预测 可视化
下载PDF
基于深度文本聚类的论文与专利数据融合方法研究 被引量:1
2
作者 谢士尧 王小梅 《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第4期112-124,共13页
【目的】克服论文与专利之间语言特征差异的障碍,将论文和专利数据按照研究主题集成融合。【方法】以维基百科为基本分类体系,通过半自动方式构建少量标注集,设计半监督深度文本聚类模型,将相似主题的论文与专利聚类融合,设计指标评估... 【目的】克服论文与专利之间语言特征差异的障碍,将论文和专利数据按照研究主题集成融合。【方法】以维基百科为基本分类体系,通过半自动方式构建少量标注集,设计半监督深度文本聚类模型,将相似主题的论文与专利聚类融合,设计指标评估数据融合结果的质量。【结果】所提模型在两个数据集上的聚类准确率比其他基线模型提升了2.4~11.9个百分点,数据融合结果的质量评估得分超过0.9,优于基线模型,可以在已知主题的基础上补充研究主题。【局限】未利用融合数据开展实证分析,聚类数目需要人工确定。【结论】所提模型可以从论文和专利差异化的文本中提取与主题相关的特征,有效地实现数据融合。 展开更多
关键词 深度文本聚类 数据融合 论文 专利 研究主题识别
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部