-
题名基于主题时态关联的科学领域研究演化识别
被引量:3
- 1
-
-
作者
田依林
李星
-
机构
天津大学教育学院
广西民族师范学院经济与管理学院
-
出处
《情报科学》
CSSCI
北大核心
2021年第5期146-155,共10页
-
基金
国家社会科学基金一般项目“基于复合数据的科技信息跨维度挖掘与推荐研究”(19BTQ063)。
-
文摘
【目的/意义】从主题时态的角度,构建主题时态关联的科学领域研究演化的识别方法,为研究人员精准把握领域发展轨迹和科研创新提供参考。【方法/过程】提出基于主题时态关联的领域研究演化识别三阶段模型。首先利用TF-IDF模型提取领域文献数据集的特征词;再以特征词作为关联规则算法的挖掘条件,生成并过滤主题时态;最后,依据主题时态关联关系和强度值,构建主题时序演化路径可视化图谱进行领域研究演化识别分析。【结果/结论】以在线评论有用性领域外文科技文献为实证研究对象进行主题时态关联演化分析,识别出影响因素有用性、消费者意愿及应用、研究理论技术和有用性排序等主要领域研究的发展演化过程,验证了方法模型的有效性。【创新/局限】清晰地描绘了主题在时间序列上形成、发展和关注强度的动态演化过程,使得主题演进脉络和关联更加具有可读性,但样本数据未实现全覆盖,对领域研究的整体态势分析不够全面。
-
关键词
主题时态
TF-IDF模型
关联规则
层次聚类
研究演化
在线评论
-
Keywords
topic tense
TF-IDF model
association rules
hierarchical clustering
research evolution
online reviewer
-
分类号
G250.2
[文化科学—图书馆学]
-
-
题名时态主题模型方法及应用研究综述
被引量:11
- 2
-
-
作者
桂小庆
张俊
张晓民
于鹏飞
-
机构
大连海事大学信息科学技术学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第2期46-55,共10页
-
基金
国家自然科学基金(61073057
61370070)资助
-
文摘
互联网技术的飞速发展使得数据的规模达到了空前的水平,人们从海量数据中获取有价值的信息变得越来越困难。主题模型是近年来计算机领域出现的一种新的概率模型,在自然语言处理、文本挖掘以及信息检索等领域都有很广泛的应用。基于主题模型的主题追踪技术和时态分析技术可以帮助人们从海量数据中快速找到感兴趣的内容,时态主题模型逐渐成为计算机科学领域的一个研究热点。首先,介绍主题模型以及时态主题模型的基本概念;然后,对各种时态主题模型进行分类,介绍了几种具有代表性的时态主题模型,分析比较了各种主题模型的优缺点;接着,分析了时态主题模型在社交媒体、学术文献和数据社区中的应用;最后,对时态主题模型未来的发展趋势进行了探讨。
-
关键词
时态
主题模型
时态主题模型
-
Keywords
Temporality
Topic model
Temporal topic model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-