-
题名基于多特征融合的财经新闻话题检测研究
被引量:6
- 1
-
-
作者
谭梦婕
吕鑫
陶飞飞
-
机构
河海大学计算机与信息学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期293-299,308,共8页
-
基金
国家重点研发计划(2016YFC0400910)
国家自然科学基金面上项目(61272543)
NSFC-广东联合基金重点项目(U1301252)
-
文摘
为辅助投资者在短期内及时发现投资热点,结合财经新闻的特点,提出一种财经新闻话题检测模型。构建基于财经新闻的时间窗切分新闻流,根据新闻文本中的主题事件、特征词、新闻语义及金融命名实体提取文本特征,并应用最近邻-凝聚层次聚类算法获得话题簇。实验结果表明,与传统多特征话题检测模型相比,该模型可有效降低聚类算法运行时间,提高话题检测准确度,且在一定程度上协助投资者进行决策判断。
-
关键词
财经新闻
话题检测
多特征融合
凝聚层次聚类
K最近邻
-
Keywords
financial news
topic detection
multi-feature fusion
Hierarchical Agglomerative Clustering(HAC)
K-Nearest Neighbor(KNN)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-