-
题名有判别力的话题字典动态生成方法
- 1
-
-
作者
吴树芳
朱杰
徐建民
-
机构
河北大学管理学院
天津大学管理与经济学部
中央司法警官学院信息管理系
河北大学计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第9期2723-2726,共4页
-
基金
河北省教育厅青年基金资助项目(QN2015099)
河北省社会科学基金资助项目(HB15TQ013)
+2 种基金
河北大学中西部提升综合实力专项资金资助项目
河北省自然科学基金资助项目(F2015201142)
国家社会科学基金资助课题(17BTQ068)
-
文摘
话题字典是话题的描述特征子集,有判别力的话题字典可以在降低特征维数的同时提高对话题描述的准确性,进而提高话题识别与追踪的综合性能。以互信息为研究基础,提出了确定话题初始字典规模的目标函数,并采用坐标下降法对其求解,考虑到新闻话题是随时间动态变化、发展的,给出了融合时间信息的话题字典动态更新方法,最终得到有辨别力的话题字典。实验在TDT语料上,以漏报率、误报率为评价标准,比较了增量式TF-IDF方法与提出的话题字典生成方法的性能。实验结果显示,提出的话题字典生成方法的性能较优。
-
关键词
话题字典
互信息
动态更新
目标函数
-
Keywords
topic dictionary
mutual information
dynamic updating
objective function
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-