-
题名话题关联识别中报道信息的动态扩充研究
被引量:2
- 1
-
-
作者
张晓艳
王挺
-
机构
国防科技大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2009年第11期200-203,241,共5页
-
基金
国家自然科学基金资助项目(60403050)
新世纪优秀人才支持计划(NCET-06-0926)资助
-
文摘
话题关联识别用于判断新闻报道对流中每对中的两篇报道是否描述了同一个话题。为解决其中报道篇幅短小、稀疏问题严重及其内容存在漂移等问题,提出了一种动态信息扩充技术,用于改进报道表示模型。该技术用过去最新的话题相关报道来扩充当前报道,动态更新原有模型。此外,还研究了扩充信息的精化问题,通过有选择地加重一些重要特征的权重来减小扩充过程中噪音带来的影响。该方法在TDT4中的中文语料上进行了实验,结果表明动态信息扩充技术能够较大幅度地改进话题关联识别的性能,对多种特征采取的精化技术也对性能改进产生了较大影响。
-
关键词
话题关联识别
动态信息扩充
报道模型
-
Keywords
Topic detection and tracking, Dynamic information extending, Story representation model
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-