期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于查询向量的英语话题跟踪研究 被引量:8
1
作者 赵华 赵铁军 +1 位作者 于浩 郑德权 《计算机研究与发展》 EI CSCD 北大核心 2007年第8期1412-1417,共6页
通过分析英语新闻报道的特点,提出了一种基于词汇区分和位置特征相结合的特征项抽取算法.词汇区分是指将单词分为首字母是大写的单词和首字母不是大写的单词,位置特征利用新闻报道的倒金字塔式的结构特点决定单词的重要性.提出了一种基... 通过分析英语新闻报道的特点,提出了一种基于词汇区分和位置特征相结合的特征项抽取算法.词汇区分是指将单词分为首字母是大写的单词和首字母不是大写的单词,位置特征利用新闻报道的倒金字塔式的结构特点决定单词的重要性.提出了一种基于多个特征项抽取算法融合的特征项权值计算方法,该方法认为被越多的特征项抽取算法选中的特征项越重要.提出了一种基于多数投票策略的双重过滤算法,对报道和话题是否相关进行两次过滤,大大降低了系统的误报率.实验表明提出的3种算法不但取得了很好的效果,而且具有很好的可扩展性. 展开更多
关键词 话题跟踪 词汇区分 多数投票策略 双重过滤 归一化检测开销
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部