-
题名基于多向量和实体模糊匹配的话题关联识别
被引量:5
- 1
-
-
作者
张晓艳
王挺
陈火旺
-
机构
国防科技大学计算机学院
-
出处
《中文信息学报》
CSCD
北大核心
2008年第1期9-14,共6页
-
基金
国家自然科学基金资助项目(60403050)
新世纪优秀人才支持计划资助项目(NCET-06-0926)
-
文摘
本文在对新闻报道理论分析及实验验证的基础上,提出一种多向量表示模型,使其在尽量不丢失信息的情况下,对特征集合尽可能细地划分。基于该模型,本文设计了一种模糊匹配的方法用于计算命名实体子向量之间的关联度,它们和多个向量相似度一起用支持向量机进行整合,形成报道模型间的相似度。本文选用TDT4中文语料作为测试语料,将上述模型及模糊匹配技术用于话题关联识别。实验表明,多向量模型能够改进话题关联识别的性能,模糊匹配技术也在一定程度上弥补了精确匹配带来的性能损失。
-
关键词
计算机应用
中文信息处理
话题关联识别
多向量表示模型
命名实体模糊匹配
-
Keywords
computer application
Chinese information processing
story link detection
multi-vector model
namedentity fuzzy matching
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-