期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
边界模板和局部统计相结合的中国人名识别 被引量:13
1
作者 李中国 刘颖 《中文信息学报》 CSCD 北大核心 2006年第5期44-50,共7页
本文提出了一种基于篇章信息的中国人名识别算法。我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源。识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇文章以召回数据稀疏导致的遗漏... 本文提出了一种基于篇章信息的中国人名识别算法。我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源。识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇文章以召回数据稀疏导致的遗漏人名。然后应用上下文局部统计量及几条启发式规则对识别结果进行边界校正。该算法具有线性时间复杂度,大规模开放测试(针对1354篇新闻报道约304万字,含人名3.7万个)的正确率为94.52%,召回率为98.97%,效果非常令人满意。 展开更多
关键词 计算机应用 中文信息处理 人名识别 命名实体识别 边界模板 局部统计量 词法分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部