-
题名西方姓名译名的自动识别研究
被引量:1
- 1
-
-
作者
孔祥龙
卢鹏
陆汝占
刘绍明
-
机构
上海交通大学计算机科学与工程系
富士施乐公司研究本部
-
出处
《计算机仿真》
CSCD
2004年第8期145-148,共4页
-
文摘
西方姓名译名的自动识别为汉语自动分词不可或缺的组成部分。该文以西方姓名译名用字信息为基础,充分利用标准词表来限制西方姓名译名的过度生长能力,并使用首尾逼近和局部频率等方法来进一步改善识别效果,并且针对西方姓名译名的特点进行了有针对性的处理。对真实语料进行测试,正确率达到96.87%,召回率达到97.20%。
-
关键词
西方姓名译名
专名识别
标准词表
局部频率
-
Keywords
Transliterated person names
Names entity identification
Standard lexicon
Local frequency
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-
-
题名结合决策树方法的中文姓名识别
被引量:15
- 2
-
-
作者
王振华
孔祥龙
陆汝占
刘绍明
-
机构
上海交通大学计算机科学与工程系
富士施乐公司研究本部
-
出处
《中文信息学报》
CSCD
北大核心
2004年第6期10-15,共6页
-
基金
自然科学基金资助项目 (6 0 4 96 32 6 )
日本富士施乐公司资助项目
-
文摘
中文姓名识别是自然语言处理中专名识别的一个重要的子问题 ,本文将中文姓名的识别过程细分为三个步骤 :抽取阶段、分类阶段和消歧阶段。利用中文姓和名的用字概率信息 ,在文本中抽取潜在的中文姓名 ,以及其相关的上下文词法、语法和语义特征 ,并将潜在姓名是否是真实姓名的判别看作是两分类问题 ,并利用决策树算法来实现初步判别 ,最后消除初步判别结果中的歧义现象。实验结果表明 ,该方法的召回率和准确率都可达到 90 %以上。
-
关键词
人工智能
自然语言处理
中文姓名识别
决策树
自然语言处理
-
Keywords
artificial intelligence
natural language processing
Chinese person name identification
decision tree
natural language processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-