-
题名一种基于共坐标上升算法的人名识别方法
被引量:2
- 1
-
-
作者
戴播
毛奇
袁春风
-
机构
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机应用与软件》
CSCD
2010年第4期7-9,22,共4页
-
基金
国家863高科技重点项目(2006AA010109)
国家自然科学基金(60673043)
-
文摘
共坐标上升算法(coordinate ascent algorithm)是一种迭代优化技术,可以用来指导特征权值的训练。提出一种基于该算法的中国人名识别方法,避免了已有的一些方法中人为指定特征权值的问题,更好地体现特征之间存在的隐含关系。该方法从基础语料中获取特征库及成名概率词典,在训练语料上提取相应特征后,采用共坐标上升学习算法训练得到特征权重以及成名阈值参数,运用学习得到的各参数对普通文本中的中国人名进行识别。提出的方法无需对训练语料进行人工标注,在人名识别时也无需进行分词和词性标注处理,代价低、性能优良、有较好的实用性,在开放测试集上F1值达到93.02%。
-
关键词
共坐标上升算法
人名识别
特征权重训练
-
Keywords
Coordinate ascent algorithm Name entity recognition Features' weights training
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-