-
题名面向短文本的命名实体识别
被引量:18
- 1
-
-
作者
王丹
樊兴华
-
机构
重庆邮电大学计算机科学与技术研究所
-
出处
《计算机应用》
CSCD
北大核心
2009年第1期143-145,171,共4页
-
基金
国家自然科学基金资助项目(60703010)
重庆市自然科学基金资助项目(2006BB2374)
+1 种基金
重庆市教委科学技术研究项目(KJ070519)
教育部回国留学人员启动基金资助项目(教外司留【2007】1109号)
-
文摘
针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。
-
关键词
短文本
隐马尔可夫模型
命名实体识别
拼音同指关系库
词性
-
Keywords
short text
Hidden Markov Model (HMM)
named entity recognition
pinyin co-referential relation library
part of speech
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-