-
题名一种基于条件随机场的中文公司名识别方法
被引量:2
- 1
-
-
作者
哈寅晨
孟凡坤
-
机构
北京工业大学多媒体与智能软件北京重点实验室
-
出处
《网络安全技术与应用》
2014年第4期13-14,共2页
-
文摘
随着信息化的发展,在智能信息处理领域,对自然语言处理的要求在不断提高,其中命名实体识别是一项极其重要的研究课题。本文在对信息产业新闻本文深入地研究和分析的基础上,总结出了公司名称的基本特点,分别针对公司名全称和简称,设计了不同的两种标注方式,并提出了一种基于条件随机场的双模型两次扫描识别策略,第一次扫描使用公司名全称识别模型,同时提取出公司名关键字;第二次扫描利用第一次扫描中提取出的公司名关键词改善分词和词性标注结果,在此基础上使用公司名全简称识别模型对公司名进行识别。最终的实验结果表明这种识别方法是有效的。
-
关键词
命名实体识别
信息抽取
公司名
条件随机场
-
Keywords
Named Entity Identification
Information Extraction
Company Name
Conditional Random Fields
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-