期刊文献+

基于隐结构感知的并列名词短语识别研究 被引量:3

Research on Coordinate Noun Phrase Identification Based on Latent Structured Perceptron
下载PDF
导出
摘要 针对现有并列名词短语识别不能处理短语序列隐含信息的情况,提出一种新的并列名词短语识别方法。采用隐结构感知模型与条件随机场模型,识别并列名词短语序列以及序列中用于连接并列名词短语的连词和标点。针对并列名词短语序列进行任务描述,建立语料库并选择典型的并列名词短语识别特征进行实验。结果表明,隐结构感知模型由于加入序列中的隐含信息,相比传统条件随机场模型在并列名词短语识别中更有优势,F度量值达到86.36%,进而证明该模型能够用于以信息抽取为导向的并列名词短语识别。 Aiming at the situation that the existing coordinate noun phrase identification cannot deal with the implicit information of the phrase sequence, this paper proposes a new coordinate noun phrase indentificaiton method. Conditional Random Fields (CRF) model and Latent Structured Perceptron (LSP) model are used to identify the sequence of coordinate noun phrases as well as conjunctions and punctuation used to connect coordinate noun phrases in a sequence. In this paper, the task description is firstly carried out for the sequence of coordinate noun phrases. Then the corpus is constructed, and the typical recognition features of the coordinate noun phrase are selected for the experiment. Experimental results show that,compared with traditional CRF model,LSP model with latent information gives superior performance,gains the F score up to 86.36% ,and proves that the model can be used for information extraction oriented coordinate noun phrase identification.
出处 《计算机工程》 CAS CSCD 北大核心 2017年第4期217-221,227,共6页 Computer Engineering
基金 国家自然科学基金重点项目"篇章级中文语义分析理论与方法"(61133012) 国家自然科学基金面上项目"汉语语篇连贯的事件链模型研究"(61373108)
关键词 并列名词短语 隐结构感知 条件随机场 序列识别 边界识别 coordinate noun phrase Latent Structured Perceptron(LSP) Conditional Random Fields(CRF) sequence identification boundary identification
  • 相关文献

参考文献4

二级参考文献20

共引文献69

同被引文献16

引证文献3

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部