-
题名介词短语识别中规则与统计方法融合的探讨
被引量:1
- 1
-
-
作者
付禾芳
李朝霞
-
机构
山西忻州师范学院计算机系
-
出处
《现代计算机》
2010年第11期17-20,共4页
-
文摘
在介词短语的识别中,统计学习方法和人工规则方法是人们常采用的两种最主要的方法。在浅层句法分析层次上,基于几种典型模式探讨分析构建介词短语识别模型时,规则方法和统计学习方法的有效结合。指出介词短语特征的提取实质是基于语料的语用规则的一种抽象。提出统计学习方法和人工规则方法的有机结合是未来的发展方向。
-
关键词
自然语言处理
介词短语识别
规则方法
统计学习方法
-
Keywords
Natural Language Processing
Prepositional Phrase Recognition
Artificial Rule Method
Statistical Learning Method
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双向标注融合的汉语最长短语识别方法
被引量:9
- 2
-
-
作者
鉴萍
宗成庆
-
机构
中国科学院自动化研究所模式识别国家重点实验室
-
出处
《智能系统学报》
2009年第5期406-413,共8页
-
基金
国家自然科学基金资助项目(60736014
90820303)
+2 种基金
"十一五"国家科技支撑计划项目(2006BAH03B02)
国家"863"计划资助项目(2006AA010108-4)
中国新加坡数字媒体研究院资助项目
-
文摘
汉语最长短语(最长名词短语和介词短语)具有显著的语言学特点.采用基于分类器的确定性标注方法进行双向标注,其结果能够显示最长短语识别在汉语句子正(由左至右)反(由右至左)2个方向上的互补性.基于此,利用确定性的双向标注技术来识别汉语最长短语,并提出了一种基于"分歧点"的概率融合策略以融合该双向标注结果.实验表明,这一融合算法能够有效发掘这2个方向的互补特性,从而获得较好的短语识别效果.
-
关键词
最长名词短语识别
介词短语识别
序列标注
双向标注
分歧点
-
Keywords
maximal-length noun phrase identification
prepositional phrase identification
sequence labeling
bidi- rectional labeling
fork position
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-