-
题名基于错误驱动学习策略的藏语句法功能组块边界识别
被引量:7
- 1
-
-
作者
王天航
史树敏
龙从军
黄河燕
李琳
-
机构
北京理工大学计算机学院
北京市海量语言信息处理与云计算应用工程技术研究中心
中国社会科学院民族学与人类学研究所
-
出处
《中文信息学报》
CSCD
北大核心
2014年第5期170-175,191,共7页
-
基金
国家自然科学基金(61201352
61132009)
+1 种基金
国家重点基础研究发展规划(973)(2013CB329303)
北京理工大学基础研究基金(20130742010)
-
文摘
藏语句法功能组块分析旨在识别出藏语句子的句法成分,为后续句子级深入分析提供支持。根据藏语的语言特点,该文在藏语句法功能组块描述体系基础上,提出基于错误驱动学习策略的藏语功能组块边界识别方法。具体思路为,首先基于条件随机场(Conditional Random Fields,CRFs)识别组块,然后分别基于转换规则的错误驱动学习(Transformation-based Error-driven Learning,TBL)及基于新特征模板的CRFs错误驱动学习进行二次识别,并对初次结果进行校正,F值分别提高了1.65%、8.36%。最后通过实验分析,进一步将两种错误驱动学习机制融合,在18 073词级的藏语语料上开展实验,识别性能进一步提高,准确率、召回率与F值分别达到94.1%、94.76%与94.43%,充分验证了本文提出方法的有效性。
-
关键词
错误驱动学习
藏语句法功能组块
组块边界识别
CRFS
TBL
-
Keywords
error-driven learning
Tibetan syntactic functional chunk
chunk boundary recognition
CRFs
TBL
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名藏语句法功能组块的边界识别
被引量:9
- 2
-
-
作者
李琳
龙从军
江荻
-
机构
中国社会科学院研究生院
中国社会科学院民族学与人类学研究所
中央民族大学民族语言监测分中心
-
出处
《中文信息学报》
CSCD
北大核心
2013年第6期165-168,共4页
-
基金
基于本体的多策略民汉机器翻译研究项目资助(61132009)
-
文摘
藏语句法功能组块能够很好地描述藏语句子的基本骨架,是连接句法结构与语义描述的重要桥梁。根据藏语句法特点,该文作者提出五种句法功能组块及功能组块边界识别策略。首先描述了藏语句法功能组块的基本特点和标注体系,然后在此基础上提出了一种基于条件随机域(CRFs)模型的功能组块边界识别算法。小规模训练语料的实验结果表明,该方法可以有效的识别出功能组块边界,值得进一步研究。
-
关键词
藏语句法功能组块
组块边界识别
条件随机域模型
-
Keywords
Tibetan functional chunks
chunks boundary detectiom CRFs
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-