-
题名藏语依存树库构建的理论与方法探析
被引量:11
- 1
-
-
作者
扎西加
多拉
-
机构
西藏大学藏文信息技术研究中心
西北民族大学中国藏文典籍全文数字化研究所
-
出处
《西藏大学学报(社会科学版)》
CSSCI
2015年第5期76-83,共8页
-
基金
2012年度国家自然科学基金项目"藏语依存树库的构建"(项目号:61163043)
2014年度国家哲学社会科学基金重大项目"基于地理信息平台的藏语方言数据库建设"(项目号:14ZDB101)
+1 种基金
2015年度西藏自治区高校青年教师创新支持计划项目"经典藏文文献标注语料库建设与词汇计量研究"(项目号:QC2015-19)
2015年度西藏大学珠峰学者人才发展支持计划主体计划"杰出青年学者"项目阶段性成果
-
文摘
依存语法又称"从属关系语法",研究句子各构成成分之间的支配和从属关系。依存结构是指句子中词与词之间的句法结构关系,该结构以树状结构进行描述,被称之为依存结构树库。文章以依存语法的理论框架作为藏语树库构建的理论指导,充分借鉴依存语法的思想精髓,结合藏语语法体系,设立出符合藏语语法体系的句法和语义标注关系体系,设计了判别式的句法分析算法,从而构建了多维视窗的藏语依存树库。具体分析时,首先,对依存语法的由来、定义、依存关系的适用性等背景知识做了简要的阐释;其次,在藏语句子的筛选、藏语依存结构的形式化模型、藏语依存的骨架结构以及藏语依存树的多维关系等方面进行了研究和分析。
-
关键词
依存语法
藏语树库
藏语句法分析
藏语语义分析
-
Keywords
dependency grammar
tibetan treebank
tibetan syntactic analysis
tibetan semantic analysis
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名面向机器翻译的藏语短语句法研究
被引量:5
- 2
-
-
作者
万福成
于洪志
吴玺宏
何向真
-
机构
西北民族大学中国民族信息技术研究院国家民委教育部重点实验室
北京大学机器感知与智能重点实验室言语听觉研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第13期211-215,250,共6页
-
基金
国家科技支撑计划项目(No.2015BAD29B01)
甘肃省民族语言智能处理重点实验室(西北民族大学)基金
-
文摘
针对现代藏语句法,在参照宾大中文树库的基础上,构建藏语短语句法树库,并建立了树库编辑工具,为藏汉机器翻译服务。在短语句法树库的基础上,提出一种融合藏语句法特征的藏汉机器翻译方法。实验分析结果表明,该方法可以很好地应用于藏汉机器翻译系统。
-
关键词
句法树库
藏语句法
藏汉机器翻译
-
Keywords
syntactic treebank
tibetan syntax
tibetan-Chinese machine translation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词对依存分类的藏语树库半自动构建研究
被引量:8
- 3
-
-
作者
华却才让
姜文斌
赵海兴
刘群
-
机构
青海师范大学 藏文信息研究中心
陕西师范大学计算机学院
中国科学院计算技术研究所智能信息处理重点实验室
青海师范大学藏文信息研究中心
中国科学院 计算技术研究所智能信息处理重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2013年第5期166-172,共7页
-
基金
国家自然科学基金资助项目(61063033,61163018,61363055)
教育部“春晖计划”合作科研资助项目(Z2012102)
-
文摘
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
-
关键词
藏语依存句法
词对依存分类
藏语树库
藏语依存标注工具
-
Keywords
tibetan dependency syntax
word-pair dependency classification
tibetan treebank
tibetan dependency annotation tool
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于树库转换的藏语依存句法树库构建方法
被引量:1
- 4
-
-
作者
周毛克
龙从军
赵小兵
李林霞
-
机构
中央民族大学中国少数民族语言文学学院
国家语言资源监测与研究少数民族语言中心
中国社会科学院民族学与人类学研究所
中央民族大学信息工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第7期77-85,97,共10页
-
基金
国家语委中心项目(ZDI135-98)
中央民族大学研究生科研实践项目(BZKY2022073)。
-
文摘
构建藏语依存树库是实现藏语句法分析的重要基础,对藏语本体研究和信息处理具有重要价值。基于此,该文提出了一种基于树库转换的藏语依存树库构建方法。该方法首先扩充了前期构建的藏语短语结构树库,然后根据藏语短语结构树和依存树的特征设计树库转换规则,实现藏语短语结构树到依存结构树的初步转换,最后对自动转换结果进行人工校验,得到了2.2万句藏语依存树。为了对转换结果做出量化评价,该文抽取了依存树库中5%的依存树,对其依存关系进行校验和统计,最终依存关系的准确率达到89.36%,中心词的准确率达到92.09%。此外,该文使用基于神经网络的句法分析模型验证了依存树库的有效性。在该模型上,UAS值和LAS值分别达到83.62%和81.90%。研究证明,使用半自动的树库转换方法能够有效地完成藏语依存树库构建工作。
-
关键词
藏语
依存树库
树库转换
-
Keywords
tibetan
dependency treebank
treebank conversion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名藏语依存树库的构建技术研究
被引量:7
- 5
-
-
作者
头旦才让
尼玛扎西
完么扎西
-
机构
西藏大学信息科学技术学院
青海师范大学计算机学院
-
出处
《高原科学研究》
2018年第3期97-103,共7页
-
基金
国家自然科学基金项目(61262051
61866032)
+2 种基金
教育部"春晖计划"(Z2016077)
青海省科技计划项目(2017-GX-146)
青海省基础研究项目(2017-ZJ-767)
-
文摘
藏语依存树库的构建是藏文信息处理研究中的关键技术之一。文章在收集和整理1万句藏语分词标注语料基础上,研究了藏语依存树库构建技术和方法,根据指定的藏语依存句法标注集和藏语依存句法标注工具,建立了规模为1万句、词语总数为119,510个、平均句长为12个词的藏语依存树库,并对建立的藏语依存树库进行了词类分布统计。
-
关键词
藏语
依存树库
句法标注
-
Keywords
tibetan
dependence treebank
syntax label
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名藏文祈使句依存树库的构建研究
- 6
-
-
作者
索朗拉姆
李铂钧
群诺
-
机构
西藏大学
-
出处
《信息与电脑》
2021年第7期186-188,共3页
-
文摘
随着当前社会的发展,对藏文句法分析的研究逐渐引起众多学者的关注。笔者收集和整理了1500多条祈使句的语料库,并根据依存文法的相关公理、《三十颂文法》、《字性组织法》以及藏文祈使句的句法构造特点对1000个藏文祈使句进行依存关系的分析和标注,设立了25种依存关系的句法标注规范,并构建了1000句的依存树库,为以后的藏文句法分析奠定了基础。
-
关键词
依存句法
依存树库
藏文
-
Keywords
dependency syntax
dependency treebank
tibetan
-
分类号
H214
[语言文字—少数民族语言]
TP391.1
[自动化与计算机技术—计算机应用技术]
-