期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
16
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于班智达藏文查询接口及信息抽取研究
被引量:
1
1
作者
华却才让
才让加
《微计算机信息》
2010年第18期208-209,207,共3页
本文依据班智达藏语料自动分词技术,设计出班智达藏文查询接口及信息抽取总体功能结构,较详细地讨论了班智达藏文藏词性标记规范、词典库的数据结构和信息抽取的文法规则,并给出了班智达藏文查询接口的信息抽取算法。
关键词
班智达
信息抽取
查询接口
词类标注
下载PDF
职称材料
藏文屏幕取词和翻译关键技术研究
2
作者
华却才让
赵海兴
《青海师范大学学报(自然科学版)》
2015年第4期25-28,共4页
藏语屏幕取词翻译及关键技术对屏幕信息获取和自然语言处理具有重要的意义.本文提出了藏语屏幕取词翻译的基本框架,采用截获系统文本处理消息、识别藏文文本、分词和词典翻译方法,初步实现了支持不同Windows平台和应用软件环境的藏汉英...
藏语屏幕取词翻译及关键技术对屏幕信息获取和自然语言处理具有重要的意义.本文提出了藏语屏幕取词翻译的基本框架,采用截获系统文本处理消息、识别藏文文本、分词和词典翻译方法,初步实现了支持不同Windows平台和应用软件环境的藏汉英屏幕取词翻译系统.
展开更多
关键词
屏幕取词
藏文分词
藏汉词性词典
下载PDF
职称材料
藏文数词识别与翻译
被引量:
7
3
作者
孙萌
华却才让
+2 位作者
刘凯
吕雅娟
刘群
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第1期75-80,共6页
通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数...
通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%,在藏汉机器翻译的测试集上的BLEU提高了2.64%。
展开更多
关键词
藏文
数词基本构件
自动机
数词识别
数词翻译
下载PDF
职称材料
基于判别式分类和重排序技术的藏文分词
被引量:
9
4
作者
孙萌
华却才让
+3 位作者
才智杰
姜文斌
吕雅娟
刘群
《中文信息学报》
CSCD
北大核心
2014年第2期61-65,90,共6页
本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构...
本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构词粒度分词的F值最高,为91.21%;在分词结果重排序方面,提出一种基于词图的最短路径重排序策略,将判别式解码生成的切分结果压缩为加权有向图,图中节点表示音节间隔,而边所覆盖的音节作为候选切分并赋予不同权重,选择一条最短路径从而实现整句切分,最终分词结果的F值达到96.25%。
展开更多
关键词
判别式
藏文分词
构词粒度
重排序
下载PDF
职称材料
班智达藏文标注词典设计
被引量:
15
5
作者
才智杰
才让卓玛
《中文信息学报》
CSCD
北大核心
2010年第5期46-49,共4页
语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的...
语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的结构及词典库索引查询算法。对85万字节藏语实验语料的分词和标注,分词准确率达99%,标注准确率达97%。
展开更多
关键词
藏语语料库
分词
标注
词典
索引
下载PDF
职称材料
藏语语料库加工方法研究
被引量:
13
6
作者
才让加
《计算机工程与应用》
CSCD
北大核心
2011年第6期138-139,146,共3页
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料...
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语语料库的多级加工。
展开更多
关键词
藏语语料库
规范
词类
标记集
词典
分词标注
下载PDF
职称材料
藏文字频统计系统中字构件分解算法
被引量:
4
7
作者
才让卓玛
才智杰
《计算机工程与科学》
CSCD
北大核心
2011年第3期159-162,共4页
藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整...
藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整字角度统计分析藏文字频度属性,还要统计分析构成其构件的频度及位置属性。因此,在藏文字频统计系统中要分解构成藏文字的各部件。本文通过开发藏文字频统计系统,利用组合构件库结合藏文文法提出了一种藏文字构件分解算法。经测试,该算法不仅简单易行,而且可以有效地确定出各基本构件的位置特征,已应用于项目藏文字频统计系统。
展开更多
关键词
字频统计
构件
分解
下载PDF
职称材料
藏语语料库词类描述方法研究
被引量:
7
8
作者
才让加
《计算机工程与应用》
CSCD
北大核心
2011年第4期146-148,共3页
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动...
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。
展开更多
关键词
自然语言
藏文
词类标记
语法信息
下载PDF
职称材料
现代藏文字构件分解方法
被引量:
7
9
作者
才让卓玛
才智杰
《青海大学学报(自然科学版)》
2010年第4期83-86,共4页
文中通过分析藏文文法,提出了自动分解现代藏文字构件的方法,其基本思想是:利用藏文文法将藏文字分解为基本构件和组合构件,并通过建立组合构件属性库进一步将组合构件分解为基本构件,同时确定出各基本构件的位置特征。
关键词
藏文信息处理
构件
前加字
后加字
又后加字
下载PDF
职称材料
基于语料库的藏语TTS技术研究
被引量:
2
10
作者
才让卓玛
才智杰
《青海师范大学学报(自然科学版)》
2010年第2期66-69,共4页
文章通过比较分析国内外TTS技术的发展,提出基于语料库的藏语TTS技术的可行性.研究了藏语TTS的文本分析模块、语音合成模块及语音数据库的关键技术,并设计了一个完整的基于语料库的藏语TTS系统.
关键词
语料库
文语转换
分词
拼接单元
下载PDF
职称材料
基于感知机模型藏文命名实体识别
被引量:
27
11
作者
华却才让
姜文斌
+1 位作者
赵海兴
刘群
《计算机工程与应用》
CSCD
2014年第15期172-176,共5页
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模...
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。
展开更多
关键词
藏文音节
命名实体
藏文命名实体
感知机模型
下载PDF
职称材料
PDM技术在Oracle中的应用研究
12
作者
才让卓玛
才智杰
《微计算机信息》
2010年第36期141-142,共2页
本文通过分析Power Designer和Oracle数据库技术的功能,研究了Power Designer的PDM技术在Oracle数据库中的应用,并提出了在信息系统开发中用PDM技术强化数据库管理的一种新策略。
关键词
ORACLE
9i
POWER
DESIGNER
PDM
逆向工程
下载PDF
职称材料
基于词对依存分类的藏语树库半自动构建研究
被引量:
8
13
作者
华却才让
姜文斌
+1 位作者
赵海兴
刘群
《中文信息学报》
CSCD
北大核心
2013年第5期166-172,共7页
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,...
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
展开更多
关键词
藏语依存句法
词对依存分类
藏语树库
藏语依存标注工具
下载PDF
职称材料
藏汉句子局部对齐策略的研究
被引量:
2
14
作者
华却才让
《青海师范大学学报(自然科学版)》
2010年第4期39-43,共5页
介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进行句子局部对齐的策略,并做了验证.
关键词
句子对齐
评价函数
藏汉句子自动对齐系统
下载PDF
职称材料
藏族基础教育远程教学资源开发框架设计
15
作者
才智杰
才让卓玛
《微计算机信息》
2011年第11期37-38,5,共3页
现代信息技术的快速发展,不断推动教育技术和教育方式的革新,国家及地方积极进行教育教学资源的建设,以促进教育发展新形势的需要。我国广大藏区教育基础设施相对落后、教学资源严重匮乏,教育发展明显滞后,通过藏族远程教学资源建设,使...
现代信息技术的快速发展,不断推动教育技术和教育方式的革新,国家及地方积极进行教育教学资源的建设,以促进教育发展新形势的需要。我国广大藏区教育基础设施相对落后、教学资源严重匮乏,教育发展明显滞后,通过藏族远程教学资源建设,使广大藏区师生通过Internet技术获得优质的教学资源,充分利用现有的硬件设备,提高教学质量,引领课堂教学质量的提升。
展开更多
关键词
藏族基础教育
远程教学
资源建设
下载PDF
职称材料
基于判别式的藏语依存句法分析
被引量:
17
16
作者
华却才让
赵海兴
《计算机工程》
CAS
CSCD
2013年第4期300-304,共5页
现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%...
现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%,可实际应用到藏语依存树库的构建和其他自然语言处理中。
展开更多
关键词
藏语依存句法
句法标注规范
最大生成树
特征模板
依存句法
感知机
下载PDF
职称材料
题名
基于班智达藏文查询接口及信息抽取研究
被引量:
1
1
作者
华却才让
才让加
机构
青海师范大学藏文信息研究中心
出处
《微计算机信息》
2010年第18期208-209,207,共3页
基金
基金申请人:才让加
项目名称:汉藏双语语料库处理技术及其标准规范研究
基金颁发部门:国家社科基金(07BYY035)
文摘
本文依据班智达藏语料自动分词技术,设计出班智达藏文查询接口及信息抽取总体功能结构,较详细地讨论了班智达藏文藏词性标记规范、词典库的数据结构和信息抽取的文法规则,并给出了班智达藏文查询接口的信息抽取算法。
关键词
班智达
信息抽取
查询接口
词类标注
Keywords
BANZHIDA
Information Extraction
Query Interface
POS Tag
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏文屏幕取词和翻译关键技术研究
2
作者
华却才让
赵海兴
机构
青海师范大学藏文信息研究中心
出处
《青海师范大学学报(自然科学版)》
2015年第4期25-28,共4页
基金
国家自然科学基金项目(61363055)
教育部"春晖计划"合作科研项目(Z2012102)资助
文摘
藏语屏幕取词翻译及关键技术对屏幕信息获取和自然语言处理具有重要的意义.本文提出了藏语屏幕取词翻译的基本框架,采用截获系统文本处理消息、识别藏文文本、分词和词典翻译方法,初步实现了支持不同Windows平台和应用软件环境的藏汉英屏幕取词翻译系统.
关键词
屏幕取词
藏文分词
藏汉词性词典
Keywords
screen capture
Tibetan word segmentation
Tibetan and Chinese part of speech dictionary
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏文数词识别与翻译
被引量:
7
3
作者
孙萌
华却才让
刘凯
吕雅娟
刘群
机构
中国科学院计算技术
研究
所
中国科学院
研究
生院
青海师范大学藏文信息研究中心
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第1期75-80,共6页
基金
863计划(2011AA01A207)资助
文摘
通过对藏文数词内部构词规律及外部边界信息进行分析,提出对藏文数词基本构件定义的方案。采取最优路径决策模型判断数词构件边界,然后通过有限自动机模型识别并翻译基本数词,最后用模板匹配算法处理复杂数词。结果表明,提出的方法对数词识别与翻译的F值达到98.73%,在藏汉机器翻译的测试集上的BLEU提高了2.64%。
关键词
藏文
数词基本构件
自动机
数词识别
数词翻译
Keywords
Tibetan
number basic component
automation
number indentification
number translation
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于判别式分类和重排序技术的藏文分词
被引量:
9
4
作者
孙萌
华却才让
才智杰
姜文斌
吕雅娟
刘群
机构
中国科学院计算技术
研究
所中国科学院智能
信息
处理重点实验室
中国科学院
大学
青海师范大学藏文信息研究中心
出处
《中文信息学报》
CSCD
北大核心
2014年第2期61-65,90,共6页
基金
863重大项目(2011AA01A207)
文摘
本文提出一种基于判别式模型的藏文分词方法,重点研究最小构词粒度和分词结果重排序对藏文分词效果的影响。在构词粒度方面,分别考察了以基本字丁、基本字丁-音节点、音节为最小构词粒度对分词效果的影响,实验结果表明选定音节为最小构词粒度分词的F值最高,为91.21%;在分词结果重排序方面,提出一种基于词图的最短路径重排序策略,将判别式解码生成的切分结果压缩为加权有向图,图中节点表示音节间隔,而边所覆盖的音节作为候选切分并赋予不同权重,选择一条最短路径从而实现整句切分,最终分词结果的F值达到96.25%。
关键词
判别式
藏文分词
构词粒度
重排序
Keywords
discriminative model
Tibetan word segmentation
word-formation unit
reranking
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
班智达藏文标注词典设计
被引量:
15
5
作者
才智杰
才让卓玛
机构
青海师范大学藏文信息研究中心
出处
《中文信息学报》
CSCD
北大核心
2010年第5期46-49,共4页
基金
国家语委资助项目(MZ05-118)
国家社会科学基金资助项目(07BYY035
09XYY024)
文摘
语料库加工是一项庞大的语言工程,其中分词标注是最基础性的工作,而分词标注词典是标注系统的重要组成,词典设计的优劣直接关系着分词标注的速度和效率。在设计国家语委项目《班智达藏文自动标注系统》的基础上,给出了分词标注词典库的结构及词典库索引查询算法。对85万字节藏语实验语料的分词和标注,分词准确率达99%,标注准确率达97%。
关键词
藏语语料库
分词
标注
词典
索引
Keywords
corpus of Tibetan
segmentation
tagging
dictionory
index
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏语语料库加工方法研究
被引量:
13
6
作者
才让加
机构
青海师范大学藏文信息研究中心
出处
《计算机工程与应用》
CSCD
北大核心
2011年第6期138-139,146,共3页
基金
国家语委基金(No.MZ115-018)
国家社会科学基金(No.07BYY035)
+1 种基金
国家社会科学重点基金(No.05AYY001)
973计划前期研究专项(No.2010CB334708)
文摘
为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语语料库的多级加工。
关键词
藏语语料库
规范
词类
标记集
词典
分词标注
Keywords
Tibetan corpus
norms
lexicon
mark sets
dictionary
participle labeling
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏文字频统计系统中字构件分解算法
被引量:
4
7
作者
才让卓玛
才智杰
机构
青海师范大学藏文信息研究中心
出处
《计算机工程与科学》
CSCD
北大核心
2011年第3期159-162,共4页
基金
国家社科基金资助项目(09XYY024)
青海师范大学科研基金资助项目
文摘
藏文字频统计是藏文信息处理的基础性工作,通过对藏文字的部件、音节、结构和字的频度与通用度等定量统计与定性分析,为藏文信息处理提供基础数据。藏文字是一种由藏文字构件横向和纵向组合而成的拼音文字,在藏文字频统计中不仅要从整字角度统计分析藏文字频度属性,还要统计分析构成其构件的频度及位置属性。因此,在藏文字频统计系统中要分解构成藏文字的各部件。本文通过开发藏文字频统计系统,利用组合构件库结合藏文文法提出了一种藏文字构件分解算法。经测试,该算法不仅简单易行,而且可以有效地确定出各基本构件的位置特征,已应用于项目藏文字频统计系统。
关键词
字频统计
构件
分解
Keywords
word frequency statistics
component
decomposition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏语语料库词类描述方法研究
被引量:
7
8
作者
才让加
机构
青海师范大学藏文信息研究中心
出处
《计算机工程与应用》
CSCD
北大核心
2011年第4期146-148,共3页
基金
国家社会科学基金(No.07BYY035)
国家社会科学重点基金(No.05AYY001)
+1 种基金
国家语委项目(No.MZ115-018)
国家973计划前期研究专项(No.2010CB334708)
文摘
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。
关键词
自然语言
藏文
词类标记
语法信息
Keywords
natural language
Tibetan
POS-tagging
grammatical information
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
现代藏文字构件分解方法
被引量:
7
9
作者
才让卓玛
才智杰
机构
青海师范大学藏文信息研究中心
出处
《青海大学学报(自然科学版)》
2010年第4期83-86,共4页
基金
国家社科基金项目(09XYY024)
青海师范大学科研基金资助项目
文摘
文中通过分析藏文文法,提出了自动分解现代藏文字构件的方法,其基本思想是:利用藏文文法将藏文字分解为基本构件和组合构件,并通过建立组合构件属性库进一步将组合构件分解为基本构件,同时确定出各基本构件的位置特征。
关键词
藏文信息处理
构件
前加字
后加字
又后加字
Keywords
Tibetan information processing
component
former letter
later letter backmost letter
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于语料库的藏语TTS技术研究
被引量:
2
10
作者
才让卓玛
才智杰
机构
青海师范大学藏文信息研究中心
出处
《青海师范大学学报(自然科学版)》
2010年第2期66-69,共4页
基金
国家社科基金项目(项目编号:09XYY024)
青海师范大学科研基金资助项目
文摘
文章通过比较分析国内外TTS技术的发展,提出基于语料库的藏语TTS技术的可行性.研究了藏语TTS的文本分析模块、语音合成模块及语音数据库的关键技术,并设计了一个完整的基于语料库的藏语TTS系统.
关键词
语料库
文语转换
分词
拼接单元
Keywords
corpus
Text To Speech(TTS)
word segmentation
concatenated
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于感知机模型藏文命名实体识别
被引量:
27
11
作者
华却才让
姜文斌
赵海兴
刘群
机构
陕西
师范大学
计算机学院
青海师范大学藏文信息研究中心
中国科学院计算技术
研究
所
出处
《计算机工程与应用》
CSCD
2014年第15期172-176,共5页
基金
国家自然科学基金(No.61363055
No.61063033
+1 种基金
No.61163018)
教育部"春晖计划"合作科研项目(No.Z2012102)
文摘
藏文命名实体识别是藏文分词和标注系统中必须要解决的问题。通过对命名实体构词规律及分词歧义进行分析,提出基于音节特征感知机训练模型的藏文命名实体识别方案。重点研究了利用藏文紧缩格识别音节的方法,命名实体内部和边界音节的模型训练特征模板,训练模型,以及命名实体分类识别方法。提出的藏文命名实体识别方法在测试集上获得86.03%的F值,相对基于分词的基线系统高出10.5%个点。
关键词
藏文音节
命名实体
藏文命名实体
感知机模型
Keywords
Tibetan syllable
Name Entity(NE)
Tibetan NE
perceptron model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
PDM技术在Oracle中的应用研究
12
作者
才让卓玛
才智杰
机构
青海师范大学藏文信息研究中心
出处
《微计算机信息》
2010年第36期141-142,共2页
基金
基金申请人:才智杰
项目名称:藏族远程教学资源库建设
基金颁发部门:国家社科基金(09XYY024)
文摘
本文通过分析Power Designer和Oracle数据库技术的功能,研究了Power Designer的PDM技术在Oracle数据库中的应用,并提出了在信息系统开发中用PDM技术强化数据库管理的一种新策略。
关键词
ORACLE
9i
POWER
DESIGNER
PDM
逆向工程
Keywords
Oracle 9i
PowerDesigner
PDM
Reverse Engineering.
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于词对依存分类的藏语树库半自动构建研究
被引量:
8
13
作者
华却才让
姜文斌
赵海兴
刘群
机构
青海师范大学
藏文
信息
研究
中心
陕西
师范大学
计算机学院
中国科学院计算技术
研究
所智能
信息
处理重点实验室
青海师范大学藏文信息研究中心
中国科学院 计算技术
研究
所智能
信息
处理重点实验室
出处
《中文信息学报》
CSCD
北大核心
2013年第5期166-172,共7页
基金
国家自然科学基金资助项目(61063033,61163018,61363055)
教育部“春晖计划”合作科研资助项目(Z2012102)
文摘
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。
关键词
藏语依存句法
词对依存分类
藏语树库
藏语依存标注工具
Keywords
Tibetan dependency syntax
word-pair dependency classification
Tibetan Treebank
Tibetan dependency annotation tool
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏汉句子局部对齐策略的研究
被引量:
2
14
作者
华却才让
机构
青海师范大学藏文信息研究中心
出处
《青海师范大学学报(自然科学版)》
2010年第4期39-43,共5页
基金
国家973计划项目(编号:2010CB334708)
国家自然基金项目(编号:61063033)
文摘
介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进行句子局部对齐的策略,并做了验证.
关键词
句子对齐
评价函数
藏汉句子自动对齐系统
Keywords
sentence aligned
evaluation function
TCSAAS
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
藏族基础教育远程教学资源开发框架设计
15
作者
才智杰
才让卓玛
机构
青海师范大学藏文信息研究中心
出处
《微计算机信息》
2011年第11期37-38,5,共3页
基金
基金申请人:才智杰
项目名称:藏族远程教学资源库建设
基金颁发部门:国家社科基金(09XYY024)
文摘
现代信息技术的快速发展,不断推动教育技术和教育方式的革新,国家及地方积极进行教育教学资源的建设,以促进教育发展新形势的需要。我国广大藏区教育基础设施相对落后、教学资源严重匮乏,教育发展明显滞后,通过藏族远程教学资源建设,使广大藏区师生通过Internet技术获得优质的教学资源,充分利用现有的硬件设备,提高教学质量,引领课堂教学质量的提升。
关键词
藏族基础教育
远程教学
资源建设
Keywords
Tibetan foundation education
Remote education
Resource construction
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于判别式的藏语依存句法分析
被引量:
17
16
作者
华却才让
赵海兴
机构
青海师范大学藏文信息研究中心
陕西
师范大学
计算机科学学院
出处
《计算机工程》
CAS
CSCD
2013年第4期300-304,共5页
基金
国家自然科学基金资助项目(61063033
61163018)
+1 种基金
国家"973"计划前期研究专项基金资助项目(2010CB334708)
青海省科技基金资助项目(2011-Z-752)
文摘
现有藏语句法体系复杂,不利于藏文自然语言处理的应用。为此,提出基于判别式的藏语依存句法分析方法,采用感知机方法训练句法分析模型,CYK自底向上算法解码生成最大生成树。实验结果表明,在人工标注的测试集上,句法分析正确率达到81.2%,可实际应用到藏语依存树库的构建和其他自然语言处理中。
关键词
藏语依存句法
句法标注规范
最大生成树
特征模板
依存句法
感知机
Keywords
Tibetan dependency syntax
syntax tagging specification
maximum-spanning tree
feature template
dependency syntax
perceptron
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于班智达藏文查询接口及信息抽取研究
华却才让
才让加
《微计算机信息》
2010
1
下载PDF
职称材料
2
藏文屏幕取词和翻译关键技术研究
华却才让
赵海兴
《青海师范大学学报(自然科学版)》
2015
0
下载PDF
职称材料
3
藏文数词识别与翻译
孙萌
华却才让
刘凯
吕雅娟
刘群
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
7
下载PDF
职称材料
4
基于判别式分类和重排序技术的藏文分词
孙萌
华却才让
才智杰
姜文斌
吕雅娟
刘群
《中文信息学报》
CSCD
北大核心
2014
9
下载PDF
职称材料
5
班智达藏文标注词典设计
才智杰
才让卓玛
《中文信息学报》
CSCD
北大核心
2010
15
下载PDF
职称材料
6
藏语语料库加工方法研究
才让加
《计算机工程与应用》
CSCD
北大核心
2011
13
下载PDF
职称材料
7
藏文字频统计系统中字构件分解算法
才让卓玛
才智杰
《计算机工程与科学》
CSCD
北大核心
2011
4
下载PDF
职称材料
8
藏语语料库词类描述方法研究
才让加
《计算机工程与应用》
CSCD
北大核心
2011
7
下载PDF
职称材料
9
现代藏文字构件分解方法
才让卓玛
才智杰
《青海大学学报(自然科学版)》
2010
7
下载PDF
职称材料
10
基于语料库的藏语TTS技术研究
才让卓玛
才智杰
《青海师范大学学报(自然科学版)》
2010
2
下载PDF
职称材料
11
基于感知机模型藏文命名实体识别
华却才让
姜文斌
赵海兴
刘群
《计算机工程与应用》
CSCD
2014
27
下载PDF
职称材料
12
PDM技术在Oracle中的应用研究
才让卓玛
才智杰
《微计算机信息》
2010
0
下载PDF
职称材料
13
基于词对依存分类的藏语树库半自动构建研究
华却才让
姜文斌
赵海兴
刘群
《中文信息学报》
CSCD
北大核心
2013
8
下载PDF
职称材料
14
藏汉句子局部对齐策略的研究
华却才让
《青海师范大学学报(自然科学版)》
2010
2
下载PDF
职称材料
15
藏族基础教育远程教学资源开发框架设计
才智杰
才让卓玛
《微计算机信息》
2011
0
下载PDF
职称材料
16
基于判别式的藏语依存句法分析
华却才让
赵海兴
《计算机工程》
CAS
CSCD
2013
17
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部