期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
蒙古语语言-文字的自动化处理 被引量:6
1
作者 伊.达瓦 张玉洁 +4 位作者 上园一知 大川茂树 章森 井佐原均 白井克彦 《中文信息学报》 CSCD 北大核心 2006年第4期56-62,93,共8页
本文首先叙述了蒙文电子化的意义以及蒙文电子化数据的现状。然后重点讨论了在不同地区和国家使用的蒙文书面语以及口语的不同和蒙文在计算机处理时所面临的问题。最后,介绍了我们在日本建设的针对蒙古语语言信息处理的两种语言资源:蒙... 本文首先叙述了蒙文电子化的意义以及蒙文电子化数据的现状。然后重点讨论了在不同地区和国家使用的蒙文书面语以及口语的不同和蒙文在计算机处理时所面临的问题。最后,介绍了我们在日本建设的针对蒙古语语言信息处理的两种语言资源:蒙古语多方言口语语料库和蒙文多文种-多语言并行语法标注电子词典,后者得到了2005年中日蒙韩国际合作课题“蒙文自然语言处理技术的研究”的资助。 展开更多
关键词 计算机应用 中文信息处理 蒙文语言文字信息处理 文本-口语语料库 多文种-多语言电子词典
下载PDF
蒙古语多方言语音识别及共享识别模型探索 被引量:3
2
作者 伊.达瓦 大川茂树 白井克彦 《中央民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2001年第4期114-121,共8页
通过语音输入方式准确识别蒙古语主要方言 ,并为其建立共享识别模型 ,对实现方言间的信息自动交换及语音识别技术的实用化具有实际意义。针对蒙古语多方言的语音特点 ,可以采取独立的或者共享识别模型进行识别。本文介绍的抽出初步模型... 通过语音输入方式准确识别蒙古语主要方言 ,并为其建立共享识别模型 ,对实现方言间的信息自动交换及语音识别技术的实用化具有实际意义。针对蒙古语多方言的语音特点 ,可以采取独立的或者共享识别模型进行识别。本文介绍的抽出初步模型和建立共享模型的方法 ,简便易行 ,但识别精度有待提高。文中探索了通过借用数据量和质较完备的语言的语音数据提高识别率的可能性。 展开更多
关键词 蒙古语 语音识别 方言 相似度 共享模型 语音数据库 方言差异
下载PDF
LPC及F_0参数组合基于GMM电话语音说话人识别 被引量:1
3
作者 伊.达瓦 吾守尔.斯拉木 匂坂芳典 《中文信息学报》 CSCD 北大核心 2011年第4期105-109,共5页
该文报告了组合LPC参数以及基频F0的高斯混合模型(GMM)电话语音说话人自动识别技术的实验研究结果。该研究在基线试验中GMM使用16混合共分散对角矩阵,特征量为LPC倒谱系数。而在开发系统测试中分别利用语音的全发话区间和有声区间两部... 该文报告了组合LPC参数以及基频F0的高斯混合模型(GMM)电话语音说话人自动识别技术的实验研究结果。该研究在基线试验中GMM使用16混合共分散对角矩阵,特征量为LPC倒谱系数。而在开发系统测试中分别利用语音的全发话区间和有声区间两部分参数增加基频参数进行试验,并给出实验比较结果。在50人电话通话开放集自动切分语音流实验中正确识别率为76.97%,而提案方法为80.29%,改善率为3.32%。接近人工切分语音流时的识别率82.34%。 展开更多
关键词 电话语音 说话人识别 LPC F0 GMM
下载PDF
基于GMM-UBM/SVM的维吾尔语电话语音监控系统 被引量:2
4
作者 李晓阳 伊.达瓦 +1 位作者 吾守尔.斯拉木 勾坂芳典 《计算机应用与软件》 CSCD 北大核心 2012年第1期46-48,77,共4页
讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设... 讨论基于GMM-UBM/SVM的电话语音监控系统。GMM是说话人识别系统中使用的常用方式。但由于监控语音发话时间短暂,电话-互联网终端及传输线背景噪音大等因素影响了GMM的识别精度。基于GMM的鲁棒性及SVM对小量静态数据具有高分类的优势设计电话语音监控系统并通过维吾尔语研讨了系统性能。为了便于比较,同时也讨论了量化距离(VQ)、加权量化距离(WVQ)及基线系统的识别。在50个目标人训练集,每人发话时间为20秒时,对10秒测试语音提案方法识别率对比于VQ和WVQ法分别提高了20.2%及16.7%。 展开更多
关键词 电话语音监控 说话人识别 维吾尔语 GMM-UBM SVM
下载PDF
丝绸之路经济带相似语言信息横向处理通信技术的研究
5
作者 伊.达瓦 米尔阿迪力江.麦麦提 《新疆师范大学学报(自然科学版)》 2014年第4期66-74,2,共9页
丝绸之路经济带为丝路沿线各国及地区带来的发展机遇。丝路沿线不同语言信息的交换及处理技术的提升将面临新的机遇与挑战。以蒙古文为实例,研究了丝路带相似多语言信息交叉处理通信问题,研讨了基于词典及语言学知识和基于统计的机器翻... 丝绸之路经济带为丝路沿线各国及地区带来的发展机遇。丝路沿线不同语言信息的交换及处理技术的提升将面临新的机遇与挑战。以蒙古文为实例,研究了丝路带相似多语言信息交叉处理通信问题,研讨了基于词典及语言学知识和基于统计的机器翻译(SMT)两种方式的蒙文多语种文本的自动转写或翻译方法。试验结果显示,SMT方法对于相似语言转写的效果相比于语言学以及不同语系不同语族语言的翻译效果近提升一倍。 展开更多
关键词 丝绸之路经济带 相似语言交叉处理通信 蒙文多文种转写 统计机器翻译 MOSES 余弦相似度
下载PDF
带铁心复合线圈互感系数的简易近似测定方法
6
作者 伊.达瓦 《新疆工学院学报》 1994年第4期278-284,共7页
借助于模拟计算机的标准电路简便测试带铁心复合线圈的互感系数.
关键词 带铁心复合线圈 互感系数 线圈 测定 计算机
下载PDF
蒙古语七个元音声频特性计算机分析 被引量:10
7
作者 伊.达瓦 大川茂村 白井克彦 《声学学报》 EI CSCD 北大核心 1999年第1期94-97,共4页
为了采取语音输入方式来实现蒙古语各类文字文献的自动转换(机器翻译),所选择的语音、语言模型的性能直接影响识别精度。为此对蒙古语各类语言文字的元音进行声学特性的分析和分类不仅对蒙古语语音的识别非常重要,而且对蒙古语的语... 为了采取语音输入方式来实现蒙古语各类文字文献的自动转换(机器翻译),所选择的语音、语言模型的性能直接影响识别精度。为此对蒙古语各类语言文字的元音进行声学特性的分析和分类不仅对蒙古语语音的识别非常重要,而且对蒙古语的语言学、地方方言学的研究也有很重要的意义.本文介绍对蒙古语哈拉合、察合尔、卫拉特发音元音读音进行声频特性分析的结果以及利用语音模型识别方式验证所测定的不同发音共振峰频率分布情况。 展开更多
关键词 声学特性 计算机分析 蒙古语 元音 声频特性
原文传递
蒙古语主要方言的声学和音律特征分析分类 被引量:1
8
作者 伊.达瓦 大川茂树 白井克彦 《民族语文》 CSSCI 北大核心 2001年第1期26-32,共7页
本文通过语言的声学特征、音律信息及语言结构的统计概率考察了蒙古语的 主要方言。分析方法包括:语音的 LPC特征参数共振峰频率分析;方言语音识别分 析和识别音素串(口语)与文语(书面语)比较分析;利用方言对照字典,语言结构... 本文通过语言的声学特征、音律信息及语言结构的统计概率考察了蒙古语的 主要方言。分析方法包括:语音的 LPC特征参数共振峰频率分析;方言语音识别分 析和识别音素串(口语)与文语(书面语)比较分析;利用方言对照字典,语言结构概 率统计分析;利用逐渐逼近法分段线近似基音(F0)曲线,抽出各分段线的起始频率 和斜率参数后,用判别分析法进行方言分析。分析结果表明,上述各类方法不仅直 观、符合实际而且信赖性较好。 展开更多
关键词 蒙古语 声学 音律 语音 语言结构
原文传递
基于统计机器翻译技术的胡都木—托忒文本转写的实现
9
作者 伊.达瓦 王羡慧 米尔阿迪力江.麦麦提 《西部蒙古论坛》 2014年第2期62-71,共10页
针对蒙文多文种文本(如传统蒙文TM,新蒙文NM及托忒文Todo)的互换显示需求,本文研究了基于短语的统计机器翻译技术的自动转写方法。首先,人工建立上述三文平行6万条句对语料。其次,利用TM和Todo(NM)双文句对中,词间空格信息对,TM功能词... 针对蒙文多文种文本(如传统蒙文TM,新蒙文NM及托忒文Todo)的互换显示需求,本文研究了基于短语的统计机器翻译技术的自动转写方法。首先,人工建立上述三文平行6万条句对语料。其次,利用TM和Todo(NM)双文句对中,词间空格信息对,TM功能词与前词强制连接,生成双文句及词对齐语料,并生成统计翻译模型和语言模型。最后,借助于Moses解码器实现双文的自动转写。实验分别用300开发句和测试句进行TM-Todo句文双向互译时,其BLEU值分别达到了57.82%和58.03%,比先前汉-蒙语机器翻译最好BLEU值:29.86%,近高一倍。 展开更多
关键词 蒙文胡都木托忒文本 平行语料 统计机器翻译 MOSES 余弦相似度
原文传递
一种基于语料库的濒危文化挽救方法 被引量:1
10
作者 伊.达瓦 匂坂芳典 +1 位作者 中村哲 白井克彦 《西部蒙古论坛》 2009年第1期44-55,127,共9页
目前世界范围内,尤其是人口较少的民众失去甚至失传母语和传统文化的现象日益严重,拯救濒危文化的需求很迫切。由于蒙古文的地区性,多样性以及方言性,至今在地区之间文字通讯较难。再加上过去一些地区使用文字的频繁改动,民众失去了拥... 目前世界范围内,尤其是人口较少的民众失去甚至失传母语和传统文化的现象日益严重,拯救濒危文化的需求很迫切。由于蒙古文的地区性,多样性以及方言性,至今在地区之间文字通讯较难。再加上过去一些地区使用文字的频繁改动,民众失去了拥有的语言和文字。不论在使用文字标准的研究、新-旧文字信息的互换、自然语言处理-通信等方面存在着许多亟待解决的问题。我们在日本国早稻田大学,NICT^1、GITI^2、蒙古国国立大学、俄国卡尔梅克/布里亚特国立大学、中国内蒙古社会科学院蒙科立软件开发公司等单位的协助下收集整理了以蒙语为核心的多语言信知识库。其内容包括:①蒙古语族语言语音库;②新蒙/传统/托忒蒙文/中/英/日/韩-平行语法标注电子词典;③蒙古国方言教育旅游会话语音库以及卫拉特蒙古江格尔说唱语料(中国新疆,俄国卡尔梅克)。以上语料均用Chasen/HTK/ATRASR等常用软件进行自动标注、人工校对、实现了共享平台。借助于以上的语言资源我们研发了应用软件:既,1)蒙文多文种文本横向转换处理软件(实测转换率94.3%)、2)语音-文本转换软件(实测转换率88.6%)。其中一部分的语料和软件已经向社会公开。这对蒙古语言的数据挖掘、知识发现,科学研究以及再生-学习消失中的语言-文字等方面无非是一个科学性的扶持。 展开更多
关键词 濒危语言文化 蒙古语 语言资源开发 口语-文本机器翻译
全文增补中
相似语言文本横向处理的研究(英文)
11
作者 木合亚提.尼亚孜别克 古力沙吾利.塔里甫 伊.达瓦 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2016年第3期354-359,387,共7页
针对电子资源短缺少数民族语言自然语言处理问题,提出了借助于大语言大数据,着重语言的相似性交叉处理的方法.该文在本次试验中利用维哈柯语及蒙古语多文种文本7 854条平行语料,分词单位和短句子单位考查分析了同语族语言以及不同族语... 针对电子资源短缺少数民族语言自然语言处理问题,提出了借助于大语言大数据,着重语言的相似性交叉处理的方法.该文在本次试验中利用维哈柯语及蒙古语多文种文本7 854条平行语料,分词单位和短句子单位考查分析了同语族语言以及不同族语言之间、同语系不同语族语言之间的相似程度.引用动态规划(DP)算法定量地获取了语言之间的相似性.实验结果显示:在句子阶段,维哈柯语言其相似度为84.3%,蒙族类语言为81.3%;在词阶段,维哈柯语言相似度可达到91.6%,而蒙族类语言相似度可达到87.8%.另外,同语系而不同语族多语言的相似性较低,在词级单位考查其相似程度不超过10%. 展开更多
关键词 多文种文本横向处理 相似语言 相似度 DP算法 少数民族语言
原文传递
新疆蒙文地区双语教育多媒体教学的研究
12
作者 伊.达瓦 策.巴图 《西部蒙古论坛》 2011年第3期64-73,127-128,共9页
本文结合国家863科技项目,自治区科技厅支疆及自然科学基金项目,响应国家对民族地区实施双语教育的号召,探讨双语教育的意义以及如何保障并促进民族地区文化的多样性及多元化。比起其他民族,居住在新疆的蒙古族民众接受教育的语言体系... 本文结合国家863科技项目,自治区科技厅支疆及自然科学基金项目,响应国家对民族地区实施双语教育的号召,探讨双语教育的意义以及如何保障并促进民族地区文化的多样性及多元化。比起其他民族,居住在新疆的蒙古族民众接受教育的语言体系比较特殊,农牧区小中学学生除了需要学习掌握本地民族语言文字之外还要学习多文种目标语(如正在实施的内蒙地区使用的胡都木蒙文及汉语)。针对这些问题,本文在关注并保障本土文化(原有语言文字)避免危机及消亡的前提下探讨如何实现多媒体教学环境支持双语教育,促进地方经济社会的又好又快发展;论述珍爱和保护中华民族多元化的语言文字文化以及增强国家及民族社会责任感的重要性。 展开更多
关键词 双语教育 多媒体教学 本土文化 方言 蒙古语托忒文
全文增补中
上一页 1 下一页 到第
使用帮助 返回顶部