期刊文献+
共找到84篇文章
< 1 2 5 >
每页显示 20 50 100
基于语义规则增强的蒙古语情感分布学习
1
作者 杨蕾 苏依拉 +3 位作者 仁庆道尔吉 吉亚图 乌尼尔 路敏 《计算机工程与设计》 北大核心 2024年第7期2082-2089,共8页
为完善基于先验知识的标记增强方法对于情绪信息的捕捉,提出一种基于语义规则增强的蒙古语情感分布学习方法(semantic rule enhancement based Mongolian emotion distribution learning, SRE-MEDL)。在情感轮和情感词典的基础上,引入... 为完善基于先验知识的标记增强方法对于情绪信息的捕捉,提出一种基于语义规则增强的蒙古语情感分布学习方法(semantic rule enhancement based Mongolian emotion distribution learning, SRE-MEDL)。在情感轮和情感词典的基础上,引入程度词典和否定词典,得到各种情感词组合,以此制定相应的语义规则计算情感词权重,将其融入到标记增强中。在情感分布学习中融入从情感分布空间到实例特征空间的反向重构映射来弥补正向映射引起的原始信息丢失问题。对比实验结果显示,在蒙古语和中英文常用数据集上,SRE-MEDL方法在标记增强任务和情感分布学习中的表现均优于现有方法。 展开更多
关键词 标记增强 语义规则 程度词 否定词 情感轮 蒙古语 情感分布学习 反向重构
下载PDF
基于蒙古语情感分布学习的数据增强方法
2
作者 杨蕾 苏依拉 +1 位作者 仁庆道尔吉 吉亚图 《计算机仿真》 2024年第7期540-545,共6页
现有的情感分布学习尚未应用于蒙古语中,并且暂无利用情感分布学习进行数据增强研究。基于此,将极坐标的思想融入普鲁契克情感轮中,提出一种极坐标情绪表示法,把情感分布转化为复合情绪向量并将情感轮注意力信息融入模型中进行蒙古语情... 现有的情感分布学习尚未应用于蒙古语中,并且暂无利用情感分布学习进行数据增强研究。基于此,将极坐标的思想融入普鲁契克情感轮中,提出一种极坐标情绪表示法,把情感分布转化为复合情绪向量并将情感轮注意力信息融入模型中进行蒙古语情感分布学习。利用普鲁契克情感轮中任意两种基本情绪可以混合构成二元情绪的特性,为预测复合情绪向量扩展更为丰富的情绪标签,从而达到扩充数据集的目的。在蒙古语和中英文数据集上进行对比实验表明,基于极坐标情绪表示法的情感分布学习的性能优于传统方法。 展开更多
关键词 情感分布学习 蒙古语 数据增强 极坐标 普鲁契克情感轮 二元情绪
下载PDF
基于实例相似度检测的蒙汉机器翻译方法 被引量:5
3
作者 苏依拉 刘婉婉 乌尼尔 《北京工业大学学报》 CAS CSCD 北大核心 2017年第9期1366-1372,共7页
针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的... 针对内蒙古地区机器翻译力量薄弱、技术落后等现状,提出一种基于实例的翻译方法,使用不同粒度的对齐技术对蒙汉双语语料库进行处理,根据相似度算法进行匹配和重组并生成译文.实验结果表明:利用实例库相似度检测的方法能够对特定领域的蒙古语做出有效的翻译,并在一定程度上提高翻译质量,在蒙汉机器翻译中具有较好的应用价值. 展开更多
关键词 实例机器翻译 蒙古语 相似度算法 对齐
下载PDF
基于统计分析的蒙汉自然语言的机器翻译 被引量:4
4
作者 苏依拉 乌尼尔 刘婉婉 《北京工业大学学报》 CAS CSCD 北大核心 2017年第1期36-42,共7页
为改变内蒙古地区蒙汉机器翻译发展相对落后的现状,采用基于统计的机器翻译方法将短语作为翻译的最基本单元,并基于最大熵模型提出了一种分词方法和词对齐方法,通过调序结果来输出译文.实验结果表明:改进后的翻译系统BLEU值在一定程度... 为改变内蒙古地区蒙汉机器翻译发展相对落后的现状,采用基于统计的机器翻译方法将短语作为翻译的最基本单元,并基于最大熵模型提出了一种分词方法和词对齐方法,通过调序结果来输出译文.实验结果表明:改进后的翻译系统BLEU值在一定程度上有所提高,所提方法可为蒙汉应用研究提供参考. 展开更多
关键词 自然语言 蒙汉翻译 统计机器翻译 最大熵模型 短语
下载PDF
基于本体标注的蒙文地名识别研究 被引量:2
5
作者 苏依拉 孙日旺 +1 位作者 谭艳梅 刘海涛 《计算机工程与科学》 CSCD 北大核心 2013年第8期156-162,共7页
蒙古文语义Web的建设,首当其冲所要解决的就是蒙古语的语义描述问题。尤其是近年来,随着蒙古文网站和使用蒙文的用户数量的急剧增长,对蒙文的信息检索质量提出了更高的要求。立足于面向蒙古文地名的识别与标注研究,在语义Web知识背景下... 蒙古文语义Web的建设,首当其冲所要解决的就是蒙古语的语义描述问题。尤其是近年来,随着蒙古文网站和使用蒙文的用户数量的急剧增长,对蒙文的信息检索质量提出了更高的要求。立足于面向蒙古文地名的识别与标注研究,在语义Web知识背景下,结合蒙文信息化研究实际,使用Protégé3.4.4建立了一个关于内蒙古自治区行政区划的小型地名本体,然后借助GATE,建立用蒙语表示的地名词表,编写JAPE语法规则,完成蒙文文档中地名的识别与标注工作。这样充分挖掘出蒙文中的地理信息,实现了蒙文文档中地名的结构化,方便有关地理信息的语义搜索。 展开更多
关键词 地名本体 GATE JAPE规则 语义标注
下载PDF
分布式β-PSML语言框架及其应用 被引量:3
6
作者 苏依拉 刘椿年 《北京工业大学学报》 CAS CSCD 北大核心 2005年第4期427-433,共7页
为了完成在大规模、分布式环境下的问题查询,提出了分布式β-PSML语言.分布式β-PSML语言对β-PSML语言在复杂度适应性和分布式问题解决方面进行了扩展,使得它可以在语义Web上进行自动推理.另外,分布式β-PSML语言的推理可以通过结合在... 为了完成在大规模、分布式环境下的问题查询,提出了分布式β-PSML语言.分布式β-PSML语言对β-PSML语言在复杂度适应性和分布式问题解决方面进行了扩展,使得它可以在语义Web上进行自动推理.另外,分布式β-PSML语言的推理可以通过结合在语义Web和社会网络上的全局信息源与在企业门户中的本地知识与数据库完成.实验结果表明,分布式β-PSML语言通过结合全局与本地资源推理可给出正确的结果. 展开更多
关键词 问题解决标记语言 网络智能 语义WEB
下载PDF
Transformer-CRF词切分方法在蒙汉机器翻译中的应用 被引量:4
7
作者 苏依拉 张振 +3 位作者 仁庆道尔吉 牛向华 高芬 赵亚平 《中文信息学报》 CSCD 北大核心 2019年第10期38-46,共9页
基于编码—解码(端到端)结构的机器翻译逐渐成为自然语言处理之机器翻译的主流方法,其翻译质量较高且流畅度较好,但依然存在词汇受限、上下文语义信息丢失严重等问题。该文首先进行语料预处理,给出一种Transformer-CRF算法来进行蒙古语... 基于编码—解码(端到端)结构的机器翻译逐渐成为自然语言处理之机器翻译的主流方法,其翻译质量较高且流畅度较好,但依然存在词汇受限、上下文语义信息丢失严重等问题。该文首先进行语料预处理,给出一种Transformer-CRF算法来进行蒙古语词素和汉语分词的预处理方法。然后构建了基于Tensor2Tensor的编码—解码模型,为了从蒙古语语料中学习更多的语法和语义知识,该文给出了一种基于词素四元组编码的词向量作为编码器输入,解码阶段。为了进一步缓解神经网络训练时出现的词汇受限问题,该文将专有名词词典引入翻译模型来进一步提高翻译质量和译文忠实度。根据构建模型对不同长度句子进行实验对比,表明模型在处理长时依赖问题上翻译性能得到提高。 展开更多
关键词 蒙汉翻译 Transformer-CRF分词算法 蒙古语词素
下载PDF
基于对抗学习的蒙汉神经机器翻译 被引量:7
8
作者 苏依拉 王昊 +3 位作者 贺玉玺 孙晓骞 仁庆道尔吉 吉亚图 《计算机系统应用》 2022年第1期249-258,共10页
在机器翻译模型的构建和训练阶段,为了缓解因端到端机器翻译框架在训练时采用最大似然估计原理导致的翻译模型的质量不高的问题,本文使用对抗学习策略训练生成对抗网络,通过鉴别器协助生成器的方式来提高生成器的翻译质量,通过实验选择... 在机器翻译模型的构建和训练阶段,为了缓解因端到端机器翻译框架在训练时采用最大似然估计原理导致的翻译模型的质量不高的问题,本文使用对抗学习策略训练生成对抗网络,通过鉴别器协助生成器的方式来提高生成器的翻译质量,通过实验选择出了更适合生成器的机器翻译框架Transformer,更适合鉴别器的卷积神经网络,并且验证了对抗式训练对提高译文的自然度、流利度以及准确性都具有一定的作用.在模型的优化阶段,为了缓解因蒙汉平行数据集匮乏导致的蒙汉机器翻译质量仍然不理想的问题,本文将Dual-GAN (dual-generative adversarial networks,对偶生成对抗网络)算法引入了蒙汉机器翻译中,通过有效的利用大量蒙汉单语数据使用对偶学习策略的方式来进一步提高基于对抗学习的蒙汉机器翻译模型的质量. 展开更多
关键词 蒙汉机器翻译 对抗学习 生成对抗网络 对偶学习 Dual-GAN算法
下载PDF
基于关系数据库的蒙文局部本体构建及整合 被引量:1
9
作者 苏依拉 王一云 谭艳梅 《北京工业大学学报》 CAS CSCD 北大核心 2014年第11期1643-1650,共8页
针对网络中存在的大量有价值却未被利用的Web信息,通过构建本体对深层的Web信息进行描述,从而达到检索、利用和共享的目的.基于对蒙文特点、信息处理面临的难题以及当前的研究成果进行了分析,提出了一种基于关系数据库的蒙文本体自动构... 针对网络中存在的大量有价值却未被利用的Web信息,通过构建本体对深层的Web信息进行描述,从而达到检索、利用和共享的目的.基于对蒙文特点、信息处理面临的难题以及当前的研究成果进行了分析,提出了一种基于关系数据库的蒙文本体自动构建方法,并以内蒙古地区物流数据为例,设计实现了蒙文物流本体的自动构建及推理查询系统.原型系统对所获得的本体进行了实例化,并利用Jena推理子系统对所构建本体的一致性及推理能力进行了验证,将基于规则的推理应用到内蒙古物流领域业务决策过程中. 展开更多
关键词 WEB信息 本体构建 推理查询
下载PDF
中文字粒度切分在蒙汉机器翻译的应用 被引量:2
10
作者 苏依拉 高芬 仁庆道尔吉 《中文信息学报》 CSCD 北大核心 2019年第12期54-60,共7页
在机器翻译任务中,主流的深度学习算法大多使用词或子词作为基础的语义单元,在词或子词层面学习嵌入表征。然而,词粒度层面存在一系列缺点。该文基于LSTM和Transformer蒙汉翻译模型,对蒙文进行子词粒度切分,对中文分别进行子词和字粒度... 在机器翻译任务中,主流的深度学习算法大多使用词或子词作为基础的语义单元,在词或子词层面学习嵌入表征。然而,词粒度层面存在一系列缺点。该文基于LSTM和Transformer蒙汉翻译模型,对蒙文进行子词粒度切分,对中文分别进行子词和字粒度切分对比实验。实验结果显示,相比于子词粒度切分,基于Transformer的蒙汉翻译模型和基于LSTM的蒙汉翻译模型的字粒度切分有极大的BLEU值提升,字级别的蒙汉翻译模型在验证集和测试集上都显著优于混合字和词的子词级别的蒙汉翻译模型。其表明,字级别的蒙汉翻译模型更能捕捉单元之间的语义联系,提高蒙汉翻译性能。 展开更多
关键词 字粒度切分 TRANSFORMER LSTM
下载PDF
基于蒙古语课程领域语义Web的推理与检索方法的研究 被引量:7
11
作者 苏依拉 吉亚图 窦葆媛 《计算机工程与科学》 CSCD 北大核心 2016年第2期376-385,共10页
由于蒙古语网络教学相对落后,蒙古语教学资源的重用和利用率较低,并且基于关键字的教学资源检索缺少在语义层面上的处理和表示,导致检索结果不全面和不准确。针对这种情况,提出基于蒙古语课程领域语义Web的检索方法。通过建立教学领域&q... 由于蒙古语网络教学相对落后,蒙古语教学资源的重用和利用率较低,并且基于关键字的教学资源检索缺少在语义层面上的处理和表示,导致检索结果不全面和不准确。针对这种情况,提出基于蒙古语课程领域语义Web的检索方法。通过建立教学领域"人工智能(■■)"课程蒙文本体,利用关系数据库MySQL、语义相似度以及推理规则等工具与方法,实现构建基于蒙古语教学领域查询与检索原型系统。实验结果表明,该方法能有效地提高信息检索的查全率和查准率,并且建立了蒙古语教学资源可以共享和互操作的知识层次结构。 展开更多
关键词 蒙古语 语义WEB 课程本体 推理 信息检索
下载PDF
基于本体的蒙古语灾害信息检索模型 被引量:5
12
作者 苏依拉 窦保媛 吉亚图 《北京工业大学学报》 CAS CSCD 北大核心 2016年第7期1017-1023,共7页
由于蒙古语文本数据的匮乏以及语言分析困难等原因,蒙古语信息化处理发展缓慢.针对该问题,利用语义网本体技术,以自然灾害为本体构建了一个面向蒙古语自然灾害信息的跨语言检索模型,实现了蒙英自然灾害信息间的跨语言检索.同时,本文提... 由于蒙古语文本数据的匮乏以及语言分析困难等原因,蒙古语信息化处理发展缓慢.针对该问题,利用语义网本体技术,以自然灾害为本体构建了一个面向蒙古语自然灾害信息的跨语言检索模型,实现了蒙英自然灾害信息间的跨语言检索.同时,本文提出的跨语言检索模型具有一定的通用性,可为类似应用研究提供参考. 展开更多
关键词 灾害本体 蒙古语 WORDNET 跨语言
下载PDF
β-PSML语言中的混合推理算法 被引量:1
13
作者 苏依拉 刘椿年 《北京工业大学学报》 EI CAS CSCD 北大核心 2010年第10期1413-1417,共5页
研究了由描述逻辑和Horn子句组成的β-PSML语言逻辑基础的理论问题,给出了基于可确定描述逻辑的混合推理算法.在无递归情况下,β-PSML语言中单步的Horn子句推理需要由一个更为复杂的推理步骤所取代,称这个推理步骤为β-PSML语言中的混... 研究了由描述逻辑和Horn子句组成的β-PSML语言逻辑基础的理论问题,给出了基于可确定描述逻辑的混合推理算法.在无递归情况下,β-PSML语言中单步的Horn子句推理需要由一个更为复杂的推理步骤所取代,称这个推理步骤为β-PSML语言中的混合推理.β-PSML语言中的混合推理问题可以描述为:通过结合Horn子句的前件与描述逻辑的术语是否可以推导出Horn子句集中一些Horn子句的前件. 展开更多
关键词 WEB智能 智慧Web 分布式问题解决 问题解决标记语言 混合推理
下载PDF
基于自注意力机制预训练跨蒙汉语言模型 被引量:1
14
作者 苏依拉 高芬 +1 位作者 牛向华 仁庆道尔吉 《计算机应用与软件》 北大核心 2021年第2期165-170,共6页
针对蒙汉机器翻译中平行语料资源稀缺的问题,提出利用单语语料库对蒙汉机器翻译进行研究。由于利用单语语料库进行机器翻译的效果较差,故将基于自注意力机制预训练跨蒙汉语言模型应用于基于单语语料库训练的蒙汉机器翻译系统中。实验结... 针对蒙汉机器翻译中平行语料资源稀缺的问题,提出利用单语语料库对蒙汉机器翻译进行研究。由于利用单语语料库进行机器翻译的效果较差,故将基于自注意力机制预训练跨蒙汉语言模型应用于基于单语语料库训练的蒙汉机器翻译系统中。实验结果表明,基于自注意力机制预训练跨蒙汉语言模型的方法极大改善了蒙汉机器翻译系统的性能。 展开更多
关键词 蒙汉机器翻译 单语训练 自注意力机制 预训练 语言模型
下载PDF
基于统计的蒙汉机器翻译中词对齐方法研究 被引量:2
15
作者 苏依拉 赵亚平 牛向华 《中文信息学报》 CSCD 北大核心 2018年第6期44-51,共8页
蒙古语属于小语种,蒙古语到汉语机器翻译相关研究进展缓慢。所以,实现高质量的蒙汉机器翻译对我国少数民族地区信息化发展有着重要意义。其中,词语对齐对机器翻译质量起着至关重要的作用。该文提出了一种基于蒙古语切分的词干词缀为基... 蒙古语属于小语种,蒙古语到汉语机器翻译相关研究进展缓慢。所以,实现高质量的蒙汉机器翻译对我国少数民族地区信息化发展有着重要意义。其中,词语对齐对机器翻译质量起着至关重要的作用。该文提出了一种基于蒙古语切分的词干词缀为基本单位的蒙汉机器翻译词对齐方法。该方法利用词干词缀表和逆向最大匹配算法来实现蒙古语句子词干词缀的切分。实验结果表明对蒙古语进行词干词缀的切分能够显著提高对数线性词对齐模型的对齐质量。 展开更多
关键词 词对齐 IBM模型 词干词缀切分 对数线性模型
下载PDF
智能机器人机械图自动理解的研究 被引量:1
16
作者 苏依拉 寿永熙 陈正文 《内蒙古工业大学学报(自然科学版)》 2001年第1期52-57,共6页
本文论述了智能机器人的机械图理解 .这一理解过程包括机械图三维模型的建立 ,利用了人理解三视图的知识和三视图之间的对应关系 ,从组合体的三视图中提取出具有三维信息的基元体 ,并由基元体形成组合体的三维结构 ;零件图的理解和装配... 本文论述了智能机器人的机械图理解 .这一理解过程包括机械图三维模型的建立 ,利用了人理解三视图的知识和三视图之间的对应关系 ,从组合体的三视图中提取出具有三维信息的基元体 ,并由基元体形成组合体的三维结构 ;零件图的理解和装配图的理解 .整个系统采用了类似于专家系统的结构 . 展开更多
关键词 机械图理解 三视图理解 智能机器人 机器人视觉 三维模型
下载PDF
三视图的自动理解研究 被引量:1
17
作者 苏依拉 寿永熙 陈正文 《内蒙古工业大学学报(自然科学版)》 2001年第3期231-236,共6页
本文论述了三视图理解 ,实现了由等厚基元体组成的组合体的三视图理解 .这一理解过程包括组合体三维模型的建立 ;闭环的提取 ;等厚基元体的形成 ;实际基元体的形成及三维结构的形成 .整个系统采用了类似于专家系统的结构 ,利用了人理解... 本文论述了三视图理解 ,实现了由等厚基元体组成的组合体的三视图理解 .这一理解过程包括组合体三维模型的建立 ;闭环的提取 ;等厚基元体的形成 ;实际基元体的形成及三维结构的形成 .整个系统采用了类似于专家系统的结构 ,利用了人理解三视图的知识和三视图之间的对应关系 ,从组合体的三视图中提取出了具有三维信息的基元体 ,并由基元体形成了组合体的三维结构 . 展开更多
关键词 三视图理解 智能机器人 机器人视觉
下载PDF
β-PSML语言在WI的分布式环境中的应用
18
作者 苏依拉 刘椿年 《北京工业大学学报》 EI CAS CSCD 北大核心 2011年第2期260-265,共6页
在分布式、网络计算环境中,为了使在线的发现和匹配方法可行,采用预先定义的问题解决标记语言(problem solver markup language,PSML)的语法和语义开发和编写个体的内容和服务.在大型分布式Web环境下,提出了一种基于β-PSML的问题解决方... 在分布式、网络计算环境中,为了使在线的发现和匹配方法可行,采用预先定义的问题解决标记语言(problem solver markup language,PSML)的语法和语义开发和编写个体的内容和服务.在大型分布式Web环境下,提出了一种基于β-PSML的问题解决方法.实例表明,该方法可以很好地解决在分布式环境中的一些具体问题. 展开更多
关键词 WEB智能 智慧Web 分布式问题解决 问题解决标记语言
下载PDF
基于约束满足和贝叶斯网络的大规模定制产品配置方法
19
作者 苏依拉 李慧旻 王斐 《北京工业大学学报》 CAS CSCD 北大核心 2015年第7期1005-1011,共7页
针对在产品配置过程中忽略了用户兴趣这一不足,提出了一种基于约束满足问题(constraint satisfaction problem,CSP)与贝叶斯网络(Bayesian network,BN)二者结合的产品配置方法.在CSP与BN的理论基础上,建立了基于CSP与BN的配置模型,给出... 针对在产品配置过程中忽略了用户兴趣这一不足,提出了一种基于约束满足问题(constraint satisfaction problem,CSP)与贝叶斯网络(Bayesian network,BN)二者结合的产品配置方法.在CSP与BN的理论基础上,建立了基于CSP与BN的配置模型,给出了求解的具体方法.最后以组装电脑为例,开发了组装电脑产品的配置系统,该系统验证了这种配置方法能对配置结果进行优化,具有一定的可行性和有效性. 展开更多
关键词 大规模定制 产品配置 约束满足问题(CSP) 贝叶斯网络(BN)
下载PDF
基于对偶学习的西里尔蒙古语-汉语机器翻译研究
20
作者 苏依拉 孙晓骞 +1 位作者 巴图其其格 仁庆道尔吉 《计算机应用与软件》 北大核心 2020年第1期172-178,共7页
目前,基于端到端的神经机器翻译(NMT)在大语种上取得了显著的效果,已经成为学术界非常流行的方法,然而该模型的训练严重依赖平行语料库的大小,通常需要上百万句,而西里尔蒙古语和汉语之间的平行语料库严重匮乏,并且人工构建代价昂贵。因... 目前,基于端到端的神经机器翻译(NMT)在大语种上取得了显著的效果,已经成为学术界非常流行的方法,然而该模型的训练严重依赖平行语料库的大小,通常需要上百万句,而西里尔蒙古语和汉语之间的平行语料库严重匮乏,并且人工构建代价昂贵。因此,提出基于对偶学习的西里尔蒙汉互译方法。为了缓解因未登录词导致的译文质量不高的问题,采用BPE(Byte Pair Encoding)技术对语料进行预处理。将通过单语数据预训练的语言模型和20%的平行双语数据预训练的翻译模型作为该模型训练的初始状态。以NMT为基线系统,实验结果表明,该方法达到了与NMT使用西里尔蒙汉全部双语数据相当的效果,有效缓解了因未登录词较多和平行语料库匮乏导致的译文质量不高的问题。 展开更多
关键词 对偶学习 机器翻译 西里尔蒙古语-汉语 BPE 单语语料库
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部