期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于单语语料和词向量对齐的蒙汉神经机器翻译研究 被引量:12
1
作者 曹宜超 高翊 +3 位作者 李淼 冯韬 王儒敬 付莎 《中文信息学报》 CSCD 北大核心 2020年第2期27-32,37,共7页
近年来,随着人工智能和深度学习的发展,神经机器翻译在某些高资源语言对上取得了接近人类水平的效果。然而对于低资源语言对如汉语和蒙古语,神经机器翻译的效果并不尽如人意。为了提高蒙汉神经机器翻译的性能,该文基于编码器-解码器神... 近年来,随着人工智能和深度学习的发展,神经机器翻译在某些高资源语言对上取得了接近人类水平的效果。然而对于低资源语言对如汉语和蒙古语,神经机器翻译的效果并不尽如人意。为了提高蒙汉神经机器翻译的性能,该文基于编码器-解码器神经机器翻译架构,提出一种改善蒙汉神经机器翻译结果的方法。首先将蒙古语和汉语的词向量空间进行对齐并用它来初始化模型的词嵌入层,然后应用联合训练的方式同时训练蒙古语到汉语的翻译和汉语到蒙古语的翻译。并且在翻译的过程中,最后使用蒙古语和汉语的单语语料对模型进行去噪自编码的训练,增强编码器的编码能力和解码器的解码能力。实验结果表明该文所提出方法的效果明显高于基线模型,证明该方法可以提高蒙汉神经机器翻译的性能。 展开更多
关键词 蒙汉神经机器翻译 单语语料 向量对齐
下载PDF
基于潜层向量对齐的持续零样本学习算法 被引量:4
2
作者 钟小容 胡晓 丁嘉昱 《模式识别与人工智能》 CSCD 北大核心 2021年第12期1152-1159,共8页
在持续学习多任务过程中,持续零样本学习旨在积累已见类知识,并用于识别未见类样本.然而,在连续学习过程中容易产生灾难性遗忘,因此,文中提出基于潜层向量对齐的持续零样本学习算法.基于交叉分布对齐变分自编码器网络框架,将当前任务与... 在持续学习多任务过程中,持续零样本学习旨在积累已见类知识,并用于识别未见类样本.然而,在连续学习过程中容易产生灾难性遗忘,因此,文中提出基于潜层向量对齐的持续零样本学习算法.基于交叉分布对齐变分自编码器网络框架,将当前任务与已学任务的视觉潜层向量对齐,增大不同任务潜层空间的相似性.同时,结合选择性再训练方法,提高当前任务模型对已学任务判别能力.针对不同任务,采用已见类视觉-隐向量和未见类语义-隐向量训练独立的分类器,实现零样本图像分类.在4个标准数据集上的实验表明文中算法能有效实现持续零样本识别任务,缓解算法的灾难性遗忘. 展开更多
关键词 持续零样本学习 灾难性遗忘 潜层向量对齐 选择性再训练
下载PDF
基于跨语言对齐词向量的汉日词汇意义比较研究 被引量:1
3
作者 胡楠 张文强 胡韧奋 《语言文字应用》 CSSCI 北大核心 2022年第2期133-143,共11页
跨语言的词汇意义比较不仅是词汇类型学研究的重要基础,也可为二语词汇习得和文化影响研究提供参考。为了实现大规模的词汇意义比较,本文提出了一种基于跨语言词向量对齐的方法,以汉语和日语的词汇语义比较为例展开了系统分析。首先,通... 跨语言的词汇意义比较不仅是词汇类型学研究的重要基础,也可为二语词汇习得和文化影响研究提供参考。为了实现大规模的词汇意义比较,本文提出了一种基于跨语言词向量对齐的方法,以汉语和日语的词汇语义比较为例展开了系统分析。首先,通过汉语和日语预训练词向量获得两种语言中的词汇语义表示,然后,对预训练的两种语言词向量进行空间对齐,以此为基础,分别从词汇概念语义场和同形汉字词两个角度探究汉语和日语词汇的语义相似程度。考察汉日词汇概念语义场时,本文构建了涵盖20个语义场、897个词对的概念词表,通过跨语言词向量计算揭示了两种语言的语义场异同。在同形汉字词分析中,本文通过分类和聚类方法系统考察了3380对同形汉字词的意义分布情况,以期为跨语言词汇意义比较研究提供新的视角。 展开更多
关键词 向量对齐 跨语言词义比较 汉日同形词 词汇类型学
下载PDF
基于窗口中像素分量关联性差异的图像滤波研究
4
作者 贾立国 杜新彦 《激光杂志》 北大核心 2015年第7期58-62,共5页
已有的椒盐噪声滤波方案的颜色还原或细节保护方面均有不足,提出了一种基于滤波窗口像素分量间关联性差异的脉冲噪声检测与滤波算法。针对像素分量分析滤波窗口中像素的差异,并结合分量间的关联度提高噪声检测正确率;滤波阶段,对向量滤... 已有的椒盐噪声滤波方案的颜色还原或细节保护方面均有不足,提出了一种基于滤波窗口像素分量间关联性差异的脉冲噪声检测与滤波算法。针对像素分量分析滤波窗口中像素的差异,并结合分量间的关联度提高噪声检测正确率;滤波阶段,对向量滤波改进,提高参考向量的可靠性,将噪声像素与参考向量进行最优对齐,从而实现像素亮度与颜色的最佳复原。对比试验结果证明,本算法具有较高的颜色还原与细节保护性能,脉冲检测与滤波效果均明显优于同类型算法。 展开更多
关键词 椒盐噪声 颜色还原 向量对齐 细节保护 脉冲滤波
下载PDF
基于最优几何匹配的时间连贯3D动画重建
5
作者 王建华 冉煜琨 《电子设计工程》 2021年第20期36-42,共7页
为了优化RGB-D数据的3D重建,提出一种时间连贯的3D重建方法。在数据采集后,从映射到深度数据的RGB数据中提取光学特征点,以得到两个帧之间的初始稀疏3D对应关系。利用最优几何匹配程序进行特征点细化,使用这些特征点对连续帧中的两个3D... 为了优化RGB-D数据的3D重建,提出一种时间连贯的3D重建方法。在数据采集后,从映射到深度数据的RGB数据中提取光学特征点,以得到两个帧之间的初始稀疏3D对应关系。利用最优几何匹配程序进行特征点细化,使用这些特征点对连续帧中的两个3D点云进行独立于帧分辨率的匹配;利用运动向量对齐方法重建时间连贯的3D动画。实验结果表明,所提方法可以重建时间连贯的3D动画。与其他方法相比,所提方法数据丢失较少,在平均误差方面具有一定优势,而且在计算方面也具有高效性。 展开更多
关键词 RGB-D数据 3D重建 特征点 最优几何匹配 运动向量对齐 平均误差
下载PDF
低资源语种傣汉神经机器翻译方法 被引量:2
6
作者 高翊 付莎 +3 位作者 胡泽林 李淼 冯韬 麻之润 《昆明理工大学学报(自然科学版)》 CAS 北大核心 2020年第4期57-63,共7页
近年来随着人工智能和深度学习的发展,在神经机器翻译(NMT)的加持下,机器翻译的水平取得了长足的进步,但是在较大语料的情况下才能取得好的效果.此外,NMT的成功需要依赖于大量高质量的双语语料作为训练数据.在英法等丰富资源的语种(Rich... 近年来随着人工智能和深度学习的发展,在神经机器翻译(NMT)的加持下,机器翻译的水平取得了长足的进步,但是在较大语料的情况下才能取得好的效果.此外,NMT的成功需要依赖于大量高质量的双语语料作为训练数据.在英法等丰富资源的语种(Rich resource language)翻译任务上,神经机器翻译机器的表现几乎可以媲美人类的水平.对于一些小语种(俗称低资源语种:Low resource language),无法提供足够多的双语数据,导致NMT出现过拟合问题,从而降低翻译效果.据此本文以低资源的汉傣语翻译为例,针对神经机器在低资源汉傣语机器翻译表现不佳的问题现状,开展了如下研究:(1)构造了以词向量为基础的初始化模型,利用傣汉词向量空间对齐的方法,来初始化神经翻译模型的词嵌入层以提高翻译的性能;(2)设计了傣汉词向量空间的对齐方法;(3)提出了一种基于词对齐的神经机器翻译框架.通过汉/傣、傣/汉双向翻译实验证明,该方法可以分别使汉/傣、傣/汉机器翻译的BLEU值提高2.38个和0.43个BLEU点. 展开更多
关键词 低资源神经机器翻译 初始化模型 向量对齐 注意力机制
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部