期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
基于类型矩阵转移的汉越事件因果关系识别
1
作者 高盛祥 熊琨 +2 位作者 余正涛 张磊 黄于欣 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第1期118-127,共10页
针对汉越跨语言新闻事件因果关系识别中,汉越跨语言的文本语义空间难以统一、新闻之间的因果关联特征捕获困难的问题,提出了基于类型矩阵转移的汉越跨语言新闻事件因果关系识别方法。通过跨语言预训练统一汉越跨语言的文本语义空间,使... 针对汉越跨语言新闻事件因果关系识别中,汉越跨语言的文本语义空间难以统一、新闻之间的因果关联特征捕获困难的问题,提出了基于类型矩阵转移的汉越跨语言新闻事件因果关系识别方法。通过跨语言预训练统一汉越跨语言的文本语义空间,使用树形长短期记忆循环神经网络提取汉越文本中的句法结构化特征,融入汉越句法特征并结合基于事件类型转移的注意力机制,对汉越事件句对的因果关系进行识别。实验结果表明,该方法在汉越跨语言新闻事件因果关系的识别上较基线模型准确率有所提升。 展开更多
关键词 汉越跨语言 事件类型 语言对抗 句法信息 因果关系
下载PDF
基于降噪原型序列的汉越神经机器翻译
2
作者 杨汉清 赖华 +1 位作者 于志强 余正涛 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期705-713,共9页
[目的]在汉越低资源场景下,平行语料匮乏,原型序列蕴含庞杂的信息,直接使用会增加翻译模型训练的难度,甚至引入噪声,故对原型序列的降噪策略进行研究.[方法]首先,利用跨语言检索得到原型序列;其次,基于实体词典对原型序列中的噪声信息... [目的]在汉越低资源场景下,平行语料匮乏,原型序列蕴含庞杂的信息,直接使用会增加翻译模型训练的难度,甚至引入噪声,故对原型序列的降噪策略进行研究.[方法]首先,利用跨语言检索得到原型序列;其次,基于实体词典对原型序列中的噪声信息进行掩盖,再综合稀有词词频及语义相似度,得到原型序列的参考价值;最后使用额外的编码器接收原型序列,并允许解码器到两个编码器间建立注意力机制.[结果]相比基线模型,相似度评分、稀有词词频、依据实体词典降噪,以及3种降噪融合的策略使汉越神经机器翻译的性能分别提升0.24,0.12,0.29,以及0.69个百分点的BLEU值.[结论]经降噪策略处理的原型序列能提升汉越神经机器翻译的性能. 展开更多
关键词 汉越神经机器翻译 低资源 原型序列 降噪
下载PDF
融合新冠领域知识的汉越神经机器翻译方法
3
作者 谷雪鹏 张乐乐 +1 位作者 郭军军 余正涛 《陕西理工大学学报(自然科学版)》 2023年第4期26-34,共9页
目前对于汉语-越南语语种,特定领域包含大量的领域词,在低资源的情况下不能得到很好的翻译效果。针对上述问题,提出融合新冠领域知识的汉越神经机器翻译方法,通过识别源语句中的领域词,在编码阶段,增加一个领域知识的编码模块,学习领域... 目前对于汉语-越南语语种,特定领域包含大量的领域词,在低资源的情况下不能得到很好的翻译效果。针对上述问题,提出融合新冠领域知识的汉越神经机器翻译方法,通过识别源语句中的领域词,在编码阶段,增加一个领域知识的编码模块,学习领域词的向量表示,引入领域词-编码器的注意力机制,利用领域词增强源语言句子的向量表示。在解码阶段,引入领域词-解码器的注意力机制,通过领域词和源语言共同指导目标译文的生成。根据构建的新冠疫情领域数据实验结果,在特定领域下汉越神经机器翻译的性能得到了提升。 展开更多
关键词 领域知识 汉越神经机器翻译 领域词编码器 注意力机制 领域机器翻译
下载PDF
中国特色文化词句的汉越翻译研究
4
作者 谭凌燕 《辽宁经济职业技术学院学报.辽宁经济管理干部学院》 2023年第3期80-82,共3页
中国特色文化词句的外文翻译为实现中国走向世界,世界深入了解中国开辟了新路径。中越两国文化、文字有着特殊的渊源,中国特色文化词句的汉越翻译策略需结合具体词句的性质、特点,采用借汉根词译法、意译+增译法、意译法、直译法等翻译... 中国特色文化词句的外文翻译为实现中国走向世界,世界深入了解中国开辟了新路径。中越两国文化、文字有着特殊的渊源,中国特色文化词句的汉越翻译策略需结合具体词句的性质、特点,采用借汉根词译法、意译+增译法、意译法、直译法等翻译方法与技巧,在确保译文准确的基础上,尽可能保持中国元素、中国特色,让越南人民更好地了解中国,有效促进中越文化的交流与互鉴。 展开更多
关键词 中国特色文化词句 翻译策略 特殊历史背景 汉越翻译方法与技巧
下载PDF
略谈汉越词特点及其对汉越互译的影响 被引量:2
5
作者 王光和 段素娟 《大理学院学报(综合版)》 CAS 2011年第7期42-47,共6页
从秦汉时期起,大量古汉语的词汇传入越南,被越南语吸收和越化,被称为“汉越词”。汉越词是越南语词汇库的重要组成部分,约占越南语词汇总量的60%~70%。汉语词传入越南之后,有些仍然保持其原义,但有些经过演变导致词义扩展、缩... 从秦汉时期起,大量古汉语的词汇传入越南,被越南语吸收和越化,被称为“汉越词”。汉越词是越南语词汇库的重要组成部分,约占越南语词汇总量的60%~70%。汉语词传入越南之后,有些仍然保持其原义,但有些经过演变导致词义扩展、缩减或改变。因此在汉越互译时必须深入了解这些汉越词的词义和用法等特点。通过简介汉越词的词义和演变来分析汉越词对汉越互译过程的影响,并进而提出汉越互译教学中具有针对性的教学策略。 展开更多
关键词 汉越 汉越互译 影响
下载PDF
类型感知的汉越跨语言事件检测方法 被引量:1
6
作者 张磊 高盛祥 +2 位作者 余正涛 刘畅 陈瑞清 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2022年第5期803-811,共9页
针对汉越跨语言事件检测缺少平行语料,越南语标注困难,需要统一跨语言语义空间,且触发词存在较大的歧义和局限性等问题,提出基于事件类型感知的汉越跨语言事件检测方法。构造类型感知的注意力机制突显事件特征,融入汉越的词位置、词性... 针对汉越跨语言事件检测缺少平行语料,越南语标注困难,需要统一跨语言语义空间,且触发词存在较大的歧义和局限性等问题,提出基于事件类型感知的汉越跨语言事件检测方法。构造类型感知的注意力机制突显事件特征,融入汉越的词位置、词性和命名实体信息,并通过梯度反转(gradient reversal layer,GRL),实现有标注汉语和无标注越南语之间的对抗训练,将从大量汉语新闻文本中学到的语言无关的事件类型特征融入到联合特征提取器中,进行汉越跨语言的无触发词事件检测,缓解越南语的数据稀缺和触发词的局限性。实验中提出的方法较最好的基线模型在准确率上提升了4.32%。 展开更多
关键词 汉越跨语言事件检测 无触发词 事件类型感知 梯度反转 语言对抗
下载PDF
秦汉时期的汉越民族关系 被引量:2
7
作者 王文光 李汹 《中南民族大学学报(人文社会科学版)》 CSSCI 北大核心 2006年第4期35-40,共6页
秦汉时期中国南方民族关系的主要方面是汉越民族关系,由于大汉族主义思想膨胀和越民族上层贵族中民族主义思想的抬头,所以汉越民族关系常以矛盾冲突的形式表现出来,但这种冲突在客观上起到了加强汉越民族交往,促进经济文化交流和民族融... 秦汉时期中国南方民族关系的主要方面是汉越民族关系,由于大汉族主义思想膨胀和越民族上层贵族中民族主义思想的抬头,所以汉越民族关系常以矛盾冲突的形式表现出来,但这种冲突在客观上起到了加强汉越民族交往,促进经济文化交流和民族融合的作用。 展开更多
关键词 秦汉时期 汉越民族 民族关系 交流与融合
下载PDF
“V着”的汉越对比及偏误分析 被引量:2
8
作者 刘瑜 陈德胜 《云南师范大学学报(对外汉语教学与研究版)》 2010年第4期72-77,共6页
文章通过考察持续体标记"着"各类句式在越南语中的对应形式,发现越南语只有表示进行体的副词"",没有类似于"着"的持续体标记。越南语在表示动作或状态的持续时,动词后通常不带任何时体标记,或使用"动词+dang"表达。学习者容易... 文章通过考察持续体标记"着"各类句式在越南语中的对应形式,发现越南语只有表示进行体的副词"",没有类似于"着"的持续体标记。越南语在表示动作或状态的持续时,动词后通常不带任何时体标记,或使用"动词+dang"表达。学习者容易出现回避使用"着"的情况;由于对"着"使用条件说明不清楚,学习者也出现在不该用"着"的时候误加"着"、用"着"误代补语、滥用"V1着V2"等情况。汉语"V1着V1着,V2"结构用法特殊,使用语境要求高,越南语对应形式多样,学习者容易出错。 展开更多
关键词 汉越对比 “着” 持续体标记
下载PDF
双音节汉越词词义特点研究 被引量:1
9
作者 范明芳 《湖北科技学院学报》 2015年第9期125-128,共4页
"汉越词"占越南语词汇总量的60%,研究"汉越词"对汉语和越南语的二语教学都有一定的积极意义。本文全面搜集权威越南语词典中的汉越词,对汉越词的整体状况做出一个全面的梳理,对双音节汉越词进行系统的分类;在此基... "汉越词"占越南语词汇总量的60%,研究"汉越词"对汉语和越南语的二语教学都有一定的积极意义。本文全面搜集权威越南语词典中的汉越词,对汉越词的整体状况做出一个全面的梳理,对双音节汉越词进行系统的分类;在此基础上分析了双音节汉越词的词义特点,探讨了双音节汉越词与对应汉语词词义特点的异同,同时研究了汉越词的"语义域"问题。 展开更多
关键词 双音节汉越 汉越对比 词义 语义域
下载PDF
论越语中的变体双音节汉越词 被引量:1
10
作者 范明芳 《外国语文研究》 2016年第1期19-27,共9页
据统计,越南语中"汉越词"的数量占到越南语词汇总量65%,因此,研究"汉越词"对汉语教学以及越南语教学有很大的帮助。本文全面搜集权威越南语词典中的汉越词,统计出所有变体双音节汉越词,并从双音节汉越词的词序、语... 据统计,越南语中"汉越词"的数量占到越南语词汇总量65%,因此,研究"汉越词"对汉语教学以及越南语教学有很大的帮助。本文全面搜集权威越南语词典中的汉越词,统计出所有变体双音节汉越词,并从双音节汉越词的词序、语音和越化三个角度来分析双音节汉越词的特点,归纳出变体双音节汉越词形成的原因。经研究发现,汉语进入越南语之后必须根据越南语的句法、构词方式来创造新词,汉语词汇已经被越化。此外,变体双音节汉越词还受到越南人的语言、思维习惯和中国南方方言的影响。 展开更多
关键词 双音节汉越 汉越对比 变体
下载PDF
浅谈“把”字句和“被”字句的汉越互译技巧 被引量:2
11
作者 李太生 《南宁职业技术学院学报》 2008年第4期84-87,共4页
越南语中没有与"把"相对应的词,也没有与之对应的句型。在语言实际运用中为了在互译时能适应汉、越双方的语言特点和习惯,必须弄清楚"把"字句和"被"字句的语义特点,在论述"把"字句和"被&q... 越南语中没有与"把"相对应的词,也没有与之对应的句型。在语言实际运用中为了在互译时能适应汉、越双方的语言特点和习惯,必须弄清楚"把"字句和"被"字句的语义特点,在论述"把"字句和"被"字句语义特点的基础上,提出互译时的解决方法和技巧。 展开更多
关键词 “把”字句和“被”字句 汉越互译 技巧
下载PDF
礼貌原则下汉越称呼语语用对比分析 被引量:1
12
作者 谢小玲 《钦州学院学报》 2015年第3期50-54,共5页
遵循礼貌原则的称呼是保证言语交际成功的先决条件。汉越称呼语的礼貌原则深受汉族伦理文化的影响,但因民族和社会发展变迁的不同,表达礼貌的称呼方式也有所不同。对比分析礼貌原则下汉越称呼语跨文化语用差异,可帮助外语学习者减少跨... 遵循礼貌原则的称呼是保证言语交际成功的先决条件。汉越称呼语的礼貌原则深受汉族伦理文化的影响,但因民族和社会发展变迁的不同,表达礼貌的称呼方式也有所不同。对比分析礼貌原则下汉越称呼语跨文化语用差异,可帮助外语学习者减少跨文化语用失误,提升他们的称呼语语用能力。 展开更多
关键词 礼貌原则 汉越称呼语 跨文化 语用对比
下载PDF
汉越佛教熟语之文化研究
13
作者 赵燕华 《广西社会科学》 CSSCI 北大核心 2013年第2期151-155,共5页
汉越佛教熟语在文化上同中有异。在佛教神祗形象方面,相同之处为罗汉(La Hán)表示数量多、弥勒佛(Di Lc)表示胖而和善、夜叉(D.aXoa)表示丑恶;不同之处为观音和氏敬、如来和释迦、金刚和护法、关公和德翁是4对相似而又体现不同... 汉越佛教熟语在文化上同中有异。在佛教神祗形象方面,相同之处为罗汉(La Hán)表示数量多、弥勒佛(Di Lc)表示胖而和善、夜叉(D.aXoa)表示丑恶;不同之处为观音和氏敬、如来和释迦、金刚和护法、关公和德翁是4对相似而又体现不同文化背景的神祗形象。在寺庙文化方面,汉越语中对佛教徒的称呼不同,汉越佛教熟语所反映的寺庙饮食文化和礼拜文化也不相同。 展开更多
关键词 汉越 佛教 熟语 文化
下载PDF
汉越数词“一mt”比较与翻译探析
14
作者 何会仙 江海燕 方芳 《湖北函授大学学报》 2013年第6期111-112,共2页
本文立足于汉越翻译,对汉越语言中的"一mtt"词义作陈列,对汉越数词"一mt’进行对比分析,着重两者的相同、相似与差异,探索了汉越数字词"一mt"的翻译方法。本文结论对汉越语互译、语言教学和跨文化交际... 本文立足于汉越翻译,对汉越语言中的"一mtt"词义作陈列,对汉越数词"一mt’进行对比分析,着重两者的相同、相似与差异,探索了汉越数字词"一mt"的翻译方法。本文结论对汉越语互译、语言教学和跨文化交际有一定的意义。 展开更多
关键词 汉越 数字词 比较 翻译
下载PDF
基于同义词数据增强的汉越神经机器翻译方法 被引量:11
15
作者 尤丛丛 高盛祥 +2 位作者 余正涛 毛存礼 潘润海 《计算机工程与科学》 CSCD 北大核心 2021年第8期1497-1502,共6页
汉越平行语料库的资源稀缺,很大程度上影响了汉越机器翻译效果。数据增强是提升汉越机器翻译的有效途径,基于双语词典的词汇替换数据增强是当前较为流行的方法。由于汉语-越南语属于低资源语言对,双语词典难以获得,而通过单语词向量获... 汉越平行语料库的资源稀缺,很大程度上影响了汉越机器翻译效果。数据增强是提升汉越机器翻译的有效途径,基于双语词典的词汇替换数据增强是当前较为流行的方法。由于汉语-越南语属于低资源语言对,双语词典难以获得,而通过单语词向量获取低频词的同义词较为容易。因此,提出一种基于低频词的同义词替换的数据增强方法。该方法利用小规模的平行语料,首先通过对单语词向量的学习,获得一端语言低频词的同义词列表;然后对低频词进行同义词替换,再利用语言模型对替换后的句子进行筛选;最后将筛选后的句子与另一端语言中的句子进行匹配,获得扩展的平行语料。汉越翻译对比实验结果表明,提出的方法取得了很好的效果,扩展后的方法比基准和回译方法在BLEU值上分别提高了1.8和1.1。 展开更多
关键词 汉越 数据增强 同义词替换 神经机器翻译
下载PDF
秦汉以后国家政权在汉越互动中的作用
16
作者 魏爱棠 《百色学院学报》 2001年第2期6-9,共4页
从秦汉统一中央集权的封建国家建立以后 ,国家政权成为汉越互动中一个重要的影响因素 ,其作用并不亚于中原汉人南迁带来的民间文化流动所造成的影响。国家政权通过构筑国家政治体制 ,不断支持以华夏———汉文化为代表的国家正统文化的... 从秦汉统一中央集权的封建国家建立以后 ,国家政权成为汉越互动中一个重要的影响因素 ,其作用并不亚于中原汉人南迁带来的民间文化流动所造成的影响。国家政权通过构筑国家政治体制 ,不断支持以华夏———汉文化为代表的国家正统文化的扩张 ,促使南方百越逐渐走向涵化 。 展开更多
关键词 秦汉以后 国家政权 汉越互动 作用
下载PDF
汉越“心”的转喻义与隐喻义对比分析
17
作者 赵燕华 《阜阳师范学院学报(社会科学版)》 2015年第1期53-56,共4页
汉语"心"是一个构词能力很强的语素,越语表示"心"的词主要有"tam"和"lòng",它们的构词能力也很强。汉越"心"从认知角度来看,可分为转喻义和隐喻义。通过对比发现,汉语"心&... 汉语"心"是一个构词能力很强的语素,越语表示"心"的词主要有"tam"和"lòng",它们的构词能力也很强。汉越"心"从认知角度来看,可分为转喻义和隐喻义。通过对比发现,汉语"心"和越语"tam""lòng"的转喻义都发生在思维范畴和情感范畴,隐喻义都发生在实体范畴。但在转喻义上,汉语"心"的转喻义"珍爱物"在越语"tam"和"lòng"中就没有对应的语素义,越语"tam"和"lòng"在转喻义上则更加丰富。在隐喻义上,越语"tam"和汉语"心"基本相同,越语"lòng"隐喻义则更加丰富。对汉越"心"的转喻义和隐喻义进行对比分析,有利于进一步提高跨文化交际质量。 展开更多
关键词 “心” 转喻义 隐喻义 汉越对比
下载PDF
基于深度可分离卷积的汉越神经机器翻译 被引量:2
18
作者 徐毓 赖华 +2 位作者 余正涛 高盛祥 文永华 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第2期220-224,共5页
在汉越神经机器翻译中,由于汉越平行语料稀少,使得数据稀疏问题十分严重,极大地影响了模型的翻译效果.为了提升数据稀疏情况下的汉越神经机器翻译性能,提出一种基于深度可分离卷积的汉越神经机器翻译方法.该方法根据越南语的语言特点,... 在汉越神经机器翻译中,由于汉越平行语料稀少,使得数据稀疏问题十分严重,极大地影响了模型的翻译效果.为了提升数据稀疏情况下的汉越神经机器翻译性能,提出一种基于深度可分离卷积的汉越神经机器翻译方法.该方法根据越南语的语言特点,将越南语切分为词、音节、字符、子词4种不同的粒度并利用深度可分离卷积改进神经机器翻译模型,通过增加深度可分离卷积神经网络,对模型输入的不同粒度序列进行卷积运算,提取更多的特征数据,相比传统卷积降低了模型的理论计算量.实验结果表明,该方法在越南语4种不同翻译粒度上均取得最佳效果,一定程度上提升了汉越神经机器翻译性能. 展开更多
关键词 汉越神经机器翻译 数据稀疏 粒度 深度可分离卷积
下载PDF
融合单语语言模型的汉越伪平行语料生成 被引量:2
19
作者 贾承勋 赖华 +2 位作者 余正涛 文永华 于志强 《计算机应用》 CSCD 北大核心 2021年第6期1652-1658,共7页
神经机器翻译在资源丰富的语种上取得了良好的翻译效果,但是由于数据稀缺问题在汉语-越南语这类低资源语言对上的性能不佳。目前缓解该问题最有效的方法之一是利用现有资源生成伪平行数据。考虑到单语数据的可利用性,在回译方法的基础上... 神经机器翻译在资源丰富的语种上取得了良好的翻译效果,但是由于数据稀缺问题在汉语-越南语这类低资源语言对上的性能不佳。目前缓解该问题最有效的方法之一是利用现有资源生成伪平行数据。考虑到单语数据的可利用性,在回译方法的基础上,首先将利用大量单语数据训练的语言模型与神经机器翻译模型进行融合,然后在回译过程中通过语言模型融入语言特性,以此生成更规范质量更优的伪平行数据,最后将生成的语料添加到原始小规模语料中训练最终翻译模型。在汉越翻译任务上的实验结果表明,与普通的回译方法相比,通过融合语言模型生成的伪平行数据使汉越神经机器翻译的BLEU值提升了1.41个百分点。 展开更多
关键词 汉越神经机器翻译 数据增强 伪平行数据 单语数据 语言模型
下载PDF
基于回译和比例抽取孪生网络筛选的汉越平行语料扩充方法 被引量:4
20
作者 王可超 郭军军 +2 位作者 张亚飞 高盛祥 余正涛 《计算机工程与科学》 CSCD 北大核心 2022年第10期1861-1868,共8页
回译作为翻译中重要的数据增强方法,受到了越来越多研究者的关注。其基本思想为首先基于平行语料训练基础翻译模型,然后利用模型将单语语料翻译为目标语言,组合为新语料用于模型训练。然而在汉-越低资源场景下,训练得到的基础翻译模型... 回译作为翻译中重要的数据增强方法,受到了越来越多研究者的关注。其基本思想为首先基于平行语料训练基础翻译模型,然后利用模型将单语语料翻译为目标语言,组合为新语料用于模型训练。然而在汉-越低资源场景下,训练得到的基础翻译模型性能较差,导致在其上应用回译方法得到的平行语料中含有较多噪声,较难用于下游任务。针对此问题,构建基于比例抽取的孪生网络筛选模型,通过训练使得模型可以识别平行句对和伪平行句对,在同一语义空间上对回译得到的伪平行语料进行筛选去噪,进而得到更优的平行语料。在汉越数据集上的实验结果表明,所提方法训练的模型的性能相较基线模型有显著提升。 展开更多
关键词 汉越平行语料扩充 回译 数据增强 比例抽取 孪生网络
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部