期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
无监督句对齐综述
1
作者 谷仕威 刘静 +1 位作者 李丙春 熊德意 《计算机科学》 CSCD 北大核心 2024年第1期60-67,共8页
无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面... 无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面,无监督句对齐涵盖了多种方法,包括基于多语言嵌入、聚类和自监督或者生成模型等。然而,无监督句对齐面临着多样性、语言差异和领域适应等挑战。语言的多义性和差异性使得句对齐变得复杂,尤其在低资源语言中更为明显。尽管面临挑战,无监督句对齐在跨语言信息检索、机器翻译、多语言信息聚合等领域具有重要应用。通过无监督句对齐,可以将不同语言中的信息整合,提升信息检索的效果。同时,该领域的研究也在不断推动技术的创新和发展,为实现更准确和稳健的无监督句对齐提供了契机。 展开更多
关键词 无监督句对齐 自然语言处理 机器翻译 自监督 低资源
下载PDF
句对齐有声语料库在英语语音教与学中的应用 被引量:4
2
作者 高翔 黄莹 《山东外语教学》 北大核心 2009年第3期37-43,共7页
有声语料库应用于英语语音教与学具有广阔的空间。通过对目前国内外口语语料库的多层次划类,发现能有效应用于学生自主学习和语音课堂教学的有声语料库比较贫乏。笔者结合句对齐有声语料库的开发及其在英语语音教与学中的应用,描述了... 有声语料库应用于英语语音教与学具有广阔的空间。通过对目前国内外口语语料库的多层次划类,发现能有效应用于学生自主学习和语音课堂教学的有声语料库比较贫乏。笔者结合句对齐有声语料库的开发及其在英语语音教与学中的应用,描述了此类语料库应用于提高超音段音位和音段音位发音能力的效果与局限。 展开更多
关键词 句对齐 有声语料库 口语语料库 语音
下载PDF
融合小句对齐知识的汉英神经机器翻译 被引量:4
3
作者 苗国义 刘明童 +3 位作者 陈钰枫 徐金安 张玉洁 冯文贺 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第1期61-68,共8页
针对当前神经机器翻译在捕捉复杂句内小句间的语义和结构关系方面存在不足,导致复杂句长文本翻译的篇章连贯性不佳的问题,提出一种融合小句对齐知识的汉英神经机器翻译方法。首先提出手工和自动相结合的标注方案,构建大规模小句对齐的... 针对当前神经机器翻译在捕捉复杂句内小句间的语义和结构关系方面存在不足,导致复杂句长文本翻译的篇章连贯性不佳的问题,提出一种融合小句对齐知识的汉英神经机器翻译方法。首先提出手工和自动相结合的标注方案,构建大规模小句对齐的汉英平行语料库,为模型训练提供丰富的小句级别的汉英双语对齐知识;然后设计一种基于小句对齐学习的神经机器翻译模型,通过融合小句对齐知识,增强模型学习复杂句内小句间语义结构关系的能力。在WMT17,WMT18和WMT19汉英翻译任务中的实验表明,所提出的方法可以有效地提升神经机器翻译的性能。进一步的评测分析显示,所提方法能有效地提高汉英神经机器翻译在复杂句翻译上的篇章连贯性。 展开更多
关键词 神经机器翻译 句对齐 结构关系 篇章连贯性
下载PDF
句对齐研究综述 被引量:1
4
作者 黄佳跃 熊德意 《中文信息学报》 CSCD 北大核心 2021年第8期16-27,共12页
神经机器翻译是目前机器翻译领域的主流方法,拥有足够数量的双语平行语料是训练出一个好的翻译模型的前提。双语句对齐技术作为一种从不同语言端单语语料中获取双语平行句对的技术,因此得到广泛的研究。该文首先简单介绍句对齐任务及其... 神经机器翻译是目前机器翻译领域的主流方法,拥有足够数量的双语平行语料是训练出一个好的翻译模型的前提。双语句对齐技术作为一种从不同语言端单语语料中获取双语平行句对的技术,因此得到广泛的研究。该文首先简单介绍句对齐任务及其相应的评测标准,然后归纳总结前人在句对齐任务上的研究进展,以及句对齐任务的相关信息,并简单概括参加团队所提交的系统,最后对当前工作进行总结并展望未来的工作。 展开更多
关键词 神经机器翻译 句对齐
下载PDF
融入多特征的汉韩双语自动句对齐方法
5
作者 刘晨阳 唐慧丰 《智能计算机与应用》 2021年第1期28-31,共4页
为解决汉韩双语平行语料库资源匮乏以及传统句对齐算法面向跨语系语言准确率较低的问题,提出了融合特征的汉韩双语句对齐方法。首先将Bi-LSTM融入孪生神经网络构建句对齐模型,用以分别提取汉语和韩语句子的特征并进行对齐。之后基于语... 为解决汉韩双语平行语料库资源匮乏以及传统句对齐算法面向跨语系语言准确率较低的问题,提出了融合特征的汉韩双语句对齐方法。首先将Bi-LSTM融入孪生神经网络构建句对齐模型,用以分别提取汉语和韩语句子的特征并进行对齐。之后基于语料的特点提取句对齐特征融入输入层。通过与传统Bi-LSTM和不同特征组合的孪生Bi-LSTM的对比实验证明,融入特征的孪生Bi-LSTM方法在句对齐任务中具有更优越的性能。 展开更多
关键词 汉语-韩语 自动句对齐 孪生Bi-LSTM 多特征 平行语料库
下载PDF
利用Trados进行平行语料库的句对齐
6
作者 雷赛丹 《中国科教创新导刊》 2013年第35期156-156,共1页
随着语料库研究的迅速发展,越来越多的老师和研究者开始创建个人的双语平行语料库。然而与此同时,大家面临的一个共同难题即是双语文本的对齐处理。本文利用目前在翻译和MTI教学中最常用的Trados Studio 2011软件,推荐了一个较为简便的... 随着语料库研究的迅速发展,越来越多的老师和研究者开始创建个人的双语平行语料库。然而与此同时,大家面临的一个共同难题即是双语文本的对齐处理。本文利用目前在翻译和MTI教学中最常用的Trados Studio 2011软件,推荐了一个较为简便的句对齐方法,旨在提升双语平行语料库创建的效率。 展开更多
关键词 双语平行语料库 TRADOS Studio2011 句对齐
下载PDF
LingAlign:基于跨语言句向量的多语种句对齐方法研究
7
作者 刘磊 梁茂成 《数据分析与知识发现》 EI CSCD 北大核心 2024年第6期56-68,共13页
【目的】实现多语种句子的自动对齐,为基于平行语料库的数字人文和机器翻译研究提供支持。【方法】采用跨语言句向量技术,将待对齐的双语文本映射到一个共享的向量空间,基于双轮动态规划和改进版余弦相似度算法抽取双语文本中的平行句... 【目的】实现多语种句子的自动对齐,为基于平行语料库的数字人文和机器翻译研究提供支持。【方法】采用跨语言句向量技术,将待对齐的双语文本映射到一个共享的向量空间,基于双轮动态规划和改进版余弦相似度算法抽取双语文本中的平行句对。【结果】通过直接评测和间接评测两种方式评估系统性能:直接评测的平均准确率、召回率和F1值分别为0.950、0.960和0.955;间接评测的chrF、chrF++和COMET值分别为55.65、55.85和87.31。【局限】融合文档对齐和句子对齐的语料采集平台有待开发。【结论】所提方法在两类评测任务中的性能均优于现有方法,有助于构建大规模、高质量的多语种平行语料库。 展开更多
关键词 跨语言向量 自动句对齐 神经机器翻译
原文传递
汉英双语句对齐反思与展望
8
作者 邢富坤 《解放军外国语学院学报》 北大核心 2023年第6期70-78,156,共10页
双语对齐是开展语言对比和机器翻译研究的重要前提,目前双语对齐研究主要集中在对齐算法和模型优化上,缺少面向双语对齐的语言特征研究。本文在总结已有汉英双语句对齐工作的基础上,提出双语句对齐需满足的3个条件,并指出以句号句为单... 双语对齐是开展语言对比和机器翻译研究的重要前提,目前双语对齐研究主要集中在对齐算法和模型优化上,缺少面向双语对齐的语言特征研究。本文在总结已有汉英双语句对齐工作的基础上,提出双语句对齐需满足的3个条件,并指出以句号句为单位的汉英对齐并不满足该条件,这是造成目前汉英对齐准确率难以达到英法自动对齐水平的深层原因,应针对汉英对齐特点开展相关研究工作,寻找适合汉英对齐的语言单位,并构建相应的语料库和自动对齐模型,为汉英对齐及后续应用提供理论与资源支持。 展开更多
关键词 汉英 双语对齐 句对齐 语料库 自动对齐
原文传递
英汉环保领域平行语料的句对齐与再对齐 被引量:3
9
作者 熊文新 《现代图书情报技术》 CSSCI 北大核心 2013年第6期36-41,共6页
从资源建设角度对现有基于统计的句对齐工具进行用户易用性及性能比较,认为Champollion比较适合英汉双语句对齐处理。借鉴"基于转换错误驱动"的思路,对Champollion对齐错误结果利用语言学规则实施再对齐,使句对齐效果进一步... 从资源建设角度对现有基于统计的句对齐工具进行用户易用性及性能比较,认为Champollion比较适合英汉双语句对齐处理。借鉴"基于转换错误驱动"的思路,对Champollion对齐错误结果利用语言学规则实施再对齐,使句对齐效果进一步提升。以英汉环保领域专业文本为例,句对齐的准确率从最初的88.74%上升至93.91%。这种结合基于统计对齐工具和语言学知识应用的对齐和再对齐处理方法在"分步骤按领域"建设大规模双语语料库的过程中具有普适性。 展开更多
关键词 英汉平行语料库 环保文本 句对齐 对齐 基于转换错误驱动
原文传递
汉语-印尼语平行语料自动对齐方法研究 被引量:6
10
作者 郑铿涛 林楠铠 +2 位作者 付颖雯 王连喜 蒋盛益 《广西师范大学学报(自然科学版)》 CAS 北大核心 2019年第1期89-97,共9页
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对... 双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。 展开更多
关键词 平行语料 语料库构建 可比语料 段落对齐 句对齐
下载PDF
汉语小句的俄语对应单位研究 被引量:2
11
作者 杨毅 冯文贺 《中文信息学报》 CSCD 北大核心 2018年第1期18-25,共8页
该文标注汉俄平行文本中汉语小句的俄语对应单位,并统计分析。首先,根据汉语小句切分对齐切分俄语,得到俄语对应单位;其次,对俄语对应单位进行语法标注;最后,基于标注语料,分析发现俄语对应单位。研究发现:(1)句子组成部分多(74.85%),... 该文标注汉俄平行文本中汉语小句的俄语对应单位,并统计分析。首先,根据汉语小句切分对齐切分俄语,得到俄语对应单位;其次,对俄语对应单位进行语法标注;最后,基于标注语料,分析发现俄语对应单位。研究发现:(1)句子组成部分多(74.85%),句子少(25.15%);(2)单一述谓核心多(69.04%),无述谓核心次之(27.63%),多述谓核心少(3.33%);(3)单一述谓核心以简单谓语最多(31.84%),无述谓核心以动词短语最多(51.26%),多述谓核心以主从复合句最多(47.92%)。 展开更多
关键词 句对齐 篇章翻译 汉语小俄语对应单位
下载PDF
利用平行网页建立中英文统计翻译模型 被引量:9
12
作者 聂建云 陈江 《中文信息学报》 CSCD 北大核心 2001年第1期1-12,共12页
建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构... 建立翻译模型的目的是试图从平行文本 (或翻译例句 )中自动抽取翻译关系。本文将描述我们在建立中英文统计翻译模型上的尝试。我们所用的平行文本是从万维网上自动获得的半结构性平行文本。在训练过程中 ,我们尽量利用文本中的HTML结构信息。实验表明 ,所训练的翻译模型能达到 80 %的准确率。对于象跨语言信息检索这样的应用 ,这样的准确率已经能大致满足需要。这一工作表明 。 展开更多
关键词 中英问翻译 句对齐 统计翻译模型 跨语言信息检索 平行文本 HTML结构 准确率
下载PDF
基于军事平行语料库的人机结合翻译策略 被引量:3
13
作者 黄金柱 樊信展 +1 位作者 李峰 张克亮 《洛阳师范学院学报》 2016年第8期56-61,67,共7页
本文结合军事文本翻译的需求,提出了一种基于军事领域公开资源的平行语料库构建思路,进而提出了一种基于该平行语料库和Trados辅助翻译系统的人机结合的军事文本翻译策略,并通过对比实验分析验证了该方法的有效性.此外,为解决平行语料... 本文结合军事文本翻译的需求,提出了一种基于军事领域公开资源的平行语料库构建思路,进而提出了一种基于该平行语料库和Trados辅助翻译系统的人机结合的军事文本翻译策略,并通过对比实验分析验证了该方法的有效性.此外,为解决平行语料库的构建以及后期语料更新的问题,本文还提出了基于词汇释义句对齐的方法.通过对比分析可知,该方法能够有效处理军事文本句对齐问题. 展开更多
关键词 军事平行语料库 印度 Trados辅助翻译系统 句对齐 人机结合
下载PDF
利用翻译记忆系统自建双语平行语料库 被引量:35
14
作者 王正 孙东云 《外语研究》 CSSCI 北大核心 2009年第5期80-85,共6页
鉴于国内双语平行语料库研究的蓬勃发展,为了满足广大教师个人建设平行语料库的要求,本文介绍了一种简便而高效的建设方式,即将翻译记忆系统引入双语平行语料库的建设中来,利用翻译记忆系统的文本对齐功能,结合汉语分词软件制作出功能... 鉴于国内双语平行语料库研究的蓬勃发展,为了满足广大教师个人建设平行语料库的要求,本文介绍了一种简便而高效的建设方式,即将翻译记忆系统引入双语平行语料库的建设中来,利用翻译记忆系统的文本对齐功能,结合汉语分词软件制作出功能齐备的双语平行语料库。这种方法可以有效地提高语料库建设的效率和质量,从而拉近双语平行语料库与广大外语教师的距离。 展开更多
关键词 翻译记忆系统 双语平行语料库 级文本对齐
下载PDF
基于平行语料的查询翻译词典改进方法研究 被引量:2
15
作者 高影繁 徐红姣 王惠临 《图书情报工作》 CSSCI 北大核心 2011年第20期126-128,114,共4页
面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有... 面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。目标是生成一部基于句对齐平行语料的科技类双语概率词典,为跨语言检索查询翻译消歧提供实时性支持。 展开更多
关键词 查询翻译 机读词典 句对齐平行语料
原文传递
《红楼梦》中英文平行语料库的创建 被引量:35
16
作者 刘泽权 田璐 刘超朋 《当代语言学》 CSSCI 北大核心 2008年第4期329-339,共11页
《红楼梦》中英文平行语料库的建立,能够方便翻译学者充分利用语料库的诸多优势,系统、全面地进行研究。然而,在其创建过程中还存在包括建立语言模型、设计标记类别、双语句级对齐等诸多困难。本文结合我们在尝试解决这些问题时的具体... 《红楼梦》中英文平行语料库的建立,能够方便翻译学者充分利用语料库的诸多优势,系统、全面地进行研究。然而,在其创建过程中还存在包括建立语言模型、设计标记类别、双语句级对齐等诸多困难。本文结合我们在尝试解决这些问题时的具体思路和办法,探讨了对语料进行划分、标注、对齐等操作的可行性方案,旨在对中英文双语平行语料库的创建有所借鉴和帮助,为全面、系统地研究《红楼梦》及其三个译本提供一条有效途径。 展开更多
关键词 《红楼梦》中英文平行语料库 语料标注 子划分 对齐
原文传递
英汉医学平行语料库的创建与初始应用研究 被引量:16
17
作者 管新潮 胡开宝 张冠男 《当代外语研究》 2011年第9期36-41,61,共6页
本文介绍了英汉医学平行语料库(简称ECMPC)的创建过程和初始应用效果。建设英汉医学平行语料库的目的,是要实现临床医学科技文献在线机助翻译,支持翻译教学。在选择语料时,设计者考虑到了原文与译文的对应性、表现力、同质性、代... 本文介绍了英汉医学平行语料库(简称ECMPC)的创建过程和初始应用效果。建设英汉医学平行语料库的目的,是要实现临床医学科技文献在线机助翻译,支持翻译教学。在选择语料时,设计者考虑到了原文与译文的对应性、表现力、同质性、代表性、完整性。语料的采集以软件(ABBYY,Trados,Phras Txt,Word Smith)提取为主,人工录入为辅,实现了语篇、句子、语块三层对齐。ECMPC比王克非所建英汉汉英双语语料库专业性更强,比杨惠中所建上海交通大学科技英语语料库词汇更丰富,经初步应用,已经显示出其对医学英语教学和医学文献的汉英翻译的平台支持价值。 展开更多
关键词 英汉医学平行语料库 对齐 语块 诱导词
原文传递
医学著作英汉双语平行语料库的构建 被引量:4
18
作者 陈潇潇 葛诗利 《外语艺术教育研究》 2012年第1期33-37,44,共6页
医学英语是ESP的一个重要分支,但迄今为止尚未见到较大规模的医学英语语料库建设。本文介绍了医学著作英汉平行语料库的构建工作,包括语料库的规划、实施、组织和检索,尤其是详尽地报告了语料的收集和整理过程,最后提供了目前语料库的... 医学英语是ESP的一个重要分支,但迄今为止尚未见到较大规模的医学英语语料库建设。本文介绍了医学著作英汉平行语料库的构建工作,包括语料库的规划、实施、组织和检索,尤其是详尽地报告了语料的收集和整理过程,最后提供了目前语料库的描述性统计数据。医学语料库建设工作的展开和深入将极大地促进基于语料库的医学英语语言学、翻译和教学研究,从而推动我国ESP理论研究的发展。 展开更多
关键词 医学英语 英汉平行语料库 语料库构建 对齐
原文传递
中国对外政治话语体系建构研究——以政府工作报告英译本为例
19
作者 赵寄佑 《译苑新谭》 2020年第1期19-32,共14页
近年来,中国国际地位日益提升。然而,在国际社会中,中国的话语权仍处于弱势地位。其中一个重要原因便是,中国还未建立起一个有效的、与其国际地位相称的对外话语体系,以致许多中国理念被误读、曲解。在众多对外话语中,对外政治话语,在... 近年来,中国国际地位日益提升。然而,在国际社会中,中国的话语权仍处于弱势地位。其中一个重要原因便是,中国还未建立起一个有效的、与其国际地位相称的对外话语体系,以致许多中国理念被误读、曲解。在众多对外话语中,对外政治话语,在国家的国际影响力建设方面,起着举足轻重的作用。因此,本文基于2013-2017年政府工作报告及其英译,借助汉英句对齐平行语料库,结合《人民日报》图文数据库,首先分析探讨中国对外政治话语体系的内容建设。随后,基于对中国外宣的现有研究,进一步提出了对外话语传播的相关建议。 展开更多
关键词 中国政府工作报告 汉英句对齐平行语料库 中国对外政治话语体系
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部