期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
Research on high-performance English translation based on topic model
1
作者 Yumin Shen Hongyu Guo 《Digital Communications and Networks》 SCIE CSCD 2023年第2期505-511,共7页
Retelling extraction is an important branch of Natural Language Processing(NLP),and high-quality retelling resources are very helpful to improve the performance of machine translation.However,traditional methods based... Retelling extraction is an important branch of Natural Language Processing(NLP),and high-quality retelling resources are very helpful to improve the performance of machine translation.However,traditional methods based on the bilingual parallel corpus often ignore the document background in the process of retelling acquisition and application.In order to solve this problem,we introduce topic model information into the translation mode and propose a topic-based statistical machine translation method to improve the translation performance.In this method,Probabilistic Latent Semantic Analysis(PLSA)is used to obtains the co-occurrence relationship between words and documents by the hybrid matrix decomposition.Then we design a decoder to simplify the decoding process.Experiments show that the proposed method can effectively improve the accuracy of translation. 展开更多
关键词 Machine translation Topic model Statistical machine translation Bilingual word vector RETELLING
下载PDF
用于短文本关键词抽取的TTM_DMM主题翻译模型 被引量:1
2
作者 王瑞 秦永彬 闫盈盈 《计算机与数字工程》 2018年第5期945-949,955,共6页
基于主题翻译模型的短文本关键词抽取方法,均采用LDA(Latent Dirichlet Allocation)主题模型作为主题发现方法,然而LDA在处理特征稀疏的短文本时,主题发现效果较差,使得当前的主题翻译模型存在不完善之处。论文通过将DMM(Dirichlet Mult... 基于主题翻译模型的短文本关键词抽取方法,均采用LDA(Latent Dirichlet Allocation)主题模型作为主题发现方法,然而LDA在处理特征稀疏的短文本时,主题发现效果较差,使得当前的主题翻译模型存在不完善之处。论文通过将DMM(Dirichlet Multinomial Mixture)模型作为主题发现模型,结合统计机器翻译,提出了一种用于短文本关键词抽取的TTM_DMM(Topical Translation Model based on Dirichlet Multinomial Mixture)主题翻译模型。该模型利用DMM模型发现短文本主题信息,在主题约束下学习词语与关键词的翻译概率,从而提高短文本关键词抽取效果。在真实数据集上的实验结果表明,论文提出的TTM_DMM模型在评价指标Precious、Recall以及F-measure上优于现有的短文本关键词抽取方法。 展开更多
关键词 TTM_DMM主题翻译模型 短文本关键词抽取 DMM LDA 统计机器翻译
下载PDF
基于主题模型和统计机器翻译方法的中文格律诗自动生成 被引量:16
3
作者 蒋锐滢 崔磊 +2 位作者 何晶 周明 潘志庚 《计算机学报》 EI CSCD 北大核心 2015年第12期2426-2436,共11页
文中针对格律诗自动生成进行了研究.首先根据创作者提交的若干关键词,利用主题模型进行扩展得到更多的主题相关词,然后通过语言模型自动生成首句.在此基础上通过统计机器翻译的方法生成后续句.在生成过程中,利用主题模型进行诗词的意境... 文中针对格律诗自动生成进行了研究.首先根据创作者提交的若干关键词,利用主题模型进行扩展得到更多的主题相关词,然后通过语言模型自动生成首句.在此基础上通过统计机器翻译的方法生成后续句.在生成过程中,利用主题模型进行诗词的意境扩展,从而得到更加丰富的句子候选.该研究的主要特点和贡献是:首先提出以统计机器翻译为理论基础,将格律诗的上下句关系映射为统计翻译模型中源语言与目标语言的关系,设计了融入诗词领域知识的统计机器翻译模型.其次主题模型用来在生成过程中进行词汇集扩展,从而加强了诗词的主题及意境.另外文中还论述了基于BLEU的诗句生成的自动评测方法,并配合所设计的人工评价标准,形成了比较完备的诗词评价体系.实验结果证实了该方法的有效性. 展开更多
关键词 律诗生成 主题模型 统计机器翻译 自动评测
下载PDF
面向篇章机器翻译的英汉翻译单位和翻译模型研究 被引量:15
4
作者 宋柔 葛诗利 《中文信息学报》 CSCD 北大核心 2015年第5期125-135,共11页
篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译... 篇章机器翻译的首要问题是确定翻译单位。基于汉语和英语的语言知识和英汉翻译的实践,该文提出面向篇章机器翻译的基本单位和复合单位的双层单位体系,讨论了这两种单位支持篇章翻译应满足的性质,并据此勾画了篇章机器翻译的拆分、翻译、装配三步模型(PTA模型)。该文提出,汉语篇章机器翻译的复合单位为广义话题结构对应的文本块,基本单位则是根据广义话题结构流水模型得到的话题自足句;英语篇章机器翻译的复合单位为句号句,基本单位为naming-telling小句(NT小句),即指称性成分加上对它的陈述或后修饰成分所构成的小句。该文展示了在这样的翻译单位体系下采用PTA模型的英汉翻译过程实例,规划了面向篇章翻译的英汉小句对齐语料库的建设任务,讨论了PTA模型的可行性。 展开更多
关键词 翻译单位 翻译模型 广义话题结构 naming-telling小句
下载PDF
一种面向社区型问句检索的主题翻译模型 被引量:7
5
作者 张伟男 张宇 刘挺 《计算机学报》 EI CSCD 北大核心 2015年第2期313-321,共9页
基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该... 基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型. 展开更多
关键词 社区型问答 问句检索 主题模型 翻译模型 LDA(Latent DIRICHLET Allocation) 社会计算 社交网络
下载PDF
引入基于主题复述知识的统计机器翻译模型 被引量:1
6
作者 苏劲松 董槐林 +2 位作者 陈毅东 史晓东 吴清强 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2014年第10期1843-1849,共7页
针对传统的基于双语平行语料的复述获取方法在复述获取和应用的过程中忽视文档上下文的缺点,引入基于主题模型的上下文信息来改善复述获取—主要致力于如何计算上下文无关的复述生成概率和上下文相关的复述生成概率.研究如何将上述2种... 针对传统的基于双语平行语料的复述获取方法在复述获取和应用的过程中忽视文档上下文的缺点,引入基于主题模型的上下文信息来改善复述获取—主要致力于如何计算上下文无关的复述生成概率和上下文相关的复述生成概率.研究如何将上述2种概率融入统计机器翻译建模,以提高翻译系统的性能.多个测试集上的实验结果证明了该方法的有效性. 展开更多
关键词 统计机器翻译 复述 主题模型
下载PDF
“写”“译”结合,构建多维度的英语写作教学课堂 被引量:3
7
作者 梁惠梅 《成都大学学报(教育科学版)》 2008年第8期78-80,138,共4页
国内外众多学者都曾探讨过翻译在二语写作中所起的积极作用,但就其在写作教学中的应用并没有得到深入的研究。实验证明,以"词汇听译—句式操练—话题讨论—学生仿写"的"写""译"结合课堂教学模式有利于构... 国内外众多学者都曾探讨过翻译在二语写作中所起的积极作用,但就其在写作教学中的应用并没有得到深入的研究。实验证明,以"词汇听译—句式操练—话题讨论—学生仿写"的"写""译"结合课堂教学模式有利于构建一个丰富的、多维度的写作教学课堂,以解决学生英语的写作基础技能问题。这个模式的四个步骤是递进的、相辅相成的,为学生的创造性写作搭建平台、创造条件。 展开更多
关键词 “写”“译”结合 课堂教学模式 词汇听译 句式操练 话题讨论 学生仿写
下载PDF
汉语主题链衔接模式与英译研究
8
作者 何远秀 陈福宇 《重庆交通大学学报(社会科学版)》 2011年第6期127-130,共4页
探讨汉语主题链衔接模式,揭示汉语语篇的内在组织规律和主题链衔接模式的语篇交际功能,并在此基础上探讨了主题链衔接模式对汉译英的一些启示。
关键词 主题链 主题链衔接模式 启示 汉译英
下载PDF
融合主题的汉越冶金领域统计机器翻译方法 被引量:2
9
作者 周珂 余正涛 高盛祥 《计算机工程》 CAS CSCD 北大核心 2017年第12期179-183,共5页
为有效利用领域知识提高汉越冶金领域的机器翻译效果,利用术语与主题的分布关系约束术语的选择,提出融合主题的统计机器翻译方法。建立术语翻译模型,抽取短语概率表时将术语对源语言文档的主题信息融入到翻译概率表中,利用主题分布描述... 为有效利用领域知识提高汉越冶金领域的机器翻译效果,利用术语与主题的分布关系约束术语的选择,提出融合主题的统计机器翻译方法。建立术语翻译模型,抽取短语概率表时将术语对源语言文档的主题信息融入到翻译概率表中,利用主题分布描述术语与主题之间的关系,同时使用冶金领域语料训练翻译模型,将2个模型融合到基于短语的汉越翻译系统解码过程中,指导选择出最符合领域特性的术语及译文。融合模型前后的对比实验结果表明,与基于短语的机器翻译方法相比,该方法可有效提高汉越冶金领域的翻译性能。 展开更多
关键词 冶金领域 统计机器翻译 主题模型 术语 联合翻译模型
下载PDF
用于短文本关键词抽取的主题翻译模型 被引量:1
10
作者 王瑞 秦永彬 +1 位作者 张丽 闫盈盈 《计算机工程与设计》 北大核心 2018年第6期1633-1638,共6页
为进一步改善短文本关键词抽取的效果,提出一种TTKE(topical translation for keyphrase extraction)主题翻译模型。结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为... 为进一步改善短文本关键词抽取的效果,提出一种TTKE(topical translation for keyphrase extraction)主题翻译模型。结合主题模型与统计机器翻译模型的优势,通过长文本辅助短文本进行主题发现,学习特定主题下词语与关键词的对齐概率,为给定短文本进行关键词抽取。在真实数据集上进行实验,实验结果表明,该模型能够有效提高短文本关键词抽取的效果。 展开更多
关键词 关键词抽取 短文本 长文本 主题翻译模型 主题发现 对齐概率
下载PDF
基于话题翻译模型的双语文本纠错 被引量:1
11
作者 陈欢 张奇 《计算机应用与软件》 CSCD 2016年第3期284-287,共4页
近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语... 近年来,随着信息全球化的影响,社交网络文本上的多语言混合现象越来越普遍。许多中文文本中混杂着其他语言的情况已很常见。绝大多数现有的自然语言处理算法都是基于单一语言的,并不能很好地处理多语言混合的文本,因此在进行其他自然语言处理任务之前对文本进行预处理显得尤为重要。面对网络文本语义空间双语对齐语料的匮乏,提出一种基于话题翻译模型的方法,利用不同语义空间的语料计算网络文本语义空间的双语对齐概率,再结合神经网络语言模型将网络混合文本中的英文翻译成对应中文。实验在人工标注的测试语料上进行,实验结果表明,通过不同的对比试验证明文中的方法是有效的,能提升翻译正确率。 展开更多
关键词 网络文本 话题翻译模型 神经网络语言模型
下载PDF
译文语序的领域性思考:一种融合主题信息的领域自适应调序模型
12
作者 刘梦眙 姚亮 +2 位作者 洪宇 刘昊 姚建民 《中文信息学报》 CSCD 北大核心 2017年第5期50-58,共9页
领域自适应研究的目标是建立一种动态调整翻译模型,使翻译模型对目标领域的语言特征具备较强的学习和处理能力,借以保证翻译系统在不同领域获得平衡可靠的翻译能力。现有翻译模型的自适应研究已经取得显著进展,但调序过程的领域适应性... 领域自适应研究的目标是建立一种动态调整翻译模型,使翻译模型对目标领域的语言特征具备较强的学习和处理能力,借以保证翻译系统在不同领域获得平衡可靠的翻译能力。现有翻译模型的自适应研究已经取得显著进展,但调序过程的领域适应性研究相对较少。在该文前期工作中通过对大规模源语言和目标语言的真实互译样本统计发现,在语义等价的短语级互译对子中,36.17%的样本在不同领域中的语序存在显著差异。针对这一问题,该文从主题角度出发,探索不同主题分布下的短语调序差异,提出一种融合主题信息的领域自适应调序模型。实验结果显示,嵌入调序适应性模型的翻译系统取得了较为明显的性能优势。 展开更多
关键词 统计机器翻译 领域适应性 调序模型 主题模型
下载PDF
主题模型在统计机器翻译中的应用 被引量:1
13
作者 巢佳媛 贡正仙 《中国科技信息》 2013年第11期99-100,共2页
在基于短语的统计机器翻译中,短语表是解码器工作的核心部分,它主要包含了源端和目标端短语的翻译概率和词汇互译概率;但传统的短语表数量庞大,并且领域自适应能力差。为了在解码过程中挑选出更高质量的短语对,适当减少内存消耗和缩小... 在基于短语的统计机器翻译中,短语表是解码器工作的核心部分,它主要包含了源端和目标端短语的翻译概率和词汇互译概率;但传统的短语表数量庞大,并且领域自适应能力差。为了在解码过程中挑选出更高质量的短语对,适当减少内存消耗和缩小解码空间,本文介绍了一个简单易行的基于主题模型的统计机器翻译系统的实现:首先使用LDA工具建立主题模型,然后把主题模型信息嵌入到短语表中,最后为解码器设计一个预处理模块可以使解码器不需要改变就可以在翻译过程中根据主题选择合适的短语对,从而提高了翻译的效率和质量。 展开更多
关键词 统计机器翻译 主题模型 LDA
下载PDF
融合主题信息的篇章级神经机器翻译
14
作者 陈玺文 余正涛 +1 位作者 高盛祥 王振晗 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期1197-1207,共11页
目前的神经机器翻译方法以句子为单位作为输入,在翻译过程中不能有效利用篇章级上下文的信息,影响了机器翻译的性能.为解决现有机器翻译框架下的上下文信息缺失问题,提出一种融合主题信息的篇章级神经机器翻译方法.首先,将源语言当前句... 目前的神经机器翻译方法以句子为单位作为输入,在翻译过程中不能有效利用篇章级上下文的信息,影响了机器翻译的性能.为解决现有机器翻译框架下的上下文信息缺失问题,提出一种融合主题信息的篇章级神经机器翻译方法.首先,将源语言当前句子与源语言的前一句分别独立输入到源语言句子编码器和上下文编码器中;然后,采用注意力机制将2个编码器的输出映射为最终的上下文表,结合源语言句子编码器输出通过门控机制得到具有上下文信息和当前句子融合表征,同时将词嵌入后的源语言句子输入基于Bi-GRU和卷积神经网络的主题表征编码器映射为主题表征;最后,将融合后的句子表征以及主题表征分别通过2个串联的注意力机制参与解码.实验结果表明,该方法能够提高篇章级神经机器翻译的性能,相较于基准系统,该方法在BLEU值上最高提升了0.55个百分点. 展开更多
关键词 篇章翻译 神经机器翻译 主题模型 双编码器 句子表征
下载PDF
英汉翻译中疑难词的概念参照点解读模式与应用
15
作者 张小红 于万锁 《山西大同大学学报(社会科学版)》 2023年第5期98-102,共5页
准确传神的翻译对推进中西文明的交流互鉴很有意义,然而在英译汉过程中经常存在因对疑难词理解偏差导致错译的问题。从“概念参照点模式”着手,并对其进行改造,提出了“翻译疑难词的概念参照点解读模式”,最后以包含多义词语、同一对象... 准确传神的翻译对推进中西文明的交流互鉴很有意义,然而在英译汉过程中经常存在因对疑难词理解偏差导致错译的问题。从“概念参照点模式”着手,并对其进行改造,提出了“翻译疑难词的概念参照点解读模式”,最后以包含多义词语、同一对象指称词语以及比喻性表达的语篇为翻译实例,演示了所提出模式的实际应用步骤。实践证明,该模式能有效解决因疑难词理解偏差而错译的问题。 展开更多
关键词 英汉翻译 翻译理解 疑难词 概念参照点模式 话题词语
下载PDF
话题链在英汉篇章翻译中的应用策略与模式 被引量:1
16
作者 孙坤 《外语与外语教学》 CSSCI 北大核心 2013年第1期70-74,共5页
本文从汉语语言特点和语篇角度研究翻译过程。研究指出,话题链是汉语篇章组织的核心机制之一,且使用广泛,因而可采取话题链取向的翻译策略。本文提出实际可行的翻译策略和步骤:依据句法位置、生命度、语义范围选择话题,再使用认知顺序... 本文从汉语语言特点和语篇角度研究翻译过程。研究指出,话题链是汉语篇章组织的核心机制之一,且使用广泛,因而可采取话题链取向的翻译策略。本文提出实际可行的翻译策略和步骤:依据句法位置、生命度、语义范围选择话题,再使用认知顺序、平行结构、连接词等手段安排不同评述内容,最后形成一套完整有序的操作模式。因其系统易操作,在实践中可大幅提高译文质量。同时,话题链翻译策略和模式对翻译教学也有很强的启示作用。 展开更多
关键词 话题链 话题优选 认知次序 翻译策略 程式化模型
原文传递
基于翻译模型的科研合作预测研究 被引量:3
17
作者 陈文杰 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第10期28-36,共9页
【目的】为促进科研人员间的交流合作,实现科研效率最大化,提出一种改进的翻译模型TransTopic,用于干细胞领域的科研合作预测研究。【方法】TransTopic旨在将科研合作网络中的节点和边统一映射为低维向量。利用LDA主题模型抽取论文的主... 【目的】为促进科研人员间的交流合作,实现科研效率最大化,提出一种改进的翻译模型TransTopic,用于干细胞领域的科研合作预测研究。【方法】TransTopic旨在将科研合作网络中的节点和边统一映射为低维向量。利用LDA主题模型抽取论文的主题分布特征,使用深度自编码器将主题特征编码为边向量,基于翻译机制得到节点向量,通过向量间的语义计算实现科研合作预测。【结果】TransTopic在链接预测上的AUC(95.21%)和MeanRank(17.48)指标均表现最优,并且主题预测的准确率达到86.52%。【局限】合作预测方法仅考虑了一步的翻译路径,并且作者的机构、研究兴趣和发文等级等多元信息没有得到充分的利用。【结论】基于翻译模型的预测方法可以有效完成干细胞领域的科研合作预测工作。 展开更多
关键词 翻译模型 深度自编码器 主题模型 链接预测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部