期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
融合目标端上下文的篇章神经机器翻译
1
作者 贾爱鑫 李军辉 +1 位作者 贡正仙 张民 《中文信息学报》 CSCD 北大核心 2024年第4期59-68,共10页
神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神... 神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神经机器翻译。具体地,该文借助推敲网络的思想,对篇章源端进行二次翻译,第一次基于句子级翻译,第二次翻译参考了全篇的第一次翻译结果。基于LDC中英篇章数据集和WMT英德篇章数据集的实验结果表明,在引入较少的参数的条件下,该文方法能显著提高翻译性能。同时,随着第一次翻译(即句子级译文)质量的提升,所提方法也更有效。 展开更多
关键词 神经机器翻译 推敲网络 篇章翻译
下载PDF
增强依存结构表达的零样本跨语言事件论元角色分类
2
作者 张远洋 贡正仙 孔芳 《计算机工程与科学》 CSCD 北大核心 2024年第3期508-517,共10页
事件论元角色分类是事件抽取中的子任务,旨在为事件中的候选论元分配相应的角色。事件语料标注规则复杂、人力耗费大,在很多语言中缺少相关标注文本。零样本跨语言事件论元角色分类可以利用源语言的丰富语料建立模型,然后直接应用于标... 事件论元角色分类是事件抽取中的子任务,旨在为事件中的候选论元分配相应的角色。事件语料标注规则复杂、人力耗费大,在很多语言中缺少相关标注文本。零样本跨语言事件论元角色分类可以利用源语言的丰富语料建立模型,然后直接应用于标注语料匮乏的目标语言端。围绕不同语言的事件文本在依存结构上的表达共性,提出了使用BiGRU网络模块对触发词到候选论元的依存路径信息进行额外编码的方法。本文设计的编码模块能灵活地与当前主流的基于深度学习框架的事件论元角色分类模型相联合。实验结果表明,本文提出的方法能更有效地完成跨语言迁移,提高多个基准模型的分类性能。 展开更多
关键词 零样本跨语言 事件论元角色分类 依存结构 BiGRU 依存路径信息
下载PDF
利用语义关联增强的跨语言预训练模型的译文质量评估 被引量:1
3
作者 叶恒 贡正仙 《中文信息学报》 CSCD 北大核心 2023年第3期79-88,共10页
机器翻译质量评估(QE)是在不依赖参考译文的条件下,自动对机器翻译译文进行评估。当前人工标注数据稀缺,使得神经QE模型在自动检测译文错误方面还存在较大问题。为了更好地利用规模庞大但却缺少人工标注信息的平行语料,该文提出一种基... 机器翻译质量评估(QE)是在不依赖参考译文的条件下,自动对机器翻译译文进行评估。当前人工标注数据稀缺,使得神经QE模型在自动检测译文错误方面还存在较大问题。为了更好地利用规模庞大但却缺少人工标注信息的平行语料,该文提出一种基于平行语料的翻译知识迁移方案。首先采用跨语言预训练模型XLM-R构建神经质量评估基线系统,在此基础上提出三种预训练策略增强XLM-R的双语语义关联能力。该文方法在WMT 2017和WMT 2019的英德翻译质量评估数据集上都达到了最高性能。 展开更多
关键词 机器翻译质量评估 跨语言预训练模型 语义关联 预训练策略
下载PDF
篇章约束的译文质量评估模型
4
作者 冯勤 贡正仙 +1 位作者 叶恒 周国栋 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第1期39-47,共9页
提出一种新的篇章约束辅助的译文质量评估模型,不依赖参考译文,为源文篇章中的每条句子的译文进行打分。首先从句子级别的语义表示和词级别的指代特征的角度建模源文和译文上下文之间的差异,然后设计额外的损失函数,使得模型在预测分数... 提出一种新的篇章约束辅助的译文质量评估模型,不依赖参考译文,为源文篇章中的每条句子的译文进行打分。首先从句子级别的语义表示和词级别的指代特征的角度建模源文和译文上下文之间的差异,然后设计额外的损失函数,使得模型在预测分数的同时,尽可能地约束两者之间的差异。实验结果表明,所提方法能有效提高译文质量评估的性能,在Pearson相关系数上较基线系统最高可提升6.68个百分点。 展开更多
关键词 篇章 语义差异 指代差异 译文质量评估
下载PDF
融合零指代识别的篇章级机器翻译
5
作者 汪浩 李军辉 贡正仙 《中文信息学报》 CSCD 北大核心 2023年第8期25-33,共9页
在汉语等其他有省略代词习惯的语言中,通常会省略可从上下文信息推断出的代词。尽管以Transformer为代表的的神经机器翻译模型取得了巨大的成功,但这种代词省略现象依旧使神经机器翻译模型面临很大的挑战。该文在Transformer模型基础上... 在汉语等其他有省略代词习惯的语言中,通常会省略可从上下文信息推断出的代词。尽管以Transformer为代表的的神经机器翻译模型取得了巨大的成功,但这种代词省略现象依旧使神经机器翻译模型面临很大的挑战。该文在Transformer模型基础上提出了一个融合零指代识别的翻译模型,并引入篇章上下文来丰富指代信息。具体地,该模型采用联合学习的框架,在翻译模型基础上,联合了一个分类任务,即判别句子中省略代词在句子所表示的成分,使得模型能够融合零指代信息辅助翻译。通过在中英对话数据集上的实验,验证了该文所提出方法的有效性,与基准模型相比,翻译性能提升了1.48个BLEU值。 展开更多
关键词 零指代 篇章级机器翻译 联合学习
下载PDF
基于相似页面的Web信息抽取系统的实现 被引量:3
6
作者 贡正仙 朱巧明 李培峰 《计算机应用》 CSCD 北大核心 2006年第8期1983-1986,共4页
分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的W eb信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则... 分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的W eb信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则的算法。 展开更多
关键词 WEB页面 RoadRunner 相似页面 信息抽取
下载PDF
基于网格的Web信息抽取系统的设计与实现 被引量:2
7
作者 贡正仙 支丽艳 +1 位作者 朱巧明 李培峰 《计算机应用与软件》 CSCD 北大核心 2007年第11期50-51,116,共3页
Web信息抽取已经成为下一代Web应用的一个研究热点。在分析了当前Web信息抽取技术面临问题的基础上,结合网格技术的发展,提出了一个基于网格的Web信息抽取系统(GWIES),并给出了GWIES的设计方案,描述了系统实现的关键技术。
关键词 WEB信息抽取 网格 GLOBUS 调度
下载PDF
基于加权词汇衔接的文档级机器翻译自动评价 被引量:1
8
作者 贡正仙 李良友 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期173-179,共7页
在文档词汇衔接评价LC方法的基础上,提出基于权重的LC,即WLC,该方法通过在文档词图上运行PageRank算法获得词汇权重。根据词性信息使得PageRank算法偏向特定的词汇,并提出PWLC方法。实验表明,在文档级别上,所提出的两种方法与人工评价... 在文档词汇衔接评价LC方法的基础上,提出基于权重的LC,即WLC,该方法通过在文档词图上运行PageRank算法获得词汇权重。根据词性信息使得PageRank算法偏向特定的词汇,并提出PWLC方法。实验表明,在文档级别上,所提出的两种方法与人工评价的相关度都优于LC;融合两种方法后,BLEU和TER在文档级别上的评价性能有显著提高。 展开更多
关键词 词汇衔接 文档级评价 机器翻译 自动评价 PAGERANK
下载PDF
一个基于学分制的成绩管理系统的设计与实现 被引量:1
9
作者 贡正仙 陈越 +1 位作者 李蓥 朱巧明 《福建电脑》 2003年第12期64-65,共2页
本文将结合作者多年的开发实践,以一个具体学院教务管理中的成绩管理为例,介绍了一个通用学分制成绩管理系统的设计,并给出了相关的实现关键技术。基于学分制的成绩管理系统不仅具有常规管理系统所具有的功能如数据录入,查询,修改与打... 本文将结合作者多年的开发实践,以一个具体学院教务管理中的成绩管理为例,介绍了一个通用学分制成绩管理系统的设计,并给出了相关的实现关键技术。基于学分制的成绩管理系统不仅具有常规管理系统所具有的功能如数据录入,查询,修改与打印功能,作者又根据实际需求采用了数据录入的新方法以及从安全性考虑的审核方法,并根据开放式选课模式设计了派生成绩、非排课成绩等新概念来灵活管理学生成绩,制定了学分制下相对公平的奖学金评定方案等。 展开更多
关键词 成绩管理系统 学分制 设计 教务管理
下载PDF
利用Package & Development向导制作高级安装程序 被引量:1
10
作者 贡正仙 《计算机与农业》 2003年第3期30-31,共2页
关键词 Package&Development 高级安装程序 VB语言 程序设计 WINDOWS 应用程序
下载PDF
在GT4中部署C语言实现的服务
11
作者 贡正仙 《计算机与现代化》 2006年第9期18-20,共3页
介绍了服务网格的一些理念,详细描述了网格中间件———GT4的服务工作流程,并进一步分析了服务部署过程。这里介绍的服务部署过程利用了一系列的Java工具,但网格服务在开发中会用到MPI这类支持C语言但不支持Java的特殊技术,本文重点解... 介绍了服务网格的一些理念,详细描述了网格中间件———GT4的服务工作流程,并进一步分析了服务部署过程。这里介绍的服务部署过程利用了一系列的Java工具,但网格服务在开发中会用到MPI这类支持C语言但不支持Java的特殊技术,本文重点解决如何方便地通过Swig工具部署一个用C实现的服务。 展开更多
关键词 GT4 网格 网格服务 Swig
下载PDF
机器翻译自动评价综述 被引量:19
12
作者 李良友 贡正仙 周国栋 《中文信息学报》 CSCD 北大核心 2014年第3期81-91,共11页
随着机器翻译的发展,对其质量进行评测的自动评价方法也越来越受重视。发展至今,各种评价方法与技术层出不穷,采用何种分类标准来组织和描述它们也是一个很大的挑战。根据核心技术的不同,该文重点介绍了三类主流的自动评价方法,包括:基... 随着机器翻译的发展,对其质量进行评测的自动评价方法也越来越受重视。发展至今,各种评价方法与技术层出不穷,采用何种分类标准来组织和描述它们也是一个很大的挑战。根据核心技术的不同,该文重点介绍了三类主流的自动评价方法,包括:基于语言学检测点的方法、字符串匹配的方法和基于机器学习的方法。论文分别阐述了这些类别中颇具代表性的方法的工作原理并分析了各自的优缺点。此外,受限参考译文下的评价技术虽然不是主流的方法,但是其对提高自动化程度和评价性能的作用不能忽视,所以该文将其作为特殊的类别做了阐述。然后,汇报了近年来衡量自动评价方法的国际评测结果。最后,总结了自动评价的发展趋势和有待进一步解决的相关问题。 展开更多
关键词 机器翻译 自动评价 自动评价分类
下载PDF
基于Ontology的信息抽取研究综述 被引量:10
13
作者 陈静 朱巧明 贡正仙 《计算机技术与发展》 2007年第10期84-86,91,共4页
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。Ontology作为领域知识的共同理解,能有效地解决现在信息抽取所面临的主要挑战——知识工程的瓶颈问题。文中详细介绍了本体的定义和建模语言,分析了现... 信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。Ontology作为领域知识的共同理解,能有效地解决现在信息抽取所面临的主要挑战——知识工程的瓶颈问题。文中详细介绍了本体的定义和建模语言,分析了现有基于本体信息抽取的几种典型方法,得出了其所存在的主要问题。 展开更多
关键词 信息抽取 本体 知识获取
下载PDF
一种优化服务组合执行的设计方案 被引量:2
14
作者 许兰 朱巧明 +1 位作者 贡正仙 朱剑非 《微电子学与计算机》 CSCD 北大核心 2007年第12期144-146,149,共4页
分析了目前大多数服务网格平台上的服务,提出了范围型服务(RangeService,RaS)的概念;并根据RaS输入参数的信息和并行处理思想,提出了网格环境下参数优化的设计方案。该方案可有效地利用服务的历史执行数据,优化当前服务的执行。从而在... 分析了目前大多数服务网格平台上的服务,提出了范围型服务(RangeService,RaS)的概念;并根据RaS输入参数的信息和并行处理思想,提出了网格环境下参数优化的设计方案。该方案可有效地利用服务的历史执行数据,优化当前服务的执行。从而在服务组合执行前,就可大大降低服务的执行规模,有利于缩短服务组合的执行时间,提高服务组合执行的成功率。 展开更多
关键词 服务网格 服务执行 优化性能 服务组合
下载PDF
一种基于历史信息反馈的动态服务资源选择模型 被引量:1
15
作者 许兰 朱巧明 +1 位作者 李培峰 贡正仙 《计算机应用》 CSCD 北大核心 2007年第9期2284-2286,共3页
针对真实服务网格环境中资源的不确定性,如CPU、网络的负载、安全性和动态性,提出了一种动态选择网格资源的技术——基于历史反馈的动态资源选择模型。该模型利用服务的历史执行信息自适应调整预测模型,并在考虑了网格环境中资源的实时... 针对真实服务网格环境中资源的不确定性,如CPU、网络的负载、安全性和动态性,提出了一种动态选择网格资源的技术——基于历史反馈的动态资源选择模型。该模型利用服务的历史执行信息自适应调整预测模型,并在考虑了网格环境中资源的实时性、安全性和不确定性的基础上,进行资源的反馈选择,最后将服务请求提交到整体性能较优的节点上。 展开更多
关键词 自适应 动态资源选择 不定因素 历史信息反馈 资源可靠性
下载PDF
基于学分制管理的教务系统的设计和实现 被引量:4
16
作者 陈越 李蓥 贡正仙 《苏州大学学报(自然科学版)》 CAS 2003年第2期48-54,共7页
给出了基于学分制管理的教务管理系统的基本组成、功能和工作流程,结合实际采用面向对象技术实现了一个基于B/S和C/S混合多层体系结构的学分制教务管理系统,并讨论了系统实施中的安全问题.
关键词 教务管理系统 学分制 系统设计 B/S C/S 多层体系结构 面向对象
下载PDF
基于学分制的选课系统的设计和实现 被引量:8
17
作者 陈越 贡正仙 《苏州大学学报(自然科学版)》 CAS 2003年第3期62-65,共4页
给出了一个基于学分制的开放式选课系统的设计和实现.和传统的单独开课的公共选修课不同,开放式选课系统允许学生选择符合条件的全校开设的所有课程.这个模式使得学生可以选择的课程的范围扩大,有利于学生知识结构趋于多样化,也有利于... 给出了一个基于学分制的开放式选课系统的设计和实现.和传统的单独开课的公共选修课不同,开放式选课系统允许学生选择符合条件的全校开设的所有课程.这个模式使得学生可以选择的课程的范围扩大,有利于学生知识结构趋于多样化,也有利于学科之间的渗透及边缘学科的发展.实践证明,这是一种与学分制模式相一致的选课模式. 展开更多
关键词 开放式选课系统 学分制 系统设计 教务管理 选课模式 必修课程 选修课程
下载PDF
动态服务组合中资源选择的研究与实现 被引量:1
18
作者 许兰 朱巧明 +1 位作者 贡正仙 朱剑非 《计算机技术与发展》 2007年第12期221-224,共4页
在面向服务的网格中,需要按用户请求动态地根据当前系统中服务的状况,组合出满足用户请求的服务组合。目前,当存在多个服务提供者提供相同功能的服务时,如何动态选择合适的服务却很少被论述,而且真实网格环境中的不确定性(如Cpu、网络... 在面向服务的网格中,需要按用户请求动态地根据当前系统中服务的状况,组合出满足用户请求的服务组合。目前,当存在多个服务提供者提供相同功能的服务时,如何动态选择合适的服务却很少被论述,而且真实网格环境中的不确定性(如Cpu、网络的负载)也很少考虑。如何选择最合适的服务所在的资源,是服务组合中必须要考虑的。在分析动态服务组合的基础上,设计了一种动态选择资源的方法。并利用GT4中工厂设计模式给出其实现方式。该设计考虑了网格环境中资源的安全性和不确定性因素,比如资源经常失败,以及Cpu和网络的负载等,从而最大程度地提高服务执行的可靠性和高效性以及均衡系统负载。 展开更多
关键词 网格 动态服务组合 资源选择 不确定性 工厂模式
下载PDF
异构数据库的异步迁移工具的实现 被引量:1
19
作者 李蓥 陈越 贡正仙 《周口师范学院学报》 CAS 2004年第2期28-31,共4页
针对目前业界存在着多种异构数据库,而它们之间往往因为系统的升级而要进行数据移植的状况,尝试实现了一个能从MSSQLServer到Oracle的典型异构迁移的自动工具.本文对JDBC在两种数据库的应用进行了详细的阐述,对提高JDBC的执行效率进行... 针对目前业界存在着多种异构数据库,而它们之间往往因为系统的升级而要进行数据移植的状况,尝试实现了一个能从MSSQLServer到Oracle的典型异构迁移的自动工具.本文对JDBC在两种数据库的应用进行了详细的阐述,对提高JDBC的执行效率进行了有益的探讨. 展开更多
关键词 JDBC 数据移植 ORACLE MSSQL
下载PDF
基于语义的网格服务匹配研究
20
作者 刘梅梅 朱巧明 +1 位作者 贡正仙 李培峰 《计算机应用研究》 CSCD 北大核心 2009年第5期1607-1611,共5页
随着网格技术的发展,网格服务匹配成为了新的研究热点。服务匹配是有效提高网格资源利用的关键技术。分析了服务匹配中广泛存在的服务提供方与服务请求方往往无法做到事先沟通的原因,提出了将语义引入服务描述语言以及服务匹配算法的基... 随着网格技术的发展,网格服务匹配成为了新的研究热点。服务匹配是有效提高网格资源利用的关键技术。分析了服务匹配中广泛存在的服务提供方与服务请求方往往无法做到事先沟通的原因,提出了将语义引入服务描述语言以及服务匹配算法的基于语义的网格服务匹配技术,并结合服务匹配的具体应用,提出了相应的解决方案。 展开更多
关键词 网格 服务 匹配算法 语义 聚类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部