-
题名基于适应性训练与丢弃机制的神经机器翻译
被引量:2
- 1
-
-
作者
段仁翀
段湘煜
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第10期120-126,135,共8页
-
基金
江苏高校优势学科建设工程项目。
-
文摘
在机器翻译领域中,提升翻译质量的一个重要方法是提高短语的翻译准确率。统计机器翻译模型通过对短语而非单词进行建模,大幅提升了短语翻译准确率。然而,对于神经机器翻译模型,传统的训练目标最小化每个词的损失,而无显式的约束记忆短语存在短语的翻译准确率较低的缺陷,另外基于自回归解码的神经机器翻译模型导致误译的短语会影响后续短语的准确翻译。为了解决上述问题,提出短语感知适应性训练和短语丢弃机制的方法。短语感知适应性训练将句子分割为多个短语片段,借助适应性训练目标为每个词分配合适的权重,以鼓励模型记忆短语,提高模型对短语的翻译准确率,短语丢弃机制通过在训练中随机丢弃目标端短语来增强模型对误译短语的鲁棒性,避免对后续短语的翻译造成影响。在WMT2014英德和NIST中英两个翻译任务上的实验结果表明,与Transformer基线模型相比,提出方法可以使译文的BLEU值分别提高1.64和0.96分。此外还证明了短语知识作为一种通用的知识,可以从教师模型迁移到学生模型,进一步提升翻译质量。
-
关键词
机器翻译
知识迁移
适应性训练
短语
丢弃机制
-
Keywords
machine translation
knowledge transfer
adaptive training
phrase
drop mechanism
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名个性化高校新闻分类推荐的应用研究
被引量:10
- 2
-
-
作者
毕曦文
纪明宇
吴鹏
方静
段仁翀
郭鹏鑫
-
机构
东北林业大学信息与计算机工程学院
-
出处
《计算机应用与软件》
北大核心
2019年第7期218-223,共6页
-
基金
中央高校基本科研业务费专项(2572015CB32)
东北林业大学大学生创新创业训练计划项目(201810225175)
-
文摘
随着信息化和数字化时代的到来,大数据广泛渗入到各个领域。信息过载使得用户无法快速、准确地获取个人最关注的内容,这严重影响了浏览页面时的用户体验。为了能精准地进行分类推荐,对新闻分类和推荐方法进行细致的研究,进而提出一种能够进行精准分类,准确获取信息的推荐方法。利用爬虫技术获取真实的高校新闻数据;采用基于肘部法则改进的K-means算法进行聚类分析;结合用户注册时选定的兴趣标签,利用基于内容与协同过滤组合的推荐策略,针对不同用户的需求进行个性化推荐;以列表等形式将个性化的推荐结果展示给用户。根据高校的真实数据进行实验,结果表明,该算法能够有效地对高校师生的个性化服务需求进行处理,提高获取新闻时的高效性、准确性和智能性。
-
关键词
大数据
个性化推荐
高校新闻分类
改进的K-means算法
组合推荐
-
Keywords
Big data
Personalized recommendation
College news classification
Improved K-means algorithm
Combination is recommended
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-