-
题名无监督句对齐综述
- 1
-
-
作者
谷仕威
刘静
李丙春
熊德意
-
机构
天津大学智能与计算学部
喀什大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2024年第1期60-67,共8页
-
基金
新疆维吾尔自治区自然科学基金重点项目(2022D01D43)
云南省重点研发计划(202203AA080004)
基于汉语-乌尔都语平行语料库的研究(KS2022084)。
-
文摘
无监督句对齐在自然语言处理领域是一个重要而具有挑战性的问题。该任务旨在找到不同语言中句子的对应关系,为跨语言信息检索、机器翻译等应用提供基础支持。该综述从方法、挑战和应用3个方面概括了无监督句对齐的研究现状。在方法方面,无监督句对齐涵盖了多种方法,包括基于多语言嵌入、聚类和自监督或者生成模型等。然而,无监督句对齐面临着多样性、语言差异和领域适应等挑战。语言的多义性和差异性使得句对齐变得复杂,尤其在低资源语言中更为明显。尽管面临挑战,无监督句对齐在跨语言信息检索、机器翻译、多语言信息聚合等领域具有重要应用。通过无监督句对齐,可以将不同语言中的信息整合,提升信息检索的效果。同时,该领域的研究也在不断推动技术的创新和发展,为实现更准确和稳健的无监督句对齐提供了契机。
-
关键词
无监督句对齐
自然语言处理
机器翻译
自监督
低资源
-
Keywords
Unsupervised sentence alignment
Natural language processing
Machine translation
Self-supervised
Low-resource
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-