-
题名英汉翻译语法误译校正方法研究——基于K均值聚类
- 1
-
-
作者
吴南辉
沈炎松
-
机构
漳州职业技术学院国际合作学院
漳州职业技术学院电子信息学院
-
出处
《漳州职业技术学院学报》
2022年第2期67-75,共9页
-
基金
福建省中青年教师教育科研项目(JZ180805)。
-
文摘
针对现有英汉翻译语法误译校正方法中存在的校正精度较低等问题,提出一种基于K均值聚类的英汉翻译语法误译校正方法。对采集的英汉翻译语法数据实施预处理,运用TF-IDF算法由预处理后的语法数据内提取语法特征,构成语法特征样本集;通过K均值聚类确定特征样本集内语法误译特征,将此误译特征作为输入参数,输入到构建误译校正模型中,实现英汉翻译语法误译的校正。结果表明,该方法可检测出语法特征样本集内的误译特征,所检测的误译特征个数与对应数据集的实际误译类别数量几乎一致,综合检测性能较高;可通过语法误译校正将误译语法与正确语法区分,整体校正精度高于98%。
-
关键词
K均值聚类
英汉翻译
语法误译
TF-IDF算法
特征提取
误译校正模型
-
Keywords
K-Means clustering
English-Chinese translation
grammatical mistranslation
TF-IDF algorithm
feature extraction
mistranslation correcting model
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-