期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于n元词组表示的去噪方法及其在跨语言映射中的应用
1
作者 于墨 赵铁军 《智能计算机与应用》 2016年第2期94-97,共4页
具有结构化输出的学习任务(结构化学习)在自然语言处理领域广泛存在。近年来研究人员们从理论上证明了数据标记的噪声对于结构化学习的巨大影响,因此为适应结构化学习任务的去噪算法提出了需求。受到近年来表示学习发展的启发,本文提出... 具有结构化输出的学习任务(结构化学习)在自然语言处理领域广泛存在。近年来研究人员们从理论上证明了数据标记的噪声对于结构化学习的巨大影响,因此为适应结构化学习任务的去噪算法提出了需求。受到近年来表示学习发展的启发,本文提出将自然语言的子结构低维表示引入结构化学习任务的样本去噪算法中。这一新的去噪算法通过n元词组的表示为序列标注问题中每个节点寻找近邻,并根据节点标记与其近邻标记的一致性实现去噪。本文在命名实体识别和词性标注任务的跨语言映射上对上述去噪方法进行了验证,证明了这一方法的有效性。 展开更多
关键词 表示学习 半监督学习 去噪算法 自然语言处理 跨语言映射
下载PDF
从介词over的翻译看其意象图式的跨语言映射——基于语料库的个案分析 被引量:17
2
作者 王红莉 《外语电化教学》 CSSCI 2009年第4期12-16,共5页
意象图式是认知语言学近年来关注的热门话题。在认知语言学理论框架下,不少学者曾对over的语义结构及其语义链作过分析,但很少有人从翻译角度对其意象图式进行研究。本文采用语料库方法,以Gone with the Wind中介词over的翻译为例,... 意象图式是认知语言学近年来关注的热门话题。在认知语言学理论框架下,不少学者曾对over的语义结构及其语义链作过分析,但很少有人从翻译角度对其意象图式进行研究。本文采用语料库方法,以Gone with the Wind中介词over的翻译为例,通过英汉文本对比分析,发现介词over的意象图式完全可以实现跨语言映射,再次印证了意象图式是人类共同认知规律的认知语言学观点。 展开更多
关键词 意象图式 翻译 跨语言映射
原文传递
融合跨语言特征的柬埔寨语命名实体识别方法 被引量:5
3
作者 徐广义 严馨 +1 位作者 余正涛 周丽华 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期865-871,共7页
为了解决柬埔寨语词法标注语料稀缺、柬埔寨语命名实体缺乏明显标识特征的问题,提出一种引入英柬跨语言特征的柬埔寨语命名实体识别方法.首先,借助英语命名实体的成熟模型及英柬双语平行语料的词对齐关系,将源语言的实体类别映射到目标... 为了解决柬埔寨语词法标注语料稀缺、柬埔寨语命名实体缺乏明显标识特征的问题,提出一种引入英柬跨语言特征的柬埔寨语命名实体识别方法.首先,借助英语命名实体的成熟模型及英柬双语平行语料的词对齐关系,将源语言的实体类别映射到目标语言;然后根据柬埔寨语词向量构造最近邻图,采用标签传播算法,获得柬埔寨语单词的实体类别分布,完成跨语言知识转移;最后,将柬埔寨语单词的命名实体类别分布作为约束特征融入到条件随机场模型中.实验结果表明,融入跨语言特征的条件随机场模型能有效地提升柬埔寨语命名实体识别的效果. 展开更多
关键词 英柬双语 柬语命名实体识别 跨语言映射 标签传播 词向量
下载PDF
翻译中的认知对应:介词over和above的翻译个案分析 被引量:10
4
作者 王红莉 《北京第二外国语学院学报》 2009年第4期55-61,共7页
意象图式是认知语言学最重要的概念之一。作为人类共同的认知特点,意象图式是人类共同的认知规律。本文在翻译认知观的基础上以意象图式理论为依据,通过对Gone with the Wind中408个介词over和above的翻译案例分析,证明英汉翻译不仅仅... 意象图式是认知语言学最重要的概念之一。作为人类共同的认知特点,意象图式是人类共同的认知规律。本文在翻译认知观的基础上以意象图式理论为依据,通过对Gone with the Wind中408个介词over和above的翻译案例分析,证明英汉翻译不仅仅是两种语言间在语篇层面的意义迁移,从词汇层面看翻译中还应该且能够保持认知上的一致和对应,实现意象图式的跨语言映射。 展开更多
关键词 意象图式 认知 翻译 跨语言映射
下载PDF
结构化学习的噪声可学习性分析及其应用 被引量:2
5
作者 于墨 赵铁军 +1 位作者 胡鹏龙 郑德权 《软件学报》 EI CSCD 北大核心 2013年第10期2340-2353,共14页
噪声可学习性理论指出,有监督学习方法的性能会受到训练样本标记噪声的严重影响.然而,已有相关理论研究仅针对二类分类问题.致力于探究结构化学习问题受噪声影响的规律性.首先,注意到在结构化学习问题中,标注数据的噪声会在训练过程中... 噪声可学习性理论指出,有监督学习方法的性能会受到训练样本标记噪声的严重影响.然而,已有相关理论研究仅针对二类分类问题.致力于探究结构化学习问题受噪声影响的规律性.首先,注意到在结构化学习问题中,标注数据的噪声会在训练过程中被放大,使得训练过程中标记样本的噪声率高于标记样本的错误率.传统的噪声可学习性理论并未考虑结构化学习中的这一现象,从而低估了问题的复杂性.从结构化学习问题的噪声放大现象出发,提出了新的结构化学习问题的噪声可学习性理论.在此基础上,提出了有效训练数据规模的概念,这一指标可用于在实践中描述噪声学习问题的数据质量,并进一步分析了实际应用中的结构化学习模型在高噪声环境下向低阶模型回退的情况.实验结果证明了该理论的正确性及其在跨语言映射和协同训练方法中的应用价值和指导意义. 展开更多
关键词 结构化学习 噪声PAC可学习性 词性标注 自然语言处理 协同训练 跨语言映射 半监督学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部