期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
跨语言相似文档检索 被引量:4
1
作者 王洪俊 施水才 +1 位作者 俞士汶 肖诗斌 《中文信息学报》 CSCD 北大核心 2007年第1期30-37,共8页
检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作。本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译词对的权重作为一种... 检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作。本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译词对的权重作为一种特征来进行相似度计算,用Dice方法的改进算法计算双语文档的相似度。在实验中,统计检索文档的译文排在检索结果前N位的总次数来评价算法的性能,并使用了两个噪音数据集来评价算法的有效性。实验表明,在噪音数据干扰比较大的情况下,译文排在检索结果前5位的译文结果接近90%。实验证明,翻译词对的权重对于相似度计算有很大帮助,本算法可以有效地发现一种语言书写的文档在另一种语言中的译稿。 展开更多
关键词 计算机应用 中文信息处理 跨语言相似文档检索 文档相似 双语文档对齐
下载PDF
跨语言相似性对第三语言习得的研究(英文)
2
作者 许淑玲 《海外英语》 2012年第18期284-286,共3页
该文综述了跨语言相似性对第三语言习得影响的研究。学者们发现在跨语言相似性理论基础下,第一语言、第二语言对第三语言习得的影响程度持有不同观点,尤其是第三语言功能词的习得。大多数对遗传学上很近的三种语言相似性的影响研究,对... 该文综述了跨语言相似性对第三语言习得影响的研究。学者们发现在跨语言相似性理论基础下,第一语言、第二语言对第三语言习得的影响程度持有不同观点,尤其是第三语言功能词的习得。大多数对遗传学上很近的三种语言相似性的影响研究,对没有亲缘关系的语言间跨语言相似性研究得很少。 展开更多
关键词 第一语言 第二语言 第三语言习得 跨语言相似
下载PDF
二语水平和跨语言相似度对中国大学生英语空间动介构式使用的动态影响 被引量:2
3
作者 李佳 《解放军外国语学院学报》 CSSCI 北大核心 2022年第4期70-78,共9页
本研究跟踪分析了40名中国大学生两年内完成的5次口头叙事语篇,考察了他们使用英语空间动介构式的动态变化以及跨语言相似度对构式使用的动态影响。结果发现,随着二语水平的提高,一方面,构式使用的正确率未显著提高,而出现了非线性变化... 本研究跟踪分析了40名中国大学生两年内完成的5次口头叙事语篇,考察了他们使用英语空间动介构式的动态变化以及跨语言相似度对构式使用的动态影响。结果发现,随着二语水平的提高,一方面,构式使用的正确率未显著提高,而出现了非线性变化;构式中各类错误的错误率未显著降低,也表现出非线性变化。另一方面,不同跨语言相似度构式的正确率也发生了非线性变化,但变化特点各不相同;各类错误的错误率也未显著降低,均表现出非线性波动,且变化显著性各异。 展开更多
关键词 空间动介构式 二语水平 跨语言相似 中国大学生
原文传递
汉-英-日初学者的主观跨语言相似度实证研究 被引量:5
4
作者 朱立霞 蔡金亭 +1 位作者 徐曌瑢 庄倩 《外语与外语教学》 CSSCI 北大核心 2021年第5期90-99,150,共11页
主观跨语言相似度是影响语言迁移的重要因素之一,它以相关语言的客观异同为基础,但不等于客观异同。目前已有研究均以二语学习者为受试,鲜有学者系统研究三语学习者多方面的主观跨语言相似度。鉴于此,笔者设计问卷,考察了汉-英-日初学... 主观跨语言相似度是影响语言迁移的重要因素之一,它以相关语言的客观异同为基础,但不等于客观异同。目前已有研究均以二语学习者为受试,鲜有学者系统研究三语学习者多方面的主观跨语言相似度。鉴于此,笔者设计问卷,考察了汉-英-日初学者在词类、语法具体项目上对日汉、日英之间跨语言相似度的主观认识。结果发现:1)日汉、日英在各词类和各语法项目上的主观相似度有所差异,但日汉比日英的主观相似度变化幅度更大。2)在除动词外的其他词类上,日汉的主观相似度均显著高于日英。3)在除句子结构和时体之外的其他语法项目上,日汉的主观相似度均显著高于日英。 展开更多
关键词 三语学习者 主观跨语言相似 词类 语法
原文传递
二语水平和跨语言相似性对大学生使用英语形名搭配的动态影响 被引量:1
5
作者 蔡金亭 徐华珍 《中国外语》 CSSCI 北大核心 2020年第5期53-60,共8页
本文分析了32名大学生两年中完成的5次英语口头叙事语篇中使用形名搭配的情况,重点探究二语水平和跨语言相似性对他们使用各类英语形名搭配的动态影响。结果发现:(1)随着大学生总体英语水平的提高,他们使用形名搭配的正确率并没有明显... 本文分析了32名大学生两年中完成的5次英语口头叙事语篇中使用形名搭配的情况,重点探究二语水平和跨语言相似性对他们使用各类英语形名搭配的动态影响。结果发现:(1)随着大学生总体英语水平的提高,他们使用形名搭配的正确率并没有明显变化。(2)跨语言相似性不同的两类搭配在错误率上表现出不同的变化特点,一致搭配在各次测试中没有显著变化,而不一致搭配有显著变化。 展开更多
关键词 形名搭配 二语水平 跨语言相似 动态变化
原文传递
基于WordNet的中泰文跨语言文本相似度计算 被引量:12
6
作者 石杰 周兰江 +1 位作者 线岩团 余正涛 《中文信息学报》 CSCD 北大核心 2016年第4期65-70,共6页
文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该... 文本相似度在信息检索、文本挖掘、抄袭检测等领域有着广泛的应用。目前,大多数研究都只是针对同一种语言的文本相似度计算,关于跨语言文本相似度计算的研究则很少,不同语言之间的差异使得跨语言文本相似度计算很困难,针对这种情况,该文提出一种基于WordNet的中泰文跨语言文本相似度的计算方法。首先对中泰文本进行预处理和特征选择,然后利用语义词典WordNet将中泰文本转换成中间层语言,最后在中间层上计算中泰文本的相似度。实验结果表明,该方法准确率达到82%。 展开更多
关键词 WORDNET 中间层语言 语言文本相似
下载PDF
基于双语LDA的跨语言文本相似度计算方法研究 被引量:7
7
作者 程蔚 线岩团 +2 位作者 周兰江 余正涛 王红斌 《计算机工程与科学》 CSCD 北大核心 2017年第5期978-983,共6页
基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相... 基于双语主题模型思想分析双语文本相似性,提出基于双语LDA跨语言文本相似度计算方法。先利用双语平行语料集训练双语LDA模型,再利用该模型预测新语料集主题分布,将新语料集的双语文档映射到同一个主题向量空间,结合主题分布使用余弦相似度方法计算新语料集双语文档的相似度,使用从类别间和类别内的主题分布离散度的角度改进的主题频率-逆文档频率方法计算特征主题权重。实验表明,改进后的权重计算对于基于双语LDA相似度算法的召回率有较大提高,算法对类别不受限且有较好的可靠性。 展开更多
关键词 双语LDA 语言文本相似 余弦相似 主题频率-逆文档频率
下载PDF
一种基于实体描述和知识向量相似度的跨语言实体对齐模型 被引量:2
8
作者 康世泽 吉立新 +1 位作者 刘树新 丁悦航 《电子学报》 EI CAS CSCD 北大核心 2019年第9期1841-1847,共7页
跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实... 跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实体描述信息共同进行跨语言实体对齐的模型.该模型首先通过训练基于知识图谱结构信息的知识向量找到可能被对齐的实体对,再结合实体描述信息利用改进后的共享参数模型选出最终的对齐实体,最后通过迭代对齐的方法重复前两个步骤找到更多的对齐实体直到训练结束.实验结果表明,与基准算法相比,本文所提模型在跨语言实体对齐任务上可以取得相对不错的结果. 展开更多
关键词 语言实体对齐 知识向量 语言实体描述相似
下载PDF
代码相似性检测技术综述
9
作者 孙祥杰 魏强 +1 位作者 王奕森 杜江 《计算机应用》 CSCD 北大核心 2024年第4期1248-1258,共11页
代码复用为软件开发带来便利的同时也引入了安全风险,如加速漏洞传播、代码恶意抄袭等,代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度,是判断代码复用最有效的技术之一,也是近年发展较快的程序安全分析技术... 代码复用为软件开发带来便利的同时也引入了安全风险,如加速漏洞传播、代码恶意抄袭等,代码相似性检测技术通过分析代码间词法、语法、语义等信息计算代码相似程度,是判断代码复用最有效的技术之一,也是近年发展较快的程序安全分析技术。首先,系统梳理代码相似性检测的近期技术进展,根据目标代码是否开源,将代码相似性检测技术分为源码相似性检测和二进制代码相似性检测,又根据编程语言、指令集的不同进行二次细分;其次,总结每一种技术的思路和研究成果,分析机器学习技术在代码相似性检测领域成功的案例,并讨论现有技术的优势与不足;最后,给出代码相似性检测技术的发展趋势,为相关研究人员提供参考。 展开更多
关键词 二进制代码相似 源代码相似 语言代码相似 深度学习 代码克隆
下载PDF
基于局部和全局语义融合的跨语言句子语义相似度计算模型 被引量:14
10
作者 李霞 刘承标 +1 位作者 章友豪 蒋盛益 《中文信息学报》 CSCD 北大核心 2019年第6期18-26,共9页
跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获... 跨语言句子语义相似度计算旨在计算不同语言句子之间的语义相似程度。近年来,前人提出了基于神经网络的跨语言句子语义相似度模型,这些模型多数使用卷积神经网络来捕获文本的局部语义信息,缺少对句子中远距离单词之间语义相关信息的获取。该文提出一种融合门控卷积神经网络和自注意力机制的神经网络结构,用于获取跨语言文本句子中的局部和全局语义相关关系,从而得到文本的综合语义表示。在SemEval-2017多个数据集上的实验结果表明,该文提出的模型能够从多个方面捕捉句子间的语义相似性,结果优于基准方法中基于纯神经网络的模型方法。 展开更多
关键词 语言文本句子语义相似 自注意力机制 门控卷积神经网络
下载PDF
维吾尔语、汉语、英语相似性对习得第三语言英语介词的影响 被引量:2
11
作者 许淑玲 《海外英语》 2012年第18期256-257,共2页
近年来研究跨语言相似性对第三语言功能词产出影响的学者对第一、第二语言的作用持有不同看法。该文研究目的是验证跨语言相似性的权威研究者Ringbom的研究,他认为在第三语言功能词习得中,心理感知的是第二语言而不是第一语言。基于跨... 近年来研究跨语言相似性对第三语言功能词产出影响的学者对第一、第二语言的作用持有不同看法。该文研究目的是验证跨语言相似性的权威研究者Ringbom的研究,他认为在第三语言功能词习得中,心理感知的是第二语言而不是第一语言。基于跨语言相似性理论,对维吾尔族学习者习得第三语言英语的跨语言影响做了研究:维吾尔族学习者习得第三语言英语介词在高水平组中主要受第二语言汉语影响,而不是第一语言影响;在低水平组中既受第二语言影响又受第一语言影响。而受前者影响远远大于后者。 展开更多
关键词 第三语言习得 跨语言相似 英语介词 维吾尔族学习者
下载PDF
跨语言句法结构相似性对二语句法加工的影响 被引量:11
12
作者 常欣 朱黄华 王沛 《外语教学与研究》 CSSCI 北大核心 2014年第4期560-571,640,共12页
本研究分别以汉-英高水平晚期双语者和法-英高水平晚期双语者为受试,采用ERP技术,选取英语简化关系从句作为实验材料,同时考察跨语言句法相似与相异的句法属性对于二语句法加工过程的影响。就法-英二语者而言,英语简化从句构成跨语言相... 本研究分别以汉-英高水平晚期双语者和法-英高水平晚期双语者为受试,采用ERP技术,选取英语简化关系从句作为实验材料,同时考察跨语言句法相似与相异的句法属性对于二语句法加工过程的影响。就法-英二语者而言,英语简化从句构成跨语言相似性句法结构;就汉-英二语者而言,英语简化从句构成跨语言相异性句法结构。结果显示:对于英语简化从句中特有属性"格"的加工,汉-英双语者和法-英双语者的行为数据没有显著差异,并且正确率很高,反应时很快,这说明汉-英双语者和法-英双语者离线加工水平很高;但是二者都未出现表示自动化句法加工的LAN效应。这样的结果表明:无论对于句法相似还是相异属性的加工,不同母语背景的二语者都未出现母语者的加工模式,进而支持浅层结构假说。 展开更多
关键词 晚期二语者 语言句法相似 二语句法加工 浅层结构假说 统一竞争模型
原文传递
L2(汉语)在L3(英语)习得中的作用
13
作者 蔡凤珍 《伊犁师范学院学报(社会科学版)》 2012年第4期94-97,共4页
采用普遍语法框架研究了L2水平与跨语言相似对L3冠词习得的影响。虽然L1(哈萨克语)和L2中都没有冠词这个词类,但L3不定冠词可表数量的语法功能与L2数词的语法功能有相似之处。研究发现:在冠词改错任务中,在L3水平相等的前提下,L2水平高... 采用普遍语法框架研究了L2水平与跨语言相似对L3冠词习得的影响。虽然L1(哈萨克语)和L2中都没有冠词这个词类,但L3不定冠词可表数量的语法功能与L2数词的语法功能有相似之处。研究发现:在冠词改错任务中,在L3水平相等的前提下,L2水平高者对定冠词的掌握好于L2水平低者;L3水平低于90—104分段者,其L2水平对L3定冠词改错没有任何影响;L3不定冠词比定冠词更容易掌握。这一结果支持了门槛假设、跨语言相似及普遍语法理论。 展开更多
关键词 冠词 L2水平 L3水平 跨语言相似 普遍语法
下载PDF
英汉运动事件结构对比分析
14
作者 裴沛 《济宁学院学报》 2016年第6期84-88,共5页
以Talmy的词化类型学理论为基础,对比分析英汉运动事件结构,包括中性运动事件,方式/原因运动事件和路径运动事件结构.结果表明,英汉运动事件结构具有不同程度的相似性.二者既有一致性,又存在词汇、词序及结构上的不一致.通过揭示这种不... 以Talmy的词化类型学理论为基础,对比分析英汉运动事件结构,包括中性运动事件,方式/原因运动事件和路径运动事件结构.结果表明,英汉运动事件结构具有不同程度的相似性.二者既有一致性,又存在词汇、词序及结构上的不一致.通过揭示这种不同程度的相似性,进一步促进关于跨语言相似性对中国英语学习者运动事件表达影响的研究. 展开更多
关键词 运动事件结构 英汉对比 跨语言相似
下载PDF
母语形态重要吗?——汉语者和德语者学习人工语言格标记规则的行为和ERP研究
15
作者 王路明 《外语教学与研究》 CSSCI 北大核心 2022年第2期252-264,320,共14页
本文比较汉语者和德语者内隐式学习同一门人工语言格标记规则的过程,从多线索(格标记、生命性和语序)角度考察跨语言相似性对语言习得的影响以及在语言训练过程中神经机制的变化。受试掌握词汇之后进入句子学习,然后在句子测试中执行带... 本文比较汉语者和德语者内隐式学习同一门人工语言格标记规则的过程,从多线索(格标记、生命性和语序)角度考察跨语言相似性对语言习得的影响以及在语言训练过程中神经机制的变化。受试掌握词汇之后进入句子学习,然后在句子测试中执行带有反馈的语法判断任务,该过程使用ERP技术记录,1~3天后重复句子学习。实验结果产生预期中的N400-Late Positivity并支持施–受非对称性;相较于汉语组,德语组在初次学习中呈现更高的正确率,但经过第二次学习这种优势不再明显;前后两次学习,德语组和汉语组表现出不同的ERP变化模式。实验结果有助于我们进一步理解跨语言相似性和可训练性。 展开更多
关键词 人工语言 格标记 生命性 ERP 跨语言相似
原文传递
中国英语学习者二语进行体的多模态表征 被引量:4
16
作者 王容花 《现代外语》 CSSCI 北大核心 2019年第3期351-362,共12页
基于多模态语料库数据,本文考察了中国英语学习者二语进行体的言语-手势多模态表征,以探求其二语“即时言语-手势思维”的变化。结果发现:中国英语学习者使用二语进行体主要表“事件在进行”和“临时状态”,仍遵循一语“即时言语思维”... 基于多模态语料库数据,本文考察了中国英语学习者二语进行体的言语-手势多模态表征,以探求其二语“即时言语-手势思维”的变化。结果发现:中国英语学习者使用二语进行体主要表“事件在进行”和“临时状态”,仍遵循一语“即时言语思维”模式;二语进行体的象似手势频率与语义表征均融合了汉、英本族语者进行体手势的显著特征,故中国英语学习者更倾向采用一语-二语混合性“即时手势思维”识解事件。整个研究表明,中国英语学习者的二语“即时言语-手势思维”发展并非同步,而是即时手势思维发展优于即时言语思维发展。 展开更多
关键词 中国英语学习者 即时言语-手势思维 进行体 多模态 跨语言相似
原文传递
中国英语学习者心理使役构式习得新探 被引量:5
17
作者 康建东 《解放军外国语学院学报》 CSSCI 北大核心 2017年第4期71-78,131,共9页
生命性、论元层级凸显性和语义句法信息的交互是影响二语心理使役构式习得之关键。本研究采用经验者论元辨认法,以中国英语学习者和英语母语者为研究对象,探讨以上因素在习得心理使役构式过程中的作用。结果显示,生命性和论元层级凸显... 生命性、论元层级凸显性和语义句法信息的交互是影响二语心理使役构式习得之关键。本研究采用经验者论元辨认法,以中国英语学习者和英语母语者为研究对象,探讨以上因素在习得心理使役构式过程中的作用。结果显示,生命性和论元层级凸显性效应显著。跨语言语义句法信息的相似性在习得英语心理使役构式的过程中没有带来正迁移。 展开更多
关键词 心理使役构式 生命性 论元层级凸显性 语言语义句法相似
原文传递
融合主题和要素的汉柬可比语料获取方法 被引量:3
18
作者 郭月江 严馨 +3 位作者 刘小惠 余正涛 线岩团 莫源源 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第3期360-368,共9页
为了有效地获取可比语料,选取汉柬双语新闻文档作为可比语料库的候选语料,提出一种融合发布时间要素、实体要素和主题分布的可比语料获取方法.该方法首先计算文本的主题概率分布的JS距离,并融合各主题和要素特征,计算文本相似度;然后利... 为了有效地获取可比语料,选取汉柬双语新闻文档作为可比语料库的候选语料,提出一种融合发布时间要素、实体要素和主题分布的可比语料获取方法.该方法首先计算文本的主题概率分布的JS距离,并融合各主题和要素特征,计算文本相似度;然后利用改进型的层次聚类算法对双语文本进行聚类,最后从聚簇类结果中获取可比语料.与基于词典的文本相似度计算方法进行聚类相比,该文方法有更高的Purity和F值并且获得的高质量的可比语料更多,说明了本文方法的有效性. 展开更多
关键词 可比语料库 层次聚类 双语主题模型 语言文本相似
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部