期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种基于实体描述和知识向量相似度的跨语言实体对齐模型 被引量:2
1
作者 康世泽 吉立新 +1 位作者 刘树新 丁悦航 《电子学报》 EI CAS CSCD 北大核心 2019年第9期1841-1847,共7页
跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实... 跨语言实体对齐旨在找到不同语言知识图谱中指向现实世界同一事物的实体.传统的跨语言实体对齐方法通常仅依靠知识图谱内部的结构信息,但实际上一些知识图谱提供的实体描述信息也可以被利用.本文提出了一种结合知识图谱的内部结构和实体描述信息共同进行跨语言实体对齐的模型.该模型首先通过训练基于知识图谱结构信息的知识向量找到可能被对齐的实体对,再结合实体描述信息利用改进后的共享参数模型选出最终的对齐实体,最后通过迭代对齐的方法重复前两个步骤找到更多的对齐实体直到训练结束.实验结果表明,与基准算法相比,本文所提模型在跨语言实体对齐任务上可以取得相对不错的结果. 展开更多
关键词 语言实体对齐 知识向量 语言实体描述相似度
下载PDF
基于特征相似度的跨语言事件映射 被引量:3
2
作者 唐亮 席耀一 +1 位作者 赵晓峰 易绵竹 《计算机应用》 CSCD 北大核心 2016年第A02期247-250,共4页
跨语言事件映射主要研究的是不同语言的事件之间的相似性。针对传统方法仅从文本内容来获取特征词导致准确率不高的问题,提出从文本标题、文本内容以及新词发现三方面综合分析,通过计算候选词的综合权重来得到最终的特征词。实验证明了... 跨语言事件映射主要研究的是不同语言的事件之间的相似性。针对传统方法仅从文本内容来获取特征词导致准确率不高的问题,提出从文本标题、文本内容以及新词发现三方面综合分析,通过计算候选词的综合权重来得到最终的特征词。实验证明了与传统方法相比,该方法准确性大大提高。 展开更多
关键词 事件相似度 语言对齐 特征向量提取 文本聚类 概念扩展
下载PDF
借助汉-越双语词对齐语料构建越南语依存树库
3
作者 李发杰 余正涛 +2 位作者 郭剑毅 李英 周兰江 《中文信息学报》 CSCD 北大核心 2015年第6期69-74,共6页
由于对越南语的研究工作相对较少,因此还没有建立规模相对较大的依存树库。相对于已经拥有了形态丰富、语料成熟的汉语,越南语的依存句法分析要困难得多,所以该文提出了一种借助汉-越双语词对齐语料构建越南语依存树库的方法。首先对汉... 由于对越南语的研究工作相对较少,因此还没有建立规模相对较大的依存树库。相对于已经拥有了形态丰富、语料成熟的汉语,越南语的依存句法分析要困难得多,所以该文提出了一种借助汉-越双语词对齐语料构建越南语依存树库的方法。首先对汉语-越南语句子对进行词对齐处理,然后对汉语句子进行依存句法分析。最后结合越南语本身的语言特点和有关的语法规则将汉语的依存关系通过汉-越双语词对齐关系映射到越南语句子中,从而生成越南语的依存树库。实验表明,该方法简化了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间。实验结果表明,该方法相比采用机器学习的方法准确率明显提高。 展开更多
关键词 越南语依存树库 汉语依存句法分析 汉-越语言对齐关系
下载PDF
融合关键词概率映射的汉越低资源跨语言摘要
4
作者 李笑萌 张亚飞 +2 位作者 郭军军 高盛祥 余正涛 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期630-637,共8页
在低资源汉越跨语言摘要任务中,由于标注的汉越对齐数据稀缺,较难实现跨语言语义对齐.鉴于此,提出一种融合关键词概率映射的低资源跨语言摘要方法,首先利用源语言关键词实现关键信息的提取,然后基于概率映射对将源语言关键词映射到目标... 在低资源汉越跨语言摘要任务中,由于标注的汉越对齐数据稀缺,较难实现跨语言语义对齐.鉴于此,提出一种融合关键词概率映射的低资源跨语言摘要方法,首先利用源语言关键词实现关键信息的提取,然后基于概率映射对将源语言关键词映射到目标语言,最后基于指针网络将映射的目标语言关键词融入到摘要生成过程中.在构建的汉越跨语言摘要数据集上的实验结果表明,相比于直接的端到端的方法,融入关键词概率映射信息可以有效地提升低资源跨语言摘要的质量. 展开更多
关键词 低资源跨语言摘要 语言语义对齐 关键词 概率映射
下载PDF
基于深度学习的多语言跨领域主题对齐模型 被引量:1
5
作者 余传明 原赛 +1 位作者 胡莎莎 安璐 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第5期430-439,共10页
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨... 在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。 展开更多
关键词 语言主题对齐 跨领域主题对齐 深度学习 双语词嵌入 知识对齐
原文传递
化妆品风险物质知识图谱构建及应用 被引量:2
6
作者 赵敏 毛典辉 +3 位作者 张青川 吕东东 刘一铭 陈俊华 《计算机工程与设计》 北大核心 2023年第12期3784-3793,共10页
针对国内外化妆品风险物质多语言特性和复杂关联的特点,提出一种基于双通道图神经网络的邻域匹配算法。采用图神经网络学习实体属性特征和跨域交互特性,将不同特性实体映射到相同的向量空间,通过邻域匹配网络聚合实体邻域特征,为每个实... 针对国内外化妆品风险物质多语言特性和复杂关联的特点,提出一种基于双通道图神经网络的邻域匹配算法。采用图神经网络学习实体属性特征和跨域交互特性,将不同特性实体映射到相同的向量空间,通过邻域匹配网络聚合实体邻域特征,为每个实体构建邻域网络以实现实体对齐,并应用于多语言风险物质知识图谱及问答系统构建。实验结果表明,在化妆品风险物质数据集上该方法获得的Hits@1、Hits@10与MRR值都优于其它基线模型,分别平均提升6.37%、8.17%与9.37%。 展开更多
关键词 化妆品风险物质 知识图谱 语言实体对齐 贝叶斯算法 图卷积神经网络 邻域匹配网络 问答系统
下载PDF
维、哈、柯少数民族文字排版关键技术的研究
7
作者 孔真 衣马木艾山 《佳木斯职业学院学报》 2017年第1期414-415,共2页
新疆少数民族语言文字排版使用广泛。本地开发了一些多文种操作系统,实现了民族文字、汉、俄、英一体化的多文种混合处理,但其功能还不够完善,特别是在维文文书排版方面仍不理想,不仅对维文的字母字体支持不充分,并且也不能够对维文进... 新疆少数民族语言文字排版使用广泛。本地开发了一些多文种操作系统,实现了民族文字、汉、俄、英一体化的多文种混合处理,但其功能还不够完善,特别是在维文文书排版方面仍不理想,不仅对维文的字母字体支持不充分,并且也不能够对维文进行优化合理的断行,这导致维文文档的显示极其不美观。本文提出维、哈、柯文专业排版关键技术应用的研究,为其他少数民族地区专业排版技术,提供有益借鉴。 展开更多
关键词 维、哈、柯文对齐、断行、多语言混排 关键技术应用
下载PDF
Naxi-English Bilingual Word Alignment Based on Language Characteristics and Log-Linear Model
8
作者 Yu Zhengtao Xian Yantuan +2 位作者 Tian Wei Guo Jianyi Zhang Tao 《China Communications》 SCIE CSCD 2012年第3期78-86,共9页
We propose a method that can achieve the Naxi-English bilingual word automatic alignment based on a log-linear model.This method defines the different Naxi-English structural feature functions,which are English-Naxi i... We propose a method that can achieve the Naxi-English bilingual word automatic alignment based on a log-linear model.This method defines the different Naxi-English structural feature functions,which are English-Naxi interval switching function and Naxi-English bilingual word position transformation function.With the manually labeled Naxi-English words alignment corpus,the parameters of the model are trained by using the minimum error,thus Naxi-English bilingual word alignment is achieved automatically.Experiments are conducted with IBM Model 3 as a benchmark,and the Naxi language constraints are introduced.The final experiment results show that the proposed alignment method achieves very good results:the introduction of the language characteristic function can effectively improve the accuracy of the Naxi-English Bilingual Word Alignment. 展开更多
关键词 word aligrmaent Naxi language ENGLISH log-linear model interval switching function posi-tion transformation function
下载PDF
Alignment of the Polish-English Parallel Text for a Statistical Machine "Translation
9
作者 Krzysztof Wolk Krzysztof Marasek 《Computer Technology and Application》 2013年第11期575-583,共9页
Text alignment is crucial to the accuracy of MT (Machine Translation) systems, some NLP (Natural Language Processing) tools or any other text processing tasks requiring bilingual data. This research proposes a lan... Text alignment is crucial to the accuracy of MT (Machine Translation) systems, some NLP (Natural Language Processing) tools or any other text processing tasks requiring bilingual data. This research proposes a language independent sentence alignment approach based on Polish (not position-sensitive language) to English experiments. This alignment approach was developed on the TED (Translanguage English Database) talks corpus, but can be used for any text domain or language pair. The proposed approach implements various heuristics for sentence recognition. Some of them value synonyms and semantic text structure analysis as a part of additional information. Minimization of data loss was ensured. The solution is compared to other sentence alignment implementations. Also an improvement in MT system score with text processed with the described tool is shown. 展开更多
关键词 Text alignment NLP tools machine learning text corpora processing
下载PDF
外语课堂师生话语的促学特征研究——来自师生话语关联度的证据
10
作者 吴诗玉 熊颖 《外语教学理论与实践》 CSSCI 北大核心 2024年第5期65-77,共13页
本研究使用基于R的文本挖掘技术手段,研究两个平行班级的完整课堂话语,以项频率(tf)以及项频率-逆文档频率(tf-idf)值为技术指标,通过挖掘课堂话语中各角色话语的关联度,呈现不同外语课堂的语言对齐程度与师生互动的过程,从而探讨外语... 本研究使用基于R的文本挖掘技术手段,研究两个平行班级的完整课堂话语,以项频率(tf)以及项频率-逆文档频率(tf-idf)值为技术指标,通过挖掘课堂话语中各角色话语的关联度,呈现不同外语课堂的语言对齐程度与师生互动的过程,从而探讨外语教师课堂话语的促学特征在内容与形式上的表现。研究发现,从项频率的总体指标看,两个平行班级的师生话语都与参照话语显著相关。但是,从课堂话语中各角色话语所用单词承载的信息权重看,两个平行班级的师生话语都“离题”了,都没有触及到所学课文中由最重要的词语所定义的核心内容,关联度很低。不过,两个平行班级的教师话语都表现出与学生积极互动并对学生积极进行反馈的促学特征。文本挖掘技术为动态发展的课堂话语的量化分析提供了新的路径。 展开更多
关键词 文本挖掘 课堂话语 词频 信息权重 语言对齐
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部