期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于共享词嵌入空间的跨语言相似问句挖掘
1
作者 刘鹏 周安民 《现代计算机》 2019年第8期16-21,共6页
针对跨语言相似问句查找问题,提出一种基于共享词嵌入空间计算中文和英文问句相似性的方法。该方法首先用fastText训练中、英文词嵌入,之后训练中文词嵌入转换到英文词嵌入的线性矩阵,再对待处理的中、英文问句做相应处理,生成英文空间... 针对跨语言相似问句查找问题,提出一种基于共享词嵌入空间计算中文和英文问句相似性的方法。该方法首先用fastText训练中、英文词嵌入,之后训练中文词嵌入转换到英文词嵌入的线性矩阵,再对待处理的中、英文问句做相应处理,生成英文空间下句子嵌入,根据句子嵌入余弦相似性计算句子相似性。实验结果表明该方法是可行的。 展开更多
关键词 句子嵌入 问句相似 跨语言 fastText Sentence2Embeddings
下载PDF
结合主题和位置信息的两阶段文本摘要模型
2
作者 任淑霞 张靖 +1 位作者 赵宗现 饶冬章 《智能计算机与应用》 2023年第9期158-163,共6页
预训练模型BERT显著提升了文本摘要领域模型的性能,但是其在探索文档全局语义方面和对句子位置信息的利用方面还存在着不足。为了解决以上问题,本文提出了一种结合双主题嵌入和句子绝对位置嵌入的两阶段自动摘要生成模型。首先,文章在... 预训练模型BERT显著提升了文本摘要领域模型的性能,但是其在探索文档全局语义方面和对句子位置信息的利用方面还存在着不足。为了解决以上问题,本文提出了一种结合双主题嵌入和句子绝对位置嵌入的两阶段自动摘要生成模型。首先,文章在两个阶段分别引入主题嵌入,融合了丰富的语义特征,以捕获更准确的全局语义;其次,在抽取式阶段引入句子绝对位置嵌入将句子位置信息进行完全整合,获得更全面的摘要抽取辅助信息以进行摘要提取;在此基础上,模型采用抽取-生成两阶段混合式摘要框架,通过抽取阶段对文本重要信息的提取降低生成摘要内容的冗余性,并进一步提高了模型的性能。在CNN/Daily Mail数据集上实验结果表明,本文提出的模型取得了较好的结果。 展开更多
关键词 混合式摘要 BERT 双主题嵌入 句子绝对位置嵌入
下载PDF
A Hybrid Method of Extractive Text Summarization Based on Deep Learning and Graph Ranking Algorithms 被引量:1
3
作者 SHI Hui WANG Tiexin 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2022年第S01期158-165,共8页
In the era of Big Data,we are faced with an inevitable and challenging problem of“overload information”.To alleviate this problem,it is important to use effective automatic text summarization techniques to obtain th... In the era of Big Data,we are faced with an inevitable and challenging problem of“overload information”.To alleviate this problem,it is important to use effective automatic text summarization techniques to obtain the key information quickly and efficiently from the huge amount of text.In this paper,we propose a hybrid method of extractive text summarization based on deep learning and graph ranking algorithms(ETSDG).In this method,a pre-trained deep learning model is designed to yield useful sentence embeddings.Given the association between sentences in raw documents,a traditional LexRank algorithm with fine-tuning is adopted fin ETSDG.In order to improve the performance of the extractive text summarization method,we further integrate the traditional LexRank algorithm with deep learning.Testing results on the data set DUC2004 show that ETSDG has better performance in ROUGE metrics compared with certain benchmark methods. 展开更多
关键词 extractive text summarization deep learning sentence embeddings LexRank
下载PDF
An efficient embedding tree matching algorithm based on metaphoric dependency syntax tree
4
作者 冯少荣 肖文俊 《Journal of Central South University》 SCIE EI CAS 2009年第2期275-279,共5页
To find out all dependency relationships in which metaphors probably exist between syntax constituents in a given sentence,a dependency tree matching algorithm oriented to Chinese metaphor processing is proposed based... To find out all dependency relationships in which metaphors probably exist between syntax constituents in a given sentence,a dependency tree matching algorithm oriented to Chinese metaphor processing is proposed based on a research of unordered tree inclusion matching.In this algorithm,the pattern library is composed of formalization dependency syntax trees that are derived from large-scale metaphor sentences.These kinds of metaphor sentences are saved in the pattern library in advance.The main process of this algorithm is up-down searching and bottom-up backtracking revising.The algorithm discovers potential metaphoric structures in Chinese sentences from metaphoric dependency pattern library.Finally,the feasibility and efficiency of the new matching algorithm are further testified by the results of a series of experiments on dependency pattern library.Hence,accurate dependency relationships can be achieved through this algorithm. 展开更多
关键词 pattern recognition tree matching algorithm dependency tree rule matching metaphor information processing
下载PDF
推导方法在嵌入式句子补写中的运用
5
作者 吴月秀 《才智》 2017年第1期157-157,共1页
嵌入式句子补写难度值大、要求能力层级高。针对这个难题在平时的教学中教师如何做到教学有法,学生答题不盲目呢?这就需要用到推导的方法,即通过理清文段的语脉和句子之间的内在逻辑关系等方法推理导出合理的句子,使其与其它句子组成语... 嵌入式句子补写难度值大、要求能力层级高。针对这个难题在平时的教学中教师如何做到教学有法,学生答题不盲目呢?这就需要用到推导的方法,即通过理清文段的语脉和句子之间的内在逻辑关系等方法推理导出合理的句子,使其与其它句子组成语意连贯内容贴切逻辑严密的语段。利用归纳推理的原理进行语句推导;利用标点符号的作用进行推导;利用复句的内部关系来推导。这些正是本文介绍的三种推导方法。 展开更多
关键词 高考 嵌入句子 补写 推导方法
原文传递
English Connector as Binding Term for Conjunction and Relative Pronoun
6
作者 Japen Sarage 《Sino-US English Teaching》 2015年第9期660-666,共7页
As grammatical words, conjunction and relative pronoun play a similar role. They join clauses, phrases, and even words. The terms independent and dependent clauses have become popular for quite a long time. When the c... As grammatical words, conjunction and relative pronoun play a similar role. They join clauses, phrases, and even words. The terms independent and dependent clauses have become popular for quite a long time. When the concept of clause and sentence meets at the presence of NP (Noun Phrase) and VP (Verb Phrase), there is a right to consider construction as an S or a sentence leaving the conjunction and relative pronoun as means of uniting device and leaving every NP-VP construction as equal units. By employing an embedding theory, we can see hidden parts of a sentence and their roles in other sentences. This article tries to see if it is still necessary to distinguish between dependent and independent clauses. 展开更多
关键词 CONNECTOR CONJUNCTION relative pronoun
下载PDF
基于对比学习和预训练模型的临床诊断标准化
7
作者 刘莹 崔丙剑 +1 位作者 曹琉 程龙龙 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期23-28,共6页
针对临床诊断标准化任务中存在的标准诊断词库规模大、文本相关性不显著且标准词个数不确定的问题,提出一种基于对比学习和预训练模型的临床诊断标准化方法.先用无监督和有监督相结合的方法对基于简单对比学习的句子嵌入(SimCSE)模型进... 针对临床诊断标准化任务中存在的标准诊断词库规模大、文本相关性不显著且标准词个数不确定的问题,提出一种基于对比学习和预训练模型的临床诊断标准化方法.先用无监督和有监督相结合的方法对基于简单对比学习的句子嵌入(SimCSE)模型进行训练,并利用得到的模型从标准库中召回候选标准词,再利用基于转换器的双向编码表征(BERT)进行候选词重排序和标准词个数分类,最终得到标准化结果.实验结果表明:基于无监督和有监督相结合的SimCSE方法的召回率为86.76%,显著优于其他方法;在重排序和标准词个数分类任务中,相比于其他模型,BERT在多个指标上有明显提升;该方法在测试集上进行标准词预测的F1值达到72.54%,在临床诊断标准化中具有较好的表现. 展开更多
关键词 临床诊断标准化 对比学习 预训练模型 基于简单对比学习的句子嵌入(SimCSE) 基于转换器的双向编码表征(BERT)
原文传递
基于跨语言预训练模型的朝汉翻译质量评估 被引量:1
8
作者 赵亚慧 李飞雨 +4 位作者 崔荣一 金国哲 张振国 李德 金小峰 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第8期2371-2379,共9页
针对主流翻译质量评估框架在低资源语料上表现较差,句子嵌入策略单一的问题,提出了一个基于跨语言预训练模型的朝汉翻译质量评估模型。首先,借鉴注意力思想提出一种融合跨层信息和词项位置的句子嵌入方法;其次,将跨语言预训练模型引入... 针对主流翻译质量评估框架在低资源语料上表现较差,句子嵌入策略单一的问题,提出了一个基于跨语言预训练模型的朝汉翻译质量评估模型。首先,借鉴注意力思想提出一种融合跨层信息和词项位置的句子嵌入方法;其次,将跨语言预训练模型引入翻译质量评估任务中,缓解朝鲜语低资源环境带来的数据稀疏问题;最后,对句向量进行回归,实现机器翻译质量评估任务。实验结果表明:该模型能有效提升朝汉翻译质量评估任务性能,与质量评估任务领域主流模型QuEst++、Bilingual Expert、TransQuest相比,皮尔逊相关系数分别提升了0.226、0.156、0.034,斯皮尔曼相关系数分别提升了0.123、0.038、0.026。 展开更多
关键词 计算机应用 翻译质量评估 跨语言预训练模型 句子嵌入
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部