期刊文献+
共找到343篇文章
< 1 2 18 >
每页显示 20 50 100
High performance word level sequential and parallel coding methods and architectures for bit plane coding 被引量:1
1
作者 XIONG ChengYi TIAN JinWen LIU Jian 《Science in China(Series F)》 2008年第4期337-351,共15页
This paper introduced a novel high performance algorithm and VLSI architectures for achieving bit plane coding (BPC) in word level sequential and parallel mode. The proposed BPC algorithm adopts the techniques of co... This paper introduced a novel high performance algorithm and VLSI architectures for achieving bit plane coding (BPC) in word level sequential and parallel mode. The proposed BPC algorithm adopts the techniques of coding pass prediction and parallel & pipeline to reduce the number of accessing memory and to increase the ability of concurrently processing of the system, where all the coefficient bits of a code block could be coded by only one scan. A new parallel bit plane architecture (PA) was proposed to achieve word-level sequential coding. Moreover, an efficient high-speed architecture (HA) was presented to achieve multi-word parallel coding. Compared to the state of the art, the proposed PA could reduce the hardware cost more efficiently, though the throughput retains one coefficient coded per clock. While the proposed HA could perform coding for 4 coefficients belonging to a stripe column at one intra-clock cycle, so that coding for an NxN code-block could be completed in approximate N2/4 intra-clock cycles. Theoretical analysis and experimental results demonstrate that the proposed designs have high throughput rate with good performance in terms of speedup to cost, which can be good alternatives for low power applications. 展开更多
关键词 bit plane coding high performance word-level sequential multi-word parallel
原文传递
语音邻域密度、词性类别、语言水平对二语词汇联想反应的影响
2
作者 张萍 徐雅琛 《外语学刊》 CSSCI 北大核心 2024年第1期61-68,共8页
本文研究语音邻域密度、词性类别及语言水平对中国英语学习者二语词汇联想反应的影响。使用Lex_30测量词汇水平,采用“听—写”词联想任务考察所选词的语音邻域稀疏与密集程度以及名、动、形不同词性的刺激词联想反应差异。结果表明:(1... 本文研究语音邻域密度、词性类别及语言水平对中国英语学习者二语词汇联想反应的影响。使用Lex_30测量词汇水平,采用“听—写”词联想任务考察所选词的语音邻域稀疏与密集程度以及名、动、形不同词性的刺激词联想反应差异。结果表明:(1)高低水平学生产出的语音和语义反应均存在显著差异,语音反应比例与语言水平成负向相关;(2)不同词性的语义联想反应有显著差异,但在语音反应上无差异;(3)不同语音邻域密度的刺激词只在高语言水平者的语义反应上有显著差异,低水平者只有名词的语音及语义反应存在显著差异,部分支持邻域激活模型。 展开更多
关键词 语音邻域密度 词性类别 二语水平 二语词汇联想 语音—语义反应
下载PDF
融合双图卷积与门控线性单元的方面级情感分析模型
3
作者 杨春霞 吴亚雷 +1 位作者 闫晗 黄昱锟 《计算机工程》 CAS CSCD 北大核心 2024年第4期141-149,共9页
方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融... 方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融合双图卷积与门控线性单元(GLU)的方面级情感分析模型。该模型首先采用全局词汇图来编码语料库中的词共现信息,在词汇图和句法图上利用分类概括结构来区分各种词共现频率和不同类型的句法依存关系。然后分别在2个图上进行双层卷积,继而使用Bi Affine变换模块作为桥梁,在2个图卷积网络模块之间有效地交换相关特征,从而有效地融合句法信息和词汇信息。最后利用GLU控制情感信息流向给定方面,使模型可以更专注地分析与该方面相关的情感信息,避免不相关的情感信息影响对给定方面的情感分析结果,从而提高分析的准确性。实验结果表明,在Twitter、Laptop14、Restaurant15和Restaurant16数据集上,该模型的准确率分别达到74.82%、77.61%、82.29%和89.81%,F1值分别达到72.97%、73.52%、67.72%和73.37%,方面级情感分类效果明显优于其他基线模型。 展开更多
关键词 方面级情感分析 词共现信息 双图卷积 信息交互 门控线性单元
下载PDF
面向多模态情感分析的多通道时序卷积融合
4
作者 孙杰 车文刚 高盛祥 《计算机科学与探索》 CSCD 北大核心 2024年第11期3041-3050,共10页
多模态情感分析已成为情感计算领域中的热门研究方向,它将基于单模态的情感分析扩展到基于多模态信息交流的环境。词级表示融合是建模跨模态信息交互的关键技术之一,旨在建模不同模态元素之间的相互作用。该任务面临两大挑战:模态元素... 多模态情感分析已成为情感计算领域中的热门研究方向,它将基于单模态的情感分析扩展到基于多模态信息交流的环境。词级表示融合是建模跨模态信息交互的关键技术之一,旨在建模不同模态元素之间的相互作用。该任务面临两大挑战:模态元素之间的局部交互和时间维度上的全局交互。现有方法在建模局部交互时,常采用注意力机制刻画模态元素整体特征间的相关性,但忽视了相邻元素及局部特征间的交互作用,计算成本也较高。为解决上述问题,提出一种多通道时序卷积融合(MCTCF)模型,该方法运用二维卷积网络获取多模态元素之间的局部交互。其中,局部连接可捕获相邻元素的关联,多通道卷积可学习多模态元素局部特征之间的融合,权重共享大幅降低了计算量。在得到局部交互后的序列上,时序LSTM网络可进一步建模时间维度上的全局关联。在MOSI和MOSEI数据集上的大量实验证明了MCTCF的有效性与高效性。仅用一个卷积核(三通道,28个权重参数),在许多指标上取得了最先进或具有竞争力的结果。消融研究表明,局部卷积融合和全局时序建模都是提高性能的关键。该研究强化了词级表示融合,降低了计算复杂度。 展开更多
关键词 多模态 情感分析 词级表示融合 二维卷积网络
下载PDF
混合特征及多头注意力的中文短文本分类
5
作者 江结林 朱永伟 +2 位作者 许小龙 崔燕 赵英男 《计算机工程与应用》 CSCD 北大核心 2024年第9期237-243,共7页
传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本... 传统的短文本分类研究方法存在两方面不足,一是不能全面地表示文本的语义信息,二是无法充分地提取和融合文本全局和局部信息。基于此,提出一种混合特征及多头注意力(HF-MHA)的中文短文本分类方法。该方法利用预训练模型计算中文短文本的字符级向量和词级向量表示,以得到更全面的文本特征向量表示;采用多头注意力机制捕捉文本序列中的依赖关系,以提高文本的语义理解;通过卷积神经网络分别提取两种向量表示的特征,并将其融合为一个特征向量,以整合文本的全局和局部信息;通过输出层得到分类结果。在三个公开数据集上的实验表明,HF-MHA能够有效地提升中文短文本分类的性能。 展开更多
关键词 中文短文本分类 注意力机制 词级向量 字符级向量
下载PDF
融合双通道的语义信息的方面级情感分析
6
作者 廖列法 张文豪 《计算机工程与设计》 北大核心 2024年第7期2228-2234,共7页
针对方面级情感分析任务中语义信息难以提取以及方面词信息难以和上下文信息相关联的问题,提出一种融合双通道的语义信息模型(FDCS)。通过BERT预训练模型搭建两个通道获取不同层次的语义信息,一个是全局信息通道,另一个是句子信息通道;... 针对方面级情感分析任务中语义信息难以提取以及方面词信息难以和上下文信息相关联的问题,提出一种融合双通道的语义信息模型(FDCS)。通过BERT预训练模型搭建两个通道获取不同层次的语义信息,一个是全局信息通道,另一个是句子信息通道;使用语义注意力融合双通道中不同层次的语义信息,将融合后的语义信息再次分别融入全局信息和句子信息;根据每个通道语义信息的不同分别提取相应的特征信息。在3个基准数据集上的实验结果表明,该模型的性能优于其它模型。 展开更多
关键词 方面级情感分析 方面词 预训练模型 双通道 语义信息 语义注意力 特征信息
下载PDF
基于语用交互的跨目标立场检测
7
作者 任科兰 张明书 +2 位作者 魏彬 姜文 闫法成 《计算机工程与设计》 北大核心 2024年第8期2513-2519,共7页
针对缺乏足够的带标注意见数据、跨目标立场检测结果不佳且可解释性弱等问题,提出一种基于语用交互(pragmatic interaction graph convolution, PIGCN)的跨目标立场检测模型。考虑情感与立场在语义上的耦合关系,利用交互式图卷积神经网... 针对缺乏足够的带标注意见数据、跨目标立场检测结果不佳且可解释性弱等问题,提出一种基于语用交互(pragmatic interaction graph convolution, PIGCN)的跨目标立场检测模型。考虑情感与立场在语义上的耦合关系,利用交互式图卷积神经网络(graphical convolutional network, GCN),增量式聚合单词在不同目标之间语用信息的相互作用,缓解目标间的信息孤岛问题。实验结果表明,该模型在平均F1值上达到了53.4%,优于基准模型,具有更好的可扩展性和适应性,在提升模型可解释性方面具有潜力。 展开更多
关键词 跨目标立场检测 图卷积神经网络 语用交互 词级粒度 情感词汇 可解释性 依存图
下载PDF
A Pulse Width Modulation Scheme With Zero-sequence Voltage Injection for Single Phase Three-level NPC Rectifiers 被引量:9
8
作者 宋文胜 冯晓云 《中国电机工程学报》 EI CSCD 北大核心 2011年第36期I0003-I0003,共1页
直流侧中点电位电压偏移是多电平中性点钳位型变流器的主要缺点。以单相三电平NPC整流器为研究对象,以实现直流侧中点电位无漂移为控制目标,以传统的单相三电平单极性载波脉宽调制方法为基础,首先提出一种基于零序电压分量注入的载... 直流侧中点电位电压偏移是多电平中性点钳位型变流器的主要缺点。以单相三电平NPC整流器为研究对象,以实现直流侧中点电位无漂移为控制目标,以传统的单相三电平单极性载波脉宽调制方法为基础,首先提出一种基于零序电压分量注入的载波脉宽调制算法;然后在此基础上给出基于零序电压分量极限值注入的载波脉宽调制算法;并给出这2种方法的零序电压分量的设计方案;最后,对这2种方法进行了详细的理论分析、计算机仿真和1kW样机实验对比验证。研究结果表明:所提出的2种算法都能有效实现直流侧中点电位平衡控制,其中基于零序电压分量极限值注入的载波调制算法的中点电位控制具有更快动态响应速度,且其网侧电流的高次谐波主要分布在开关频率附近;而基于零序电压分量注入的载波调制算法的网侧电流高次谐波主要分布在2倍开关频率附近。但是在一个调制信号周期内,基于零序电压分量极限值注入的载波调制算法的开关切换次数比基于零序电压分量注入的载波调制算法低25%左右。 展开更多
关键词 三电平 脉冲宽度 零序电压 单相 整流器 中性点电压 调制 直流母线
下载PDF
融合词法句法信息的方面级情感分析模型
9
作者 衡红军 杨鼎诚 《计算机工程与设计》 北大核心 2024年第3期837-844,共8页
为解决现有方面级情感分析方法缺乏句法约束和词义信息的问题,将句法依存树和知识图谱融合起来对句子编码,提出一种词法句法相结合的图神经网络模型。利用图神经网络分别提取句法依存树中的句法信息和知识图谱中的词法信息,经过位置编... 为解决现有方面级情感分析方法缺乏句法约束和词义信息的问题,将句法依存树和知识图谱融合起来对句子编码,提出一种词法句法相结合的图神经网络模型。利用图神经网络分别提取句法依存树中的句法信息和知识图谱中的词法信息,经过位置编码模块和掩码加权模块捕捉重要性更高的单词;将两种特征进行结合获得融合句法词法信息的文本表示,进行情感分类。在3个公开数据集上的实验结果验证了该模型的有效性。 展开更多
关键词 方面级情感分析 句法约束 词义信息 句法依存树 知识图谱 关系图注意力网络 图卷积网络
下载PDF
融合单词级段信息的中文医疗命名实体识别
10
作者 王海鹏 杜方 +1 位作者 宋丽娟 李婷 《计算机技术与发展》 2024年第6期110-117,共8页
中文医疗命名实体识别(Named Entity Recognition,NER)是医学领域的一项基础任务,在知识图谱等许多下游任务中起着重要的作用。常用的NER方法可分为基于词级信息和基于段级信息,已有研究表明两种信息融合能取得更好的性能。目前,词级信... 中文医疗命名实体识别(Named Entity Recognition,NER)是医学领域的一项基础任务,在知识图谱等许多下游任务中起着重要的作用。常用的NER方法可分为基于词级信息和基于段级信息,已有研究表明两种信息融合能取得更好的性能。目前,词级信息和段级信息融合的方法在中文医疗NER任务中还未被充分研究,且现有的融合方法为段中的每个单词赋予相同的权重,不考虑单词的不同贡献。而医疗实体中每个单词和实体(段)有着不同的相关性,忽略这种相关性的差异将影响医疗NER的性能。基于此,通过分析中文医疗实体特性,提出了一种单词级段信息抽取方法(Word-Level Segment Information Extraction,WL-SIE)。该方法为实体中的每个单词分配一个权重矩阵集,学习单词与实体之间的关联信息,在与实体词组交互之后输出不同的单词级段信息。在CCKS2017和CMeEE中文临床NER数据集上的实验结果表明,WL-SIE方法较对比方法在F1值上提升了3%~5%,特别是在实体样本不均衡场景下和长实体识别任务上表现出了优异的性能。 展开更多
关键词 命名实体识别 深度神经网络 词级信息 段级信息 中文医疗信息处理
下载PDF
基于字形的汉字字符复杂度算法及其应用
11
作者 陈天序 王钗 吴子昂 《语言文字应用》 CSSCI 北大核心 2024年第2期135-144,共10页
汉字字符复杂度是影响汉字识别的重要因素之一,常以笔画数代表,而字形对视觉复杂度的影响尚未得到充分研究。本研究引入汉字字符复杂度的新算法,即将汉字处理为图像后对汉字轮廓进行分块切割,计算字形整体的周长复杂度,得出汉字字符复... 汉字字符复杂度是影响汉字识别的重要因素之一,常以笔画数代表,而字形对视觉复杂度的影响尚未得到充分研究。本研究引入汉字字符复杂度的新算法,即将汉字处理为图像后对汉字轮廓进行分块切割,计算字形整体的周长复杂度,得出汉字字符复杂度值。本研究尝试将新算法应用于国际中文教育的字表研究,发现:相较于用笔画数代表汉字字符复杂度的传统方法,新算法计算出的汉字字符复杂度更能够体现同一笔画数下不同汉字视觉上的字形差异;以国际中文教育领域的等级字表为样本,部分等级之间汉字字符复杂度无显著差异。 展开更多
关键词 汉字字符复杂度 测算方法 等级字表 国际中文教育
下载PDF
Reading Developmental Trends in Early Years: The Influence of Word Identification Skills and Target Langauge Oral Ability to Comprehension
12
作者 Grace Njoki Mwathe 《Journalism and Mass Communication》 2015年第10期522-536,共15页
Language, reading, and reading-related tasks were administered to 148 children from lower primary (Standard 1, 2, and 3) in Kenyan schools. The aim was to investigate the literacy developmental trends across the yea... Language, reading, and reading-related tasks were administered to 148 children from lower primary (Standard 1, 2, and 3) in Kenyan schools. The aim was to investigate the literacy developmental trends across the years and establish which of the two variables, word identification skills or target language oral proficiency influenced reading comprehension performance. The results indicated that word identification skills independently influenced reading comprehension performance in both standard 2 and standard 3 classes, but target language oral skills did not. Further, the analysis of invented spelling task performance revealed evidence of transfer of alphabetic coding skills of first language to English orthography. The spelling errors reflected letter-sound patterns not found in English orthography. Analysis of the miscues in the spelling task revealed that children rely on first language phonological processes to spell target language unfamiliar words as long the languages have a common alphabetic system. 展开更多
关键词 first language oral ability target language word level skills
下载PDF
文档级事件抽取反向推理模型
13
作者 纪婉婷 马宇航 +2 位作者 鲁闻一 王俊陆 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期122-129,共8页
事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件... 事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件抽取反向推理模型(reverse inference model for document-level event extraction,RIDEE)。基于无触发词的设计,将文档级事件抽取转化为候选事件要素抽取和事件触发推理两个子任务,并行式抽取事件要素并检测事件类型。此外,设计了一种用于存储历史事件的事件依赖池,使得模型在处理多事件文本时可以充分利用事件之间的依赖关系。公开数据集上的实验结果表明,与现有事件抽取模型相比,RIDEE在进行文档级事件抽取时具有更优的性能。 展开更多
关键词 文档级事件抽取 反向推理 无触发词 事件依赖池
下载PDF
基于位置增强词向量和GRU-CNN的方面级情感分析模型研究 被引量:1
14
作者 陶林娟 华庚兴 李波 《计算机工程与应用》 CSCD 北大核心 2024年第9期212-218,共7页
方面级情感分析旨在判断一段文本中特定方面词的情感倾向,其核心问题是方面词的上下文如何准确表征。与现有研究主要关注注意力机制的改进不同,该文从词语表征和上下文编码模型两个方面进行改进。在词语表征方面,通过BERT模型和位置度... 方面级情感分析旨在判断一段文本中特定方面词的情感倾向,其核心问题是方面词的上下文如何准确表征。与现有研究主要关注注意力机制的改进不同,该文从词语表征和上下文编码模型两个方面进行改进。在词语表征方面,通过BERT模型和位置度量公式获得增强的词向量表示;在上下文编码模型方面,使用GRU-CNN网络提取文本语义特征。在SemEval2014 Task4数据集上的实验表明,提出的模型在Restaurant和Laptop领域中的准确率分别达到了85.54%和80.35%,证实了所提出模型的有效性。 展开更多
关键词 方面级情感分析 卷积神经网络 预训练词向量 位置函数 注意力机制
下载PDF
基于改进的Bag of Visual Words算法的SAR图像目标分类 被引量:1
15
作者 王跃 薄华 《电子设计工程》 2013年第12期124-127,131,共5页
"视觉词袋"(Bag of Visual Words,BOV)算法是一种有效的基于语义特征表达的物体识别算法。针对传统BOV模型存在的不足,综合利用SAR图像的灰度和纹理特征,提出基于感兴趣目标(Target of Interest,TOI)的"视觉词袋"... "视觉词袋"(Bag of Visual Words,BOV)算法是一种有效的基于语义特征表达的物体识别算法。针对传统BOV模型存在的不足,综合利用SAR图像的灰度和纹理特征,提出基于感兴趣目标(Target of Interest,TOI)的"视觉词袋"算法。首先,对训练图像进行TOI选取,用灰度共生矩阵模型提取TOI的纹理特征,再结合灰度特征,组成多维特征向量集,以簇内相似度最高、数据分布密度最大为准则,生成"视觉词袋"。其次,对测试图像,依据已生成的"视觉词袋",采用支持向量机(Support Vector Machine,SVM)分类器,实现SAR图像感兴趣目标的有效分类。实验结果表明,与传统的"视觉词袋"构建算法相比,该算法在分类正确率提高的同时,能够在训练图像较少的情况下达到良好的分类效果。 展开更多
关键词 BAG of VISUAL words算法 灰度共生矩阵 感兴趣目标 簇内相似度 支持向量机 目标分类
下载PDF
一种基于Word2vec的敏感内容识别技术 被引量:8
16
作者 金贵涛 石元兵 +2 位作者 魏忠 王雍 刘峻豪 《通信技术》 2019年第11期2750-2756,共7页
随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护。传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露。于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从... 随着数据量的爆炸式增长,企业面临数据安全防护的难题,尤其是文本数据的安全防护。传统的精确匹配识别文本中敏感词的方法,因存在相似词而导致遗漏,造成数据泄露。于是,提出了一种基于Word2vec结合人工设定的不同等级敏感词识别技术,从语义层面识别文本中的敏感词,并根据提出的敏感度模型计算文本敏感度,判断文本敏感等级。实验结果表明,与传统方法相比,提出的技术方法能够更准确、全面地识别文本敏感内容,并确定文本敏感等级。 展开更多
关键词 敏感词 TextRank算法 word2vec 文本敏感等级
下载PDF
基于上下文迭代学习的方面级别情感分析
17
作者 余文婷 王晓晔 +1 位作者 杨鹏 肖迎元 《天津理工大学学报》 2024年第1期109-115,共7页
方面级别情感分析是对给定句子的不同方面进行情感极性预测。在长句子中有许多无关词会干扰情感预测的结果,且这些无关词与中心词存在一定的距离。对此,提出以下解决方案:设计上下文迭代学习网络。提出上下文注意力模块(context attenti... 方面级别情感分析是对给定句子的不同方面进行情感极性预测。在长句子中有许多无关词会干扰情感预测的结果,且这些无关词与中心词存在一定的距离。对此,提出以下解决方案:设计上下文迭代学习网络。提出上下文注意力模块(context attention modules,CAM),模块采用上下文动态特征掩码(context features dynamic mask,CDM)遮掩距离中心词较远的词,上下文动态特征权重(context features dynamic weighted,CDW)减小较远词的权重。文中设计的CAM经过多层迭代,增强了方面词在上下文部分的特征提取。在公共的基准数据集上进行一系列的试验比对,试验结果证明文中提出的方法是有效的。 展开更多
关键词 基于方面的情感分析 特征提取 注意力机制 降低词干扰
下载PDF
文档编辑中提升Word 字处理软件使用水平的策略 被引量:3
18
作者 岳云艳 《信息与电脑》 2020年第21期98-100,共3页
随着科技的发展,计算机技术在各个行业的发展中扮演着重要的角色,Word字处理软件作为当前工作中重要的办公软件,极大提升了人们的工作效率。但在Word字处理软件的实际应用中,由于对其认识不全面,在使用上的水平仍比较低,只是简单的文字... 随着科技的发展,计算机技术在各个行业的发展中扮演着重要的角色,Word字处理软件作为当前工作中重要的办公软件,极大提升了人们的工作效率。但在Word字处理软件的实际应用中,由于对其认识不全面,在使用上的水平仍比较低,只是简单的文字输入与处理,很多功能缺乏有效的利用,从而对办公效率产生了一定的影响,也造成了一定程度的资源浪费。因此本文针对在文档编辑中如何提升Word字处理软件的使用水平进行分析,并提出相应的策略,旨在为有效提升办公效率以及使用水平提供参考。 展开更多
关键词 文档编辑 word 处理软件 使用水平
下载PDF
基于多模型加权组合的文本相似度计算模型 被引量:3
19
作者 刘栋 杨辉 +1 位作者 姬少培 曹扬 《计算机工程》 CAS CSCD 北大核心 2023年第10期97-104,共8页
针对传统文本相似度计算模型存在的未考虑语义及结构信息、容易忽略文本特征细节信息等问题,建立一种基于多模型加权组合的文本相似度计算模型。在考虑次序、主题、语义等内容的基础上,对句子的每个单词进行嵌入表示,利用最大池化操作和... 针对传统文本相似度计算模型存在的未考虑语义及结构信息、容易忽略文本特征细节信息等问题,建立一种基于多模型加权组合的文本相似度计算模型。在考虑次序、主题、语义等内容的基础上,对句子的每个单词进行嵌入表示,利用最大池化操作和Bi-GRU神经网络作为编码器生成关于句子的嵌入表示,通过多层次的比较来学习句子嵌入之间的相似性关系。对文本转换进行结构化表示,提取基于短语的浅层语法树结构化特征作为Tree-GRU的输入进行文本相似度计算。将上述2个计算结果进行加权处理,获取文本相似度的最终计算结果。实验结果表明:当权重参数C1和C2分别取值0.6和0.4时该模型具有最优的相似度计算结果;在STSB数据集上模型的精确率、召回率和F1值分别达到90.32%、90.89%和90.52%;在SICK数据集上精确率、召回率和F1值分别达到85.41%、85.95%和85.61%;在MRPC数据集上精确率、召回率和F1值分别达到90.32%、90.89%和90.52%。该模型可以充分利用文本的多层次内容信息及结构化信息,适用于处理复杂的长文本,相对于DT-TEAM、ECNU等模型能取得更好的文本相似度计算结果。 展开更多
关键词 文本特征 多词嵌入 多层次比较 浅层语法树 线性加权 文本相似度
下载PDF
基于N-gram模型的多层融合气象灾害预警文本检验方法 被引量:1
20
作者 兰海波 宋瑛瑛 +3 位作者 曹之玉 朱小祥 沈晨笛 王然 《武汉理工大学学报(信息与管理工程版)》 CAS 2023年第6期961-966,共6页
气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征... 气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征的多模式融合分词方法,进而建立了预警专业语料库;研发了以归一化N-gram检验模型为主,以字序列组合检验模型为辅的多级检验模型。该模型已在国家突发事件预警信息发布系统中应用,辅助提高了人工预警审核效率,获得了较好的应用效果。 展开更多
关键词 气象灾害预警文本 融合分词 多级检验模型 N-GRAM模型 多模式融合
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部