期刊文献+
共找到273篇文章
< 1 2 14 >
每页显示 20 50 100
Graph-Based Chinese Word Sense Disambiguation with Multi-Knowledge Integration 被引量:1
1
作者 Wenpeng Lu Fanqing Meng +4 位作者 Shoujin Wang Guoqiang Zhang Xu Zhang Antai Ouyang Xiaodong Zhang 《Computers, Materials & Continua》 SCIE EI 2019年第7期197-212,共16页
Word sense disambiguation(WSD)is a fundamental but significant task in natural language processing,which directly affects the performance of upper applications.However,WSD is very challenging due to the problem of kno... Word sense disambiguation(WSD)is a fundamental but significant task in natural language processing,which directly affects the performance of upper applications.However,WSD is very challenging due to the problem of knowledge bottleneck,i.e.,it is hard to acquire abundant disambiguation knowledge,especially in Chinese.To solve this problem,this paper proposes a graph-based Chinese WSD method with multi-knowledge integration.Particularly,a graph model combining various Chinese and English knowledge resources by word sense mapping is designed.Firstly,the content words in a Chinese ambiguous sentence are extracted and mapped to English words with BabelNet.Then,English word similarity is computed based on English word embeddings and knowledge base.Chinese word similarity is evaluated with Chinese word embedding and HowNet,respectively.The weights of the three kinds of word similarity are optimized with simulated annealing algorithm so as to obtain their overall similarities,which are utilized to construct a disambiguation graph.The graph scoring algorithm evaluates the importance of each word sense node and judge the right senses of the ambiguous words.Extensive experimental results on SemEval dataset show that our proposed WSD method significantly outperforms the baselines. 展开更多
关键词 word sense disambiguation graph model multi-knowledge integration word similarity
下载PDF
Word-Representability of Line Graphs
2
作者 Sergey Kitaev Pavel Salimov +1 位作者 Christopher Severs Henning Ulfarsson 《Open Journal of Discrete Mathematics》 2011年第2期96-101,共6页
A graph G=(V,E) is representable if there exists a word W over the alphabet V such that letters x and y alternate in W if and only if (x ,y) is in E for each x not equal to y . The motivation to study representable gr... A graph G=(V,E) is representable if there exists a word W over the alphabet V such that letters x and y alternate in W if and only if (x ,y) is in E for each x not equal to y . The motivation to study representable graphs came from algebra, but this subject is interesting from graph theoretical, computer science, and combinatorics on words points of view. In this paper, we prove that for n greater than 3, the line graph of an n-wheel is non-representable. This not only provides a new construction of non-repre- sentable graphs, but also answers an open question on representability of the line graph of the 5-wheel, the minimal non-representable graph. Moreover, we show that for n greater than 4, the line graph of the complete graph is also non-representable. We then use these facts to prove that given a graph G which is not a cycle, a path or a claw graph, the graph obtained by taking the line graph of G k-times is guaranteed to be non-representable for k greater than 3. 展开更多
关键词 Line graph REPRESENTABILITY by wordS WHEEL COMPLETE graph
下载PDF
Using Luhn’s Automatic Abstract Method to Create Graphs of Words for Document Visualization
3
作者 Luiz Cláudio Santos Silva Renelson Ribeiro Sampaio 《Social Networking》 2014年第2期65-70,共6页
Visualization methods for single documents are either too simple, considering word frequency only, or depend on syntactic and semantic information bases to be more useful. This paper presents an intermediary approach,... Visualization methods for single documents are either too simple, considering word frequency only, or depend on syntactic and semantic information bases to be more useful. This paper presents an intermediary approach, based on H. P. Luhn’s automatic abstract creation algorithm, and intends to aggregate more information to document visualization than word counting methods do without the need of external sources. The method takes pairs of relevant words and computes the linkage force between them. Relevant words become vertices and links become edges in the resulting graph. 展开更多
关键词 TEXT VISUALIZATION graph of wordS
下载PDF
Evolution of Word-updating Dynamical Systems (WDS) on Directed Graphs
4
作者 郑洁 《Journal of Donghua University(English Edition)》 EI CAS 2009年第2期132-134,共3页
This paper continues the research on theoretical foundations for computer simulation.We introduce the concept of word-updating dynamical systems(WDS)on directed graphs,which is a kind of generalization of sequential d... This paper continues the research on theoretical foundations for computer simulation.We introduce the concept of word-updating dynamical systems(WDS)on directed graphs,which is a kind of generalization of sequential dynamical systems(SDS)on graphs.Some properties on WDS,especially some results on NOR-WDS,which are different from that on NOR-SDS,are obtained. 展开更多
关键词 动力系统 有向图 word 十二烷基硫酸钠 演化 计算机仿真 数据服务 NOR
下载PDF
基于语序知识的双通道图卷积网络方面级情感分析
5
作者 黄俊 刘洋 +3 位作者 王庆凤 陈立伟 邱家林 黎茂锋 《计算机应用研究》 CSCD 北大核心 2024年第3期779-785,共7页
当前大多数基于图卷积网络的方面级情感分析方法利用文本的句法知识、语义知识、情感知识构建文本依赖,但少有研究利用文本语序知识构建文本依赖,导致图卷积网络不能有效地利用文本语序知识引导方面项学习上下文情感信息,从而限制了其... 当前大多数基于图卷积网络的方面级情感分析方法利用文本的句法知识、语义知识、情感知识构建文本依赖,但少有研究利用文本语序知识构建文本依赖,导致图卷积网络不能有效地利用文本语序知识引导方面项学习上下文情感信息,从而限制了其性能。针对上述问题,提出基于语序知识的双通道图卷积网络(dual-channel graph convolutional network with word-order knowledge,WKDGCN)模型,该模型由语序图卷积网络(word-order graph convolutional network,WoGCN)和情感知识结合语义知识增强的句法图卷积网络(sentiment and attention-enhanced graph convolutional network,SAGCN)组成。具体地,WoGCN基于文本的语序知识构建图卷积网络,由文本的语序依赖引导方面项特征学习上下文情感信息;SAGCN利用SenticNet中的情感知识结合注意力机制增强句法依赖,利用增强后的句法依赖构建图卷积网络,以此引导方面项特征学习上下文情感信息;最后融合两个图卷积网络的特征用于情感分类。此外,设计了一种权重分配策略,在放大方面项权重的同时保持上下文权重一致,避免错误的计算方面项特征与重要特征的语义相关性。在多个公开数据集上的实验结果表明,所提方法优于对比模型。 展开更多
关键词 方面级情感分析 语序知识 情感信息 注意力机制 句法依赖 图卷积神经网络
下载PDF
融合词法句法信息的方面级情感分析模型
6
作者 衡红军 杨鼎诚 《计算机工程与设计》 北大核心 2024年第3期837-844,共8页
为解决现有方面级情感分析方法缺乏句法约束和词义信息的问题,将句法依存树和知识图谱融合起来对句子编码,提出一种词法句法相结合的图神经网络模型。利用图神经网络分别提取句法依存树中的句法信息和知识图谱中的词法信息,经过位置编... 为解决现有方面级情感分析方法缺乏句法约束和词义信息的问题,将句法依存树和知识图谱融合起来对句子编码,提出一种词法句法相结合的图神经网络模型。利用图神经网络分别提取句法依存树中的句法信息和知识图谱中的词法信息,经过位置编码模块和掩码加权模块捕捉重要性更高的单词;将两种特征进行结合获得融合句法词法信息的文本表示,进行情感分类。在3个公开数据集上的实验结果验证了该模型的有效性。 展开更多
关键词 方面级情感分析 句法约束 词义信息 句法依存树 知识图谱 关系图注意力网络 图卷积网络
下载PDF
基于细粒度知识图谱的科技文献主题发现与热点分析
7
作者 刘成山 杜怡然 汪圳 《情报理论与实践》 北大核心 2024年第5期131-138,共8页
[目的/意义]利用知识图谱进行细粒度的知识组织并识别科技文献的热点主题,有助于科研工作者把握领域的研究现状和学科前沿,进而为科研资源优化配置提供有力支持。[方法/过程]提出一套基于知识图谱的主题发现和热点分析方法。首先,识别... [目的/意义]利用知识图谱进行细粒度的知识组织并识别科技文献的热点主题,有助于科研工作者把握领域的研究现状和学科前沿,进而为科研资源优化配置提供有力支持。[方法/过程]提出一套基于知识图谱的主题发现和热点分析方法。首先,识别科技文献中的知识元,再抽取知识元中的语义实体进行主题发现;其次,构建“文献—知识元—主题”知识图谱,通过知识图谱中的共现关系网络识别领域的研究热点;最后,以农学领域的中文学术论文为实验数据,进行实证研究。[结果/结论]所构建的细粒度知识图谱不仅能够揭示科学知识与主题的潜在关联,而且能够实现科技文献主题的热点分析。 展开更多
关键词 知识图谱 知识元 细粒度 主题发现 共词分析
下载PDF
基于卷积神经网络的医疗护理实体关系抽取
8
作者 曹茂俊 胡喆 《电子设计工程》 2024年第8期18-22,共5页
针对医疗护理领域知识复杂性强、数据量大以及对准确度要求较高的问题,该研究提出一种基于卷积神经网络的医疗护理学实体关系抽取方法,实现对护理学语义关系的细粒度文本挖掘。该研究构建了医疗护理学语料标注系统,通过将医疗语料转化... 针对医疗护理领域知识复杂性强、数据量大以及对准确度要求较高的问题,该研究提出一种基于卷积神经网络的医疗护理学实体关系抽取方法,实现对护理学语义关系的细粒度文本挖掘。该研究构建了医疗护理学语料标注系统,通过将医疗语料转化为向量特征矩阵,实现了对医疗语料的自动过滤和标注。通过向神经网络模型嵌入所构建的医疗关系语料库,一定程度上提高了模型疾病分类的准确度。在医疗护理学数据集上的实验表明,基于卷积神经网络的模型在指标精确度、召回率、F1值可达到89.78%、87.59%、89.77%。综上所述,该研究提出的基于卷积神经网络的医疗护理学实体关系抽取方法能够有效地抽取医疗语料数据中的实体关系,优于传统的实体关系抽取模型。 展开更多
关键词 实体关系抽取 卷积神经网络 医疗护理学 词向量 知识图谱
下载PDF
基于知识图谱分析的学习空间研究回溯与趋势探究
9
作者 李高祥 邹小芳 陶泽发 《贵州师范学院学报》 2024年第4期34-45,共12页
以2013—2023年CNKI收录的433篇“学习空间”为主题的CSSCI期刊文献为研究对象,通过共词分析和社会网络分析,绘制学习空间研究热点知识图谱。分析发现:学习空间研究热点主要涵盖学习空间建设研究、学习空间与教育变革相关理论研究、网... 以2013—2023年CNKI收录的433篇“学习空间”为主题的CSSCI期刊文献为研究对象,通过共词分析和社会网络分析,绘制学习空间研究热点知识图谱。分析发现:学习空间研究热点主要涵盖学习空间建设研究、学习空间与教育变革相关理论研究、网络学习空间研究、信息技术赋能学习空间发展研究等七大领域。其中,学习空间与课堂教学转型研究、智慧学习空间研究、学习空间与教学变革研究,具有进一步发展的空间和潜在的研究重要性;研究经历了起步、快速发展、发展回落三个阶段,学习空间样态呈现出信息化、网络化、智能化和数字化等特征变化。未来学习空间研究需建立新的思维观、设计观、应用观和伦理观,应以学习者为中心,融合多元技术,并注重各领域的深度和联系,加强跨学科实证研究。 展开更多
关键词 学习空间 共词分析 社会网络分析 知识图谱
下载PDF
融合双图卷积与门控线性单元的方面级情感分析模型
10
作者 杨春霞 吴亚雷 +1 位作者 闫晗 黄昱锟 《计算机工程》 CAS CSCD 北大核心 2024年第4期141-149,共9页
方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融... 方面级情感分析旨在确定句子中给定方面的情感极性。现有的基于图神经网络的方面级情感分析存在以下2个方面的不足:忽略了不同类型的句法依存关系和语料库中的词共现信息,以及不能准确地控制情感信息流向给定方面。针对以上问题,提出融合双图卷积与门控线性单元(GLU)的方面级情感分析模型。该模型首先采用全局词汇图来编码语料库中的词共现信息,在词汇图和句法图上利用分类概括结构来区分各种词共现频率和不同类型的句法依存关系。然后分别在2个图上进行双层卷积,继而使用Bi Affine变换模块作为桥梁,在2个图卷积网络模块之间有效地交换相关特征,从而有效地融合句法信息和词汇信息。最后利用GLU控制情感信息流向给定方面,使模型可以更专注地分析与该方面相关的情感信息,避免不相关的情感信息影响对给定方面的情感分析结果,从而提高分析的准确性。实验结果表明,在Twitter、Laptop14、Restaurant15和Restaurant16数据集上,该模型的准确率分别达到74.82%、77.61%、82.29%和89.81%,F1值分别达到72.97%、73.52%、67.72%和73.37%,方面级情感分类效果明显优于其他基线模型。 展开更多
关键词 方面级情感分析 词共现信息 双图卷积 信息交互 门控线性单元
下载PDF
基于煤矿井下不安全行为知识图谱构建方法
11
作者 付燕 刘致豪 叶鸥 《工矿自动化》 CSCD 北大核心 2024年第1期88-95,共8页
虽然知识图谱已广泛应用于各个领域,但在煤矿安全方面,尤其在煤矿井下不安全行为方面的研究较少。构建了一种自底向上的煤矿井下不安全行为知识图谱。首先,采用传统机器学习和深度学习算法相结合的方法进行命名实体识别,采用RoBERTa进... 虽然知识图谱已广泛应用于各个领域,但在煤矿安全方面,尤其在煤矿井下不安全行为方面的研究较少。构建了一种自底向上的煤矿井下不安全行为知识图谱。首先,采用传统机器学习和深度学习算法相结合的方法进行命名实体识别,采用RoBERTa进行词语向量化,采用双向长短时记忆网络(BiLSTM)对向量进行标注,提高网络模型对上下文特征的捕捉能力,通过多层感知机(MLP)解决煤矿井下不安全行为数据集数据量不足的问题,采用条件随机场(CRF)模型解决前面存在的单词关系不识别问题,并捕获全文信息和预测结果。其次,根据语句的结构特点,设计了基于知识“实体-关系-实体”三元组的依存句法树结构,对井下不安全行为领域的知识资源进行知识抽取与表示。最后,构建面向井下不安全行为的知识图谱。实验结果表明:(1) RoBERTaBiLSTM-MLP-CRF模型对于导致结果、违反性行为、错误性行为及粗心性行为4类实体类别具有较好的识别效果,其准确率分别为86.7%,80.3%,80.7%,77.4%。(2)在相同的数据集下,RoBERTa-BiLSTM-MLP-CRF模型训练的准确率、召回率、F1值较RoBERTa-BiLSTM-CRF模型分别提高了1.6%,1.5%,1.6%。 展开更多
关键词 井下不安全行为 知识图谱 依存句法 命名实体识别 知识三元组 知识融合 知识存储 词语向量化
下载PDF
基于CiteSpace的河洛文化研究态势分析
12
作者 郭瑞青 《洛阳理工学院学报(社会科学版)》 2024年第2期6-9,共4页
河洛文化是中华民族的根文化和中国传统文化的源头。研究解读河洛文化,对于建设新时代中华民族精神家园,实现中华民族伟大复兴意义重大。基于SiteSpace科学文献计量知识图谱研究方法,以1984~2023年间中国知网收录的757篇河洛文化论文为... 河洛文化是中华民族的根文化和中国传统文化的源头。研究解读河洛文化,对于建设新时代中华民族精神家园,实现中华民族伟大复兴意义重大。基于SiteSpace科学文献计量知识图谱研究方法,以1984~2023年间中国知网收录的757篇河洛文化论文为研究对象,从“发文时间分布”“关键词共现”“关键词聚类”“关键词突显”4个方面,探究其发展历程与现状。目前,河洛文化研究虽然取得了一系列丰硕成果,但仍有需要深入拓展的学术领域。 展开更多
关键词 河洛文化 CiteSpace知识图谱分析 关键词共现 关键词聚类 关键词突显
下载PDF
高斯混合模型与文本图卷积网络结合的虚假评论识别算法
13
作者 王星 刘贵娟 陈志豪 《计算机应用》 CSCD 北大核心 2024年第2期360-368,共9页
针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评... 针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评论在训练数据上相对正常评论数不足的边信号强度;然后,考虑到信源的多样性,综合文档、词汇和评论以及非文本特征构造邻接矩阵;最后,通过Text GCN的谱分解提取邻接矩阵的虚假评论关联结构实施预测。根据国内某大型电商平台采集的126086条实际中文评论数据开展实证研究,实验结果表明,F-Text GCN识别虚假评论的F1值达到82.92%,与预训练表征模型BERT和文本卷积神经网络相比分别提升了10.46%和11.60%,相较于只使用评论文本信源的Text GCN模型F1值提升了2.94%;研究了高仿虚假评论的预测错误率,在支持向量机(SVM)作用后难识别的评论样本上尝试二次识别,F-Text GCN整体预测准确率可达94.71%,相较于Text GCN和SVM,在识别准确率上分别提升了2.91%和14.54%。研究发现,虚假评论的二阶图邻居结构显示出较强的干预消费者决策的词汇,这表明所提算法特别适用于提取用于虚假评论检测的长程词语搭配结构和全局句子特征模式变化的场景。 展开更多
关键词 高斯混合模型 虚假评论识别 文本图卷积神经网络 邻接矩阵 词汇共现网络
下载PDF
融合词信息和图注意力的医学命名实体识别
14
作者 赵珍珍 董彦如 +2 位作者 刘静 张俊忠 曹慧 《计算机工程与应用》 CSCD 北大核心 2024年第11期147-155,共9页
中文临床自然语言中富含大量的病历信息,对电子病历进行命名实体识别有助于建立医学辅助诊断系统,对医学领域的发展具有重要的意义,同时有利于下游任务如关系提取、建立知识图谱的实现。但中文电子病历存在中文分词困难、医学专业术语... 中文临床自然语言中富含大量的病历信息,对电子病历进行命名实体识别有助于建立医学辅助诊断系统,对医学领域的发展具有重要的意义,同时有利于下游任务如关系提取、建立知识图谱的实现。但中文电子病历存在中文分词困难、医学专业术语多、含有特殊表达方式的问题,易造成文本特征表达错误,于是提出基于增强词信息和图注意力的医学命名实体识别研究模型,通过增强局部特征和全局特征提高网络模型的性能。由于嵌入单一的字向量进行中文实体识别易忽略文本中词信息及语义,为此在字向量中嵌入与其高度关联的词向量,既增强文本表示,又避免分词错误的问题,并且在嵌入层中嵌入了学习医疗知识的MedBert模型,该模型能根据不同语境动态生成特征向量,有助于解决电子病历中一词多义及专业词汇的问题。同时,在编码层中添加图注意力模块增强模型学习文本上下文关系的能力和对医疗特殊语法的学习。在cEHRNER和cMedQANER数据集的实验上分别获得了86.38%和84.76%的F1值,与其他模型相比有较好的鲁棒性。 展开更多
关键词 图注意力 匹配词 命名实体识别 Bert模型
下载PDF
融合行为词的罪名预测多任务学习模型
15
作者 郭晓 陈艳平 +2 位作者 唐瑞雪 黄瑞章 秦永彬 《计算机应用》 CSCD 北大核心 2024年第1期159-166,共8页
随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题... 随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题,提出一种融合行为词的罪名预测多任务学习模型。首先,由边界识别器生成行为词跨度,提炼出案情核心内容;其次,通过构建行为词的结构特征预测所属罪名;最后,将行为词识别和罪名预测进行统一建模,通过共享参数的方式增强模型的泛化能力。通过构建行为词识别和罪名预测的多任务数据集进行验证,实验结果表明该模型识别行为词任务的F值达到了83.27%,罪名预测任务的F值达到了84.29%,与BERT-CNN模型相比,分别提高了0.57%和2.61%,验证了该模型对行为词识别和罪名预测的优势。 展开更多
关键词 罪名预测 行为词 边界识别 图卷积神经网络 多任务学习
下载PDF
利用Word 2000绘制科技书刊插图的实用方法 被引量:5
16
作者 李文清 杨玉东 《编辑学报》 CSSCI 北大核心 2003年第4期276-278,共3页
探讨利用Word 2000绘制科技书刊插图的方法,介绍绘图快捷键的作用及专业图形对象模板的创建方法,全面系统地总结使用Word 2000绘制科技书刊插图的方法与技巧。结果表明,该实用方法对提高编辑的绘图操作技能、美化版面设计具有较强的实... 探讨利用Word 2000绘制科技书刊插图的方法,介绍绘图快捷键的作用及专业图形对象模板的创建方法,全面系统地总结使用Word 2000绘制科技书刊插图的方法与技巧。结果表明,该实用方法对提高编辑的绘图操作技能、美化版面设计具有较强的实践性和指导性。 展开更多
关键词 word2000 科技书刊 版面设计 插图绘制 快捷键 图形对象 定位 模板
下载PDF
基于表示学习的告警数据流压缩算法
17
作者 阴振生 陈佳 +1 位作者 王鹏 汪卫 《计算机应用与软件》 北大核心 2024年第7期34-41,共8页
大型在线服务系统的告警数量巨大且关联关系复杂,运维人员进行故障诊断的难度较大。为此,提出一种基于表示学习的告警数据流压缩算法。该算法包含离线学习和在线压缩阶段:离线学习阶段,采用嵌入技术对告警内容的语义信息及服务组件的拓... 大型在线服务系统的告警数量巨大且关联关系复杂,运维人员进行故障诊断的难度较大。为此,提出一种基于表示学习的告警数据流压缩算法。该算法包含离线学习和在线压缩阶段:离线学习阶段,采用嵌入技术对告警内容的语义信息及服务组件的拓扑信息进行表示学习;在线压缩阶段,采用流式聚类方法对表示学习得到的告警向量进行聚合并生成告警事件。在合成数据集与真实数据集上的实验表明,该算法的各项评价指标均优于已有算法,更能满足告警数据流压缩的实时性和有效性要求。 展开更多
关键词 在线服务系统 告警数据流压缩 表示学习 词嵌入 图嵌入 流式聚类
下载PDF
一种Spark GraphX框架下的关键词抽取方法 被引量:3
18
作者 程传鹏 《小型微型计算机系统》 CSCD 北大核心 2019年第2期328-331,共4页
TextRank算法根据文本词语的位置关系构造图,应用图排序的算法计算出词语的权重,在计算过程中需要进行大量的迭代运算,在数据规模较大的时候,计算时间尤为可观.针对此问题,提出了一种基于Spark GraphX的关键词抽取方法,利用Spark GarpX... TextRank算法根据文本词语的位置关系构造图,应用图排序的算法计算出词语的权重,在计算过程中需要进行大量的迭代运算,在数据规模较大的时候,计算时间尤为可观.针对此问题,提出了一种基于Spark GraphX的关键词抽取方法,利用Spark GarpX所提供的分布式计算的图框架,将文本图数据分布式存储在不同的节点上,高效地实现了文本关键词的抽取.实验表明,本文中提出的基于Spark GraphX的关键词抽取方法,不仅计算时间短,抽取的关键词与人工标注的结果非常接近,具有一定的合理性. 展开更多
关键词 SPARK graphX 关键词提取 图排序 词语权重
下载PDF
基于要素关联图的汉越跨语言事件检索方法
19
作者 赵周颖 余正涛 +2 位作者 黄于欣 陈瑞清 朱恩昌 《现代电子技术》 北大核心 2024年第7期127-132,共6页
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪... 汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪声文本,现有的模型不能很好地捕获事件匹配特征,匹配效果欠佳。基于此,文中提出基于要素关联图的汉越跨语言事件检索方法。首先,预训练一个汉越双语词嵌入来解决跨语言问题;然后,抽取查询文档中的关键信息(关键词和实体)以构建要素关联图;最后,通过引入一个图编码器对构建的要素图进行编码,生成结构化的事件信息来增强传统的事件检索模型。实验结果表明文中提出的方法优于传统的基线方法。 展开更多
关键词 跨语言事件检索 跨语言词嵌入 要素关联图 图神经网络 文本匹配 事件检索
下载PDF
基于句信息增强词信息的方面级情感分类
20
作者 李怡霖 孙成胜 +1 位作者 罗林 琚生根 《计算机科学》 CSCD 北大核心 2024年第6期299-308,共10页
方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合... 方面级情感分类属于细粒度的情感分类,旨在判断句子中指定方面词的情感极性。近年来,句法知识在方面级情感分类任务中得到了广泛应用。目前主流的模型利用句法依存树和图卷积神经网络进行情感极性的分类。然而,此类模型着眼于利用聚合后的方面词信息来判断情感极性,很少关注句子的全局信息对情感极性的影响,从而导致情感极性分类结果出现偏差。为了解决这一问题,提出了一种基于句信息增强词信息的方面级情感分类模型,该模型通过对比学习对句向量进行表示学习,以减小句向量对比损失为目标调整词向量的特征表示,最后通过图卷积神经网络聚合意见词信息得出情感分类结果。在SemEval2014数据集和Twitter数据集上进行实验,结果表明,所提模型可以提高分类的准确性,综合验证了该方法的有效性。 展开更多
关键词 方面级情感分类 句信息 词信息 对比学习 图卷积神经网络
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部