期刊文献+
共找到149篇文章
< 1 2 8 >
每页显示 20 50 100
A document-level model for tweet event detection
1
作者 秦彦霞 Zhang Yue +1 位作者 Zhang Min Zheng Dequan 《High Technology Letters》 EI CAS 2018年第2期208-218,共11页
Social media like Twitter who serves as a novel news medium and has become increasingly popular since its establishment. Large scale first-hand user-generated tweets motivate automatic event detection on Twitter. Prev... Social media like Twitter who serves as a novel news medium and has become increasingly popular since its establishment. Large scale first-hand user-generated tweets motivate automatic event detection on Twitter. Previous unsupervised approaches detected events by clustering words. These methods detect events using burstiness,which measures surging frequencies of words at certain time windows. However,event clusters represented by a set of individual words are difficult to understand. This issue is addressed by building a document-level event detection model that directly calculates the burstiness of tweets,leveraging distributed word representations for modeling semantic information,thereby avoiding sparsity. Results show that the document-level model not only offers event summaries that are directly human-readable,but also gives significantly improved accuracies compared to previous methods on unsupervised tweet event detection,which are based on words/segments. 展开更多
关键词 事件 鸣叫 模型 文件 流行音乐 模特儿 精确性 媒介
下载PDF
基于注意力机制语义增强的文档级关系抽取
2
作者 柳先辉 吴文达 +1 位作者 赵卫东 侯文龙 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第5期822-828,共7页
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间... 文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。 展开更多
关键词 文档级关系抽取 注意力机制 语义增强 焦点损失
下载PDF
基于多粒度阅读器和图注意力网络的文档级事件抽取
3
作者 薛颂东 李永豪 赵红燕 《计算机应用研究》 CSCD 北大核心 2024年第8期2329-2335,共7页
文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注... 文档级事件抽取面临论元分散和多事件两大挑战,已有工作大多采用逐句抽取候选论元的方式,难以建模跨句的上下文信息。为此,提出了一种基于多粒度阅读器和图注意网络的文档级事件抽取模型,采用多粒度阅读器实现多层次语义编码,通过图注意力网络捕获实体对之间的局部和全局关系,构建基于实体对相似度的剪枝完全图作为伪触发器,全面捕捉文档中的事件和论元。在公共数据集ChFinAnn和DuEE-Fin上进行了实验,结果表明提出的方法改善了论元分散问题,提升了模型事件抽取性能。 展开更多
关键词 多粒度阅读器 图注意力网络 文档级事件抽取
下载PDF
试析医养结合规范性文件的法理依据、效力及合法性要求
4
作者 李西霞 《山西师大学报(社会科学版)》 2024年第2期106-112,共7页
2013年国家提出医养结合新型养老模式,是应对人口老龄化的创新举措。中央和省级政府及其部门陆续出台一系列规范性文件,促进各地探索医养结合体制机制试点工作,并取得一定成效。然而,由于这些规范性文件效力位阶低,其创设的相关义务超... 2013年国家提出医养结合新型养老模式,是应对人口老龄化的创新举措。中央和省级政府及其部门陆续出台一系列规范性文件,促进各地探索医养结合体制机制试点工作,并取得一定成效。然而,由于这些规范性文件效力位阶低,其创设的相关义务超越所涉上位法规定,致使医养结合面临制度性障碍。对此,应加大力度推进医养结合法治建设,为医养结合发展提供法治保障。这也是我国全面依法治国战略对医养结合依法推进的必然要求。 展开更多
关键词 医养结合 规范性文件 效力 合法性 法治保障
下载PDF
融合目标端上下文的篇章神经机器翻译
5
作者 贾爱鑫 李军辉 +1 位作者 贡正仙 张民 《中文信息学报》 CSCD 北大核心 2024年第4期59-68,共10页
神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神... 神经机器翻译在句子级翻译任务上取得了令人瞩目的效果,但是句子级翻译的译文会存在一致性、指代等篇章问题,篇章翻译通过利用上下文信息来解决上述问题。不同于以往使用源端上下文建模的方法,该文提出了融合目标端上下文信息的篇章神经机器翻译。具体地,该文借助推敲网络的思想,对篇章源端进行二次翻译,第一次基于句子级翻译,第二次翻译参考了全篇的第一次翻译结果。基于LDC中英篇章数据集和WMT英德篇章数据集的实验结果表明,在引入较少的参数的条件下,该文方法能显著提高翻译性能。同时,随着第一次翻译(即句子级译文)质量的提升,所提方法也更有效。 展开更多
关键词 神经机器翻译 推敲网络 篇章翻译
下载PDF
文档级事件抽取反向推理模型
6
作者 纪婉婷 马宇航 +2 位作者 鲁闻一 王俊陆 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期122-129,共8页
事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件... 事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件抽取反向推理模型(reverse inference model for document-level event extraction,RIDEE)。基于无触发词的设计,将文档级事件抽取转化为候选事件要素抽取和事件触发推理两个子任务,并行式抽取事件要素并检测事件类型。此外,设计了一种用于存储历史事件的事件依赖池,使得模型在处理多事件文本时可以充分利用事件之间的依赖关系。公开数据集上的实验结果表明,与现有事件抽取模型相比,RIDEE在进行文档级事件抽取时具有更优的性能。 展开更多
关键词 文档级事件抽取 反向推理 无触发词 事件依赖池
下载PDF
神经机器翻译综述 被引量:2
7
作者 章钧津 田永红 +1 位作者 宋哲煜 郝宇峰 《计算机工程与应用》 CSCD 北大核心 2024年第4期57-74,共18页
机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器... 机器翻译主要研究如何将源语言翻译为目标语言,对于促进民族之间的交流具有重要意义。目前神经机器翻译凭借翻译速度和译文质量成为主流的机器翻译方法。为更好地进行脉络梳理,首先对机器翻译的历史和方法进行研究,并对基于规则的机器翻译、基于统计的机器翻译和基于深度学习的机器翻译三种方法进行对比总结;然后引出神经机器翻译,并对其常见的类型进行讲解;接着选取多模态机器翻译、非自回归机器翻译、篇章级机器翻译、多语言机器翻译、数据增强技术和预训练模型六个主要的神经机器翻译研究领域进行重点介绍;最后从低资源语言、上下文相关翻译、未登录词和大模型四个方面对神经机器翻译的未来进行了展望。通过系统性的介绍以更好地理解神经机器翻译的发展现状。 展开更多
关键词 机器翻译 神经机器翻译 篇章级机器翻译 数据增强 预处理技术
下载PDF
基于伪触发词的并行预测篇章级事件抽取方法
8
作者 秦海涛 线岩团 +1 位作者 相艳 黄于欣 《电子技术应用》 2024年第4期67-74,共8页
篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的... 篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件。针对以上问题提出一种多任务联合的并行预测事件抽取框架。首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能。最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%。 展开更多
关键词 篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
下载PDF
基于篇章图模型的中文事件时序关系识别
9
作者 李婧 徐昇 李培峰 《中文信息学报》 CSCD 北大核心 2024年第1期107-114,共8页
事件时序关系识别是信息抽取中一项十分重要且极具挑战性的任务。此前大部分工作都集中在句子级别上,忽略了篇章级别(同句、邻句和跨句)的事件时序关系识别。针对此问题,该文提出了一种基于篇章图模型的篇章级事件时序关系识别方法,该... 事件时序关系识别是信息抽取中一项十分重要且极具挑战性的任务。此前大部分工作都集中在句子级别上,忽略了篇章级别(同句、邻句和跨句)的事件时序关系识别。针对此问题,该文提出了一种基于篇章图模型的篇章级事件时序关系识别方法,该方法通过分别构造句法层次和篇章级别的图卷积神经网络将篇章中融合了句法特征的所有事件进行信息交互,以达到丰富特征的目的,进而使得模型可更好地识别篇章级时序关系。该文提出的方法在ACE2005-extended中文事件时序关系语料库上的微平均F1值达到71.81%,比最好的基准系统提升了1.76个百分点。 展开更多
关键词 事件时序关系 篇章级别 图卷积神经网络
下载PDF
基于证据图推理的文档级实体关系抽取
10
作者 张钰 王嘉 +1 位作者 袁建园 张益嘉 《情报杂志》 北大核心 2024年第7期122-130,共9页
[研究目的]为缓解文档级实体关系抽取任务中存在的句子噪声问题,提高文档级实体关系抽取性能,提出一种基于证据图推理的文档级实体关系抽取方法,为文档级实体关系抽取和知识发现研究提供参考。[研究方法]通过启发式规则捕获实体对间关... [研究目的]为缓解文档级实体关系抽取任务中存在的句子噪声问题,提高文档级实体关系抽取性能,提出一种基于证据图推理的文档级实体关系抽取方法,为文档级实体关系抽取和知识发现研究提供参考。[研究方法]通过启发式规则捕获实体对间关系推理所需证据句路径信息;引入图结构学习思想将证据句路径信息融入异构文档图;基于关系图卷积网络进行关系推理以提升文档图对证据句信息的聚合能力;采用前馈神经网络对实体关系进行预测,实现文档级实体关系高效抽取。[研究结论]所提出的模型在国际公开文档级评测数据集CDR和GDA上F1值分别达到71.3%和85.4%,较基准模型EIDER提高1.2%与1.1%。实验结果表明该方法能够有效选择实体关系推理所需证据路径,提升文档级实体关系抽取性能。 展开更多
关键词 文档级实体关系抽取 证据推理路径 图神经网络 启发式规则 知识发现
下载PDF
针对长距离实体的双图路径推理模型
11
作者 祝涛杰 卢记仓 +2 位作者 周刚 皮乾坤 丁肖摇 《信息工程大学学报》 2024年第3期272-277,共6页
文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好... 文档中句间实体关系往往无法直接获取,现有方法通常利用语法知识及共指、邻接、共现等方式将文档构建为文档图,捕获实体之间的交互。然而图节点和图边数量及类型较多,极大地限制了模型的推理能力。因此,提出一种结构简单且推理效果更好的双图模型。首先,采用启发式规则提取提及交互和证据句,并基于此构建基于证据句的提及图和实体图;其次,利用注意力机制捕获实体图中实体节点之间的推理路径;最后,根据推理路径,采用合适的评分函数预测实体关系事实。在文档级通用领域数据集DocRED中的实验表明,所提模型取得了较好的效果。 展开更多
关键词 文档级关系抽取 图神经网络 注意力机制
下载PDF
基于BERT和图注意力网络的篇章级事件论元识别
12
作者 王凯 廖涛 《现代计算机》 2024年第6期14-19,64,共7页
事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法... 事件论元识别是事件抽取的子任务之一,其目的在于识别文本中与事件相关的论元及论元对应的论元角色。研究表明,句子的依存句法关系有助于事件论元任务识别,然而,在构造篇章的依存句法关系时容易引入不相关的论元产生噪声问题,现有方法对噪声问题处理不佳。针对该问题,提出了一个基于BERT和图注意力网络的篇章级事件论元识别模型。该模型从两个角度去解决噪声问题,一方面,通过获取充分的篇章语义特征作为辅助,去构建更有效的篇章依存句法特征;另一方面,采用图注意力网络对不同的论元节点分配不同的权重,从而去除掉无效的论元。在RAMS语料库上的实验结果表明,该方法有效解决了篇章依存句法关系中存在的噪声问题,取得了较好的篇章级事件论元识别结果。 展开更多
关键词 篇章级事件论元识别 依存句法关系 BERT 图注意力网络
下载PDF
秦代县级行政文书传递用印规范——以里耶秦简为中心
13
作者 马浩辉 吴方基 《阴山学刊》 2024年第4期42-49,56,共9页
秦代县级行政文书传递用印规范分为一般情况和特殊情况两个方面。一般情况下的行政文书传递,使用令、丞印是主要方式,诸曹少吏用“迁陵印”传递其职权范围内的文书。特殊情况下的行政文书传递,“假官”用印遵循相应等级,使用本官印或小... 秦代县级行政文书传递用印规范分为一般情况和特殊情况两个方面。一般情况下的行政文书传递,使用令、丞印是主要方式,诸曹少吏用“迁陵印”传递其职权范围内的文书。特殊情况下的行政文书传递,“假官”用印遵循相应等级,使用本官印或小官印。使用私印的情况,是由于未建立完备的用印规范体系,受旧俗影响相关的规范也未被很好地实施。 展开更多
关键词 秦代 县级行政文书 文书传递 用印规范 里耶秦简
下载PDF
融合证据句子提取的文档级关系抽取
14
作者 安先跨 肖蓉 杨肖 《计算机科学》 CSCD 北大核心 2024年第S01期204-209,共6页
文档级关系抽取作为自然语言处理领域的一个关键任务,旨在从长文档中准确抽取实体对之间的语义关系。传统的文档级关系抽取方法通常将整个文档作为输入,但事实上,人类只需根据文档中的部分句子即可预测实体对的关系,即证据句子。在现有... 文档级关系抽取作为自然语言处理领域的一个关键任务,旨在从长文档中准确抽取实体对之间的语义关系。传统的文档级关系抽取方法通常将整个文档作为输入,但事实上,人类只需根据文档中的部分句子即可预测实体对的关系,即证据句子。在现有研究中,很多研究方法都利用了证据句子,但是都存在无法找全以及很难充分利用这些证据句子的优势等问题。针对该问题,引入更加高效且准确的证据句子选取方法,通过融合公式法和删句法的证据句子提取策略,并将证据提取与训练推理过程相融合,使得文档级关系抽取模型更加关注重要的句子,同时仍可以识别文档中的完整信息。实验表明,改进后的模型在公共数据集上的表现优于已有模型。 展开更多
关键词 文档级 关系抽取 证据句子 双线性层
下载PDF
文档级关系抽取中的小波变换特征增强方法
15
作者 杨肖 肖蓉 《中文信息学报》 CSCD 北大核心 2024年第2期109-120,131,共13页
传统的文档级关系抽取方法在特征表示的有效性和噪声消除方面存在局限,不能准确地找出证据句子和实体对的关系。为了进一步提升文档级关系抽取和证据句子抽取的准确性,该文提出了一种使用小波变换对预训练语言模型生成的文本向量进行特... 传统的文档级关系抽取方法在特征表示的有效性和噪声消除方面存在局限,不能准确地找出证据句子和实体对的关系。为了进一步提升文档级关系抽取和证据句子抽取的准确性,该文提出了一种使用小波变换对预训练语言模型生成的文本向量进行特征提取、清洗和去噪处理的方法。首先利用预训练语言模型对文档进行编码,将得到的初始文本向量应用小波变换出更精确的特征,其次引入多头注意力机制对小波变换的数据进行加权处理,以凸显与实体对关系相关的重要特征。为了充分利用原始数据和清洗后的数据,采用残差连接的方式将它们进行融合。在DocRED数据集上对模型进行了实验,结果表明,该文所提模型能够更好地抽取实体对的关系。 展开更多
关键词 文档级关系抽取 小波变换 多头注意力机制
下载PDF
基于对比图学习的跨文档虚假信息检测
16
作者 廖劲智 赵和伟 +3 位作者 连小童 纪文亮 石海明 赵翔 《计算机科学》 CSCD 北大核心 2024年第3期14-19,共6页
当前,网络上充斥着大量虚假信息,严重阻碍了社会各行业的正常运转,如何精准检测虚假信息成为了亟待解决的问题。现有研究主要从账户特征、文本内容和多模态3个角度开展工作,但大多忽视了虚假信息赖以传播的关键特征(即内容新奇性),仅是... 当前,网络上充斥着大量虚假信息,严重阻碍了社会各行业的正常运转,如何精准检测虚假信息成为了亟待解决的问题。现有研究主要从账户特征、文本内容和多模态3个角度开展工作,但大多忽视了虚假信息赖以传播的关键特征(即内容新奇性),仅是孤立地分析判别目标信息的真实性,未能把握舆论环境的特征。因此,提出了一种基于对比图学习的跨文档虚假信息检测方法(Contrastive Graph Learning,CAL),聚焦于内容新奇性,主要包含两个关键模块:对比学习模块和异构图模块。前者致力于扩大客观事实与虚假信息在向量空间中的表示差异性;后者包含实体、事件、事件集、句子和文档5种类型实体,尽可能向实体表示中注入舆论环境的语义特征。最后,在IED,TL17和Crisis这3个数据集上,在文档级和事件级这两个层次上开展了相关实验,CAL在所有测试中均取得了最优的结果,验证了所提方法的有效性。 展开更多
关键词 跨文档虚假信息检测 对比学习 异构图 事件级检测
下载PDF
面向新冠新闻的三阶段篇章级事件抽取方法 被引量:1
17
作者 郭鑫 高彩翔 +2 位作者 陈千 王素格 王雪婧 《计算机工程与应用》 CSCD 北大核心 2023年第3期150-157,共8页
事件抽取是信息抽取领域的一个研究热点。在新冠肺炎疫情常态化下,利用事件抽取技术可以筛选出有价值的信息。然而事件抽取领域缺乏精标注的新冠新闻训练数据集,且因部分事件的复杂性,论元不只存在于一句话中,需要多个句子才能完整描述... 事件抽取是信息抽取领域的一个研究热点。在新冠肺炎疫情常态化下,利用事件抽取技术可以筛选出有价值的信息。然而事件抽取领域缺乏精标注的新冠新闻训练数据集,且因部分事件的复杂性,论元不只存在于一句话中,需要多个句子才能完整描述一个事件。因此,首先构建新冠肺炎新闻数据集,接着提出一种三阶段的管道方法实现从篇章中抽取新冠肺炎事件。该方法对数据集进行事件类型分类;进行事件句的抽取;实现篇章级论元抽取。实验结果表明提出的方法能够减少事件分类时间,抽取两个事件句的条件下,对数据通报类论元识别效果最好,准确率、召回率和F1值达到75.0%、73.0%,和74.0%,证明方法能有效抽取新冠肺炎相关篇章级事件。 展开更多
关键词 新冠肺炎 信息抽取 事件句抽取 篇章级事件抽取
下载PDF
基于句间信息的图注意力卷积网络的文档级关系抽取
18
作者 段建勇 杨潇 +2 位作者 王昊 何丽 李欣 《计算机科学》 CSCD 北大核心 2023年第S01期181-186,共6页
为解决现有模型对文档的结构信息挖掘不足的问题,提出一种基于句间信息的图注意力卷积网络模型。该模型改进了一种文档级编码器,该编码器使用了一种新的注意力机制--句间注意力机制,使得句子的最终表示更加关注前一个句子和之前文档中... 为解决现有模型对文档的结构信息挖掘不足的问题,提出一种基于句间信息的图注意力卷积网络模型。该模型改进了一种文档级编码器,该编码器使用了一种新的注意力机制--句间注意力机制,使得句子的最终表示更加关注前一个句子和之前文档中的重要信息,更有利于挖掘文档的结构信息。实验结果表明,所提模型在DocRED数据集上的F 1评价指标达到56.3%,性能优于基线模型。在融入句间注意力机制时,由于模型需要对每一句话分别进行句间注意力操作,因此训练模型时需要消耗更多的内存和时间。基于句间信息的图注意力卷积网络模型可以有效地对文档中的相关信息进行聚合,并且增强对文档的结构信息的挖掘能力,从而使得模型在文档级关系抽取任务中效果得到提升。 展开更多
关键词 文档级关系抽取 注意力机制 文档级编码器 图卷积网络
下载PDF
基于多粒度用户偏好的文档级情感分析
19
作者 陈洁 王思雨 +2 位作者 赵姝 张燕平 余静莹 《中文信息学报》 CSCD 北大核心 2023年第7期122-130,共9页
不同的用户通常具有多粒度的用户偏好,即用不同的用词习惯来表达情感(单词级用户偏好);在不同的句子上表达出不同的情感强度(句子级用户偏好);用不同的评分特征对产品进行评价(文档级用户偏好)。现有情感模型在文本特征表示时并未考虑... 不同的用户通常具有多粒度的用户偏好,即用不同的用词习惯来表达情感(单词级用户偏好);在不同的句子上表达出不同的情感强度(句子级用户偏好);用不同的评分特征对产品进行评价(文档级用户偏好)。现有情感模型在文本特征表示时并未考虑用户偏好的多粒度性,据此,该文提出了一种融合多粒度用户偏好的情感分析模型。首先,在单词粒度上,将用户信息融合到注意机制中来获取基于用户偏好的句子表示;然后,在句子粒度上,结合自注意机制获取基于用户偏好的文档表示;最后,在文档粒度上,将得到的文档表示与用户信息直接进行融合得到文档的特征表示,并利用该表示进行分类。在IMDB、Yelp13、Yelp14三个文档级数据集上的实验表明,该模型能更有效地提升分类性能。 展开更多
关键词 情感分类 文档级评论 用户偏好 多粒度注意网络
下载PDF
融入篇章信息的文学作品命名实体识别
20
作者 贾玉祥 晁睿 +3 位作者 昝红英 窦华溢 曹帅 徐硕 《中文信息学报》 CSCD 北大核心 2023年第11期100-109,共10页
命名实体识别是文学作品智能分析的基础性工作,当前文学领域命名实体识别的研究还较薄弱,一个主要原因是缺乏标注语料。该文从金庸小说入手,对两部小说180余万字进行了命名实体的标注,共标注4类实体,共计5万多个。针对小说文本的特点,... 命名实体识别是文学作品智能分析的基础性工作,当前文学领域命名实体识别的研究还较薄弱,一个主要原因是缺乏标注语料。该文从金庸小说入手,对两部小说180余万字进行了命名实体的标注,共标注4类实体,共计5万多个。针对小说文本的特点,该文提出融入篇章信息的命名实体识别模型,引入篇章字典保存汉字的历史状态,利用可信度计算融合BiGRU-CRF与Transformer模型。实验结果表明,利用篇章信息有效提升了命名实体识别的效果。最后,该文还探讨了命名实体识别在小说社会网络构建中的应用。 展开更多
关键词 文学作品 命名实体识别 篇章信息
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部