期刊文献+
共找到69,995篇文章
< 1 2 250 >
每页显示 20 50 100
基于专利实体语义表示的技术主题演化路径识别
1
作者 张金柱 张毅 《情报杂志》 CSSCI 北大核心 2024年第11期117-128,共12页
[研究目的]从专利实体抽取和语义表示角度,识别语义相同但表达方式不同的专利实体,更准确地发现技术主题演化路径,更好地辅助科技创新和管理决策。[研究方法]提出一种基于专利实体语义表示的技术主题演化路径识别方法。首先,构建BERT-Bi... [研究目的]从专利实体抽取和语义表示角度,识别语义相同但表达方式不同的专利实体,更准确地发现技术主题演化路径,更好地辅助科技创新和管理决策。[研究方法]提出一种基于专利实体语义表示的技术主题演化路径识别方法。首先,构建BERT-BiLSTM-CRF模型自动抽取专利实体,利用表示学习方法研究专利实体的语义向量表示。其次,基于K-means算法对实体向量进行聚类,识别技术主题。最后,基于实体语义相似度,识别语义相同但表达不同的专利实体,进而基于相同实体数量设计知识流入和知识流出指标,根据主题之间的知识流入和流出比例共同识别分裂、发展、融合等演化关系,构建技术主题演化路径。[研究结论]实证研究表明,该方法能有效识别语义相同但表达不同的专利实体,进而更加准确地识别主题间演化关系,构建技术主题演化路径。 展开更多
关键词 专利实体 实体抽取 实体语义表示 BERT-BiLSTM-CRF模型 主题演化
下载PDF
基于连续提示注入与指针网络的农业病害命名实体识别
2
作者 王春山 张宸硕 +3 位作者 吴华瑞 朱华吉 缪祎晟 张立杰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第6期254-261,共8页
针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comp... 针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2933条文本语料,8个实体类型,共10414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。 展开更多
关键词 农业病害 命名实体识别 连续提示 指针网络 嵌套实体 预训练语言模型
下载PDF
基于深度字词融合的小麦种质信息实体关系联合抽取
3
作者 刘合兵 贾笑笑 +3 位作者 时雷 熊蜀峰 马新明 席磊 《计算机工程与设计》 北大核心 2024年第4期1079-1086,共8页
为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based ... 为获得结构化的小麦品种表型和遗传描述,针对非结构化小麦种质数据中存在的实体边界模糊以及关系重叠问题,提出一种基于深度字词融合的小麦种质信息实体关系联合抽取模型WGIE-DCWF(wheat germplasm information extraction model based on deep character and word fusion)。模型编码层通过深度字词融合和上下文语义特征融合,提高密集实体特征识别能力;模型三元组抽取层建立层叠指针网络,提高重叠关系的提取能力。在小麦种质数据集和公开数据集上的一系列对比实验结果表明,WGIE-DCWF模型能够有效提高小麦种质数据实体关系联合抽取效果,同时拥有较好的泛化性,可以为小麦种质信息知识库构建提供技术支撑。 展开更多
关键词 小麦种质信息 字词融合 实体关系抽取 联合抽取 层叠指针网络 实体识别 关系抽取
下载PDF
基于异构图和语义融合的实体关系抽取
4
作者 唐贤伦 丁河长 +2 位作者 唐瑜泽 谢涛 罗洪平 《实验技术与管理》 CAS 北大核心 2024年第8期22-29,共8页
关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方... 关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方法:使用异构图将关系信息作为先验知识融入词表示,增强词表示的表示能力,使得模型能有效地处理单词实体重叠问题;使用语义融合模块将不同层次特征融合在一起作为关系分类模型的输入,使得模型能够有效地处理实体对重叠问题。所提方法在NYT和WebNLG数据集上取得了最好的效果,详细的实验也表明所提方法可以处理复杂的场景。 展开更多
关键词 实体关系抽取 异构图 语义融合 关系重叠 实体关系三元组
下载PDF
一种引入核心实体关注度评估的KBQA算法
5
作者 赵卫东 晋艳峰 +1 位作者 张睿 林沿铮 《计算机科学》 CSCD 北大核心 2024年第11期239-247,共9页
目前针对复杂语义和复杂句法的知识库问答(Knowledge Base Question Answering,KBQA)研究层出不穷,但它们多以已知问题的主题实体为前提,对问题中多意图和多实体重视不足,而问句中对核心实体的识别是理解自然语言的关键。针对此问题,提... 目前针对复杂语义和复杂句法的知识库问答(Knowledge Base Question Answering,KBQA)研究层出不穷,但它们多以已知问题的主题实体为前提,对问题中多意图和多实体重视不足,而问句中对核心实体的识别是理解自然语言的关键。针对此问题,提出了一种引入核心实体关注度的KBQA模型。该模型基于注意力机制及注意力增强技术,对识别到的实体引用(Mention)进行重要性评估,得到实体引用关注度,去除潜在干扰项,捕获用户提问的核心实体,解决了多实体、多意图问句的语义理解问题。此外,还将评估的结果作为重要权重引入后续的问答推理中。在英文MetaQA数据集、多实体问句MetaQA数据集、多实体问句HotpotQA数据集上,与KVMem,GraftNet,PullNet等模型进行了对比实验。结果表明,针对多实体问句,所提模型在Hits@n、准确率、召回率等评估指标上均取得了更好的实验效果。 展开更多
关键词 知识库问答 意图识别 实体关注度 实体 多意图
下载PDF
美国实体清单制度对我国实体影响及应对策略--基于中兴、华为、联邦快递案的实证研究
6
作者 欧福永 范知智 《湖南大学学报(社会科学版)》 CSSCI 北大核心 2024年第5期130-137,共8页
美国基于技术霸权,利用实体清单制度等单边制裁手段对我国经济、科技等领域进行干涉,削弱中国的技术竞争力,触及中国安全。我国出台《不可靠实体清单规定》等法律法规,积极应对美国制裁,维护国家安全。实证研究表明,中国企业在大国博弈... 美国基于技术霸权,利用实体清单制度等单边制裁手段对我国经济、科技等领域进行干涉,削弱中国的技术竞争力,触及中国安全。我国出台《不可靠实体清单规定》等法律法规,积极应对美国制裁,维护国家安全。实证研究表明,中国企业在大国博弈下,面临执行实体清单禁令和受到中国反制裁立法体系处罚的两难困境。基于此,我国应在人类命运共同体理念之上,引入严苛的反制裁实体要件体系,并在逻辑上确立反制裁法律制度适用的平衡机制。我国在反制裁法律体系优化中应综合考虑行政救济机制的具体规则、相关法律法规的衔接、工作机制的程序性规范等因素,从而助力中国实体通过相关救济制度走出困境。 展开更多
关键词 实体清单 不可靠实体清单 经济制裁 反制裁 技术遏制
下载PDF
基于SciBERT-BiLSTM-CRF-wordMixup的软件实体识别研究
7
作者 潘雪莲 钱雨菲 王宪雨 《现代情报》 CSSCI 北大核心 2024年第10期75-85,共11页
[目的/意义]软件在现代科学研究中发挥着重要作用,高效识别学术文献中的软件实体对深入认识软件的学术价值、促进软件可持续发展和学术生态体系均衡发展具有重要意义。[方法/过程]本研究首先对软件实体进行定义;然后基于小型知识库的程... [目的/意义]软件在现代科学研究中发挥着重要作用,高效识别学术文献中的软件实体对深入认识软件的学术价值、促进软件可持续发展和学术生态体系均衡发展具有重要意义。[方法/过程]本研究首先对软件实体进行定义;然后基于小型知识库的程序辅助标注方案,构建软件实体识别领域语料库;在此基础上,提出改进的SciBERT-BiLSTM-CRF-wordMixup模型并对该模型的识别效果进行评估。[结果/结论]实验结果显示,本研究提出的改进模型SciBERT-BiLSTM-CRF-wordMixup在软件实体识别任务中表现最优,其整体F1值达到87.5%,说明该模型能够有效地从学术论文文本中识别出软件及其相关信息实体。 展开更多
关键词 软件实体识别 命名实体识别 深度学习 数据增强 SciBERT
下载PDF
融合时序分类的科技领域实体增长预测研究
8
作者 陈果 陈智力 陈霜澜 《情报理论与实践》 CSSCI 北大核心 2024年第2期116-123,共8页
[目的/意义]科技领域实体增长机制是进行预测型科技情报分析的核心,要有效地进行科技发展态势感知和预测,必须深入了解科技领域细粒度知识增长机制。文章提出并验证了融合时序分类的科技领域实体增长预测方案。[方法/过程]首先,根据实... [目的/意义]科技领域实体增长机制是进行预测型科技情报分析的核心,要有效地进行科技发展态势感知和预测,必须深入了解科技领域细粒度知识增长机制。文章提出并验证了融合时序分类的科技领域实体增长预测方案。[方法/过程]首先,根据实体词频时间序列的增长模式,将实体分为可拟合、有趋势和无规律3种类别;其次,利用曲线拟合、局部加权回归方法抽取特征,构建特征向量,再用MLP模型实现了高精度的实体分类;最后,构建融合时序分类的集成模型与基线模型进行对比验证效果。[结果/结论]根据实验结果,验证显示集成预测模型相对于基线模型,误差减少了13%以上,进一步证实了预测结果在科学性和准确性方面的优势。综合考虑,所提出的融合时间序列分类的实体增长预测方案在可行性和应用价值方面具备潜力。 展开更多
关键词 时间序列分类 领域实体 实体增长预测 集成模型
下载PDF
基于跨度和边界探测的实体关系联合抽取模型
9
作者 廖涛 许锦涛 《湖北民族大学学报(自然科学版)》 CAS 2024年第2期178-184,共7页
针对大多数跨度模型将文本分割成跨度序列时,产生大量非实体跨度,导致了数据不平衡和计算复杂度高等问题,提出了基于跨度和边界探测的实体关系联合抽取模型(joint extraction model for entity relationships based on span and boundar... 针对大多数跨度模型将文本分割成跨度序列时,产生大量非实体跨度,导致了数据不平衡和计算复杂度高等问题,提出了基于跨度和边界探测的实体关系联合抽取模型(joint extraction model for entity relationships based on span and boundary detection,SBDM)。SBDM首先使用训练Transformer的双向编码器表征量(bidirectional encoder representations from Transformer,BERT)模型将文本转化为词向量,并融合了通过图卷积获取的句法依赖信息以形成文本的特征表示;接着通过局部信息和句子上下文信息去探测实体边界并进行标记,以减少非实体跨度;然后将实体边界标记形成的跨度序列进行实体识别;最后将局部上下文信息融合到1个跨度实体对中并使用sigmoid函数进行关系分类。实验表明,SBDM在SciERC(multi-task identification of entities,relations,and coreference for scientific knowledge graph construction)数据集、CoNLL04(the 2004 conference on natural language learning)数据集上的关系分类指标S F1分别达到52.86%、74.47%,取得了较好效果。SBDM用于关系分类任务中,能促进跨度分类方法在关系抽取上的研究。 展开更多
关键词 实体关系 联合抽取 句法依赖 跨度 实体边界 图卷积 关系分类
下载PDF
基于潜在关系的实体关系联合抽取模型
10
作者 彭晏飞 张睿思 +1 位作者 王瑞华 郭家隆 《计算机科学与探索》 CSCD 北大核心 2024年第4期1047-1056,共10页
实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计... 实体关系联合抽取的作用是从特定文本中识别出实体和对应关系,同时它也是知识图谱构建和更新的基础。目前的联合抽取方法在追求性能的同时都忽略了抽取过程中的信息冗余。针对此问题,提出基于潜在关系的实体关系联合抽取模型,通过设计一种新的解码方式来减少预测过程中关系、实体和三元组的冗余信息,从整体上分为提取潜在实体对、解码关系两步来完成从句子中抽取三元组的任务。首先通过潜在实体对提取器预测实体间是否存在潜在关系,同时筛选出置信度高的实体对作为最终的潜在实体对;其次将关系解码视作多标签二分类任务,通过关系解码器预测每个潜在实体对之间全部关系的置信度;最后通过置信度确定关系数量和类型,以完成三元组的抽取任务。在两个通用数据集上的实验结果表明,所提模型相比基线模型在准确率和F1指标上的效果更好,验证了所提模型的有效性,消融实验也证明了模型内部各部分的有效性。 展开更多
关键词 实体关系联合抽取 潜在关系 潜在实体 多标签二分类任务 信息冗余
下载PDF
平台经济金融化对实体企业“脱虚向实”的影响
11
作者 徐晓莉 谭其宇 《华东经济管理》 CSSCI 北大核心 2024年第8期1-12,共12页
平台经济金融化对实体经济“脱虚向实”的影响日益明显。文章基于沪深A股上市企业数据,采用固定效应模型、中介检验模型等方法,实证考察平台经济金融化对实体企业“脱虚向实”的影响与作用机制。研究发现:平台经济金融化对实体企业“脱... 平台经济金融化对实体经济“脱虚向实”的影响日益明显。文章基于沪深A股上市企业数据,采用固定效应模型、中介检验模型等方法,实证考察平台经济金融化对实体企业“脱虚向实”的影响与作用机制。研究发现:平台经济金融化对实体企业“脱虚向实”呈“倒U”型非线性影响;成本机制、资本配置机制和创新补偿机制是其重要路径;平台经济金融化对处于不同金融发展水平地区、不同所有权及不同规模的实体企业“脱虚向实”存在异质性影响。据此,提出强化“主动+被动”双向监管、充分考虑企业资本配置结构、针对性给予政策支持等建议。研究结论为深化平台经济金融化发展、加快实体企业“脱虚向实”提供有益启示。 展开更多
关键词 实体企业 “脱虚向实” 平台经济金融化 资本配置 创新补偿 实体经济 非线性效应
下载PDF
基于实体知识的远程监督关系抽取
12
作者 马长林 孙状 《计算机工程与科学》 CSCD 北大核心 2024年第5期945-950,共6页
为了降低远程监督关系抽取标记数据的噪声,提出一种融合实体描述和自注意力机制的远程监督关系提取模型,模型基于多示例学习,考虑到实体知识和位置关系的综合作用,采用词、实体、实体描述和相对位置的拼接向量作为模型输入,将分段卷积... 为了降低远程监督关系抽取标记数据的噪声,提出一种融合实体描述和自注意力机制的远程监督关系提取模型,模型基于多示例学习,考虑到实体知识和位置关系的综合作用,采用词、实体、实体描述和相对位置的拼接向量作为模型输入,将分段卷积神经网络作为句子编码器,结合改进的结构化自注意力机制,捕捉特征内部相关性,并构造头实体和尾实体的差向量作为注意力机制的监督信息,为句子分配权重。在纽约时报数据集上的实验结果表明,与已有模型相比,本文模型的性能指标均达到最大值。 展开更多
关键词 关系抽取 实体 实体描述 分段卷积神经网络 自注意力机制
下载PDF
位置标签增强的中文医学命名实体级联识别
13
作者 王旭阳 赵丽婕 张继远 《计算机工程与应用》 CSCD 北大核心 2024年第2期121-128,共8页
针对一般领域的命名实体识别方法不能直接用于中文医学专业实体的识别,现有的相关研究只专注于英文文本和扁平结构的医学实体识别等问题,通过对专业领域实体识别方法的研究,结合中文医学实体的特点提出了一种面向中文医学实体的级联识... 针对一般领域的命名实体识别方法不能直接用于中文医学专业实体的识别,现有的相关研究只专注于英文文本和扁平结构的医学实体识别等问题,通过对专业领域实体识别方法的研究,结合中文医学实体的特点提出了一种面向中文医学实体的级联识别方法。将每个字符元素相对于实体的位置标签嵌入模型,并结合中文医学实体跨度内不同元素的重要程度进行实体的融合表示。通过序列标注方法检测字符的位置标签,利用字符的位置信息指导候选实体生成,并进行实体语义分类。模型在CMeEE和CCKS2018数据集以及中文糖尿病科研文献数据集上分别进行扁平实体、嵌套实体和不连续性长实体的识别实验。实验结果表明,该方法能够有效地识别中文医学文本中不同结构的实体。 展开更多
关键词 中文医学命名实体 位置标签嵌入 结合元素重要程度的实体融合表示 级联识别 线性结构
下载PDF
金融科技对金融服务实体经济效率的影响研究——基于中国31个省份的数据
14
作者 赵保国 宋舒晴 《北京邮电大学学报(社会科学版)》 2024年第4期71-83,共13页
选取2012—2021年我国31个省、市、自治区的面板数据,就金融科技对金融服务实体经济效率的影响进行系统的实证检验。研究发现:金融科技显著提升了金融服务实体经济效率的提升;将金融监管纳入模型,发现金融监管对金融科技与金融服务实体... 选取2012—2021年我国31个省、市、自治区的面板数据,就金融科技对金融服务实体经济效率的影响进行系统的实证检验。研究发现:金融科技显著提升了金融服务实体经济效率的提升;将金融监管纳入模型,发现金融监管对金融科技与金融服务实体经济效率的关系具有正向调节作用;金融科技在东部地区以及金融发展水平较高的地区对金融服务实体经济效率的提升作用更加显著。为推动金融科技的发展、提升金融服务实体经济效率以及实施适度金融监管提供了理论基础和经验证据。 展开更多
关键词 金融科技 实体经济 金融服务实体经济效率 金融监管
下载PDF
一种融入领域知识的领域短文本命名实体识别方法
15
作者 戎纪光 任志国 李书强 《指挥控制与仿真》 2024年第3期123-129,共7页
针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词... 针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词嵌入处理,并基于词向量相似性计算,发现与待识别领域命名实体相似的关键知识实体,将其替换为关键知识实体后生成新的领域短文本,与未替换的领域短文本一同输入模型中进行命名实体识别,使领域知识融入领域短文本的命名实体识别过程,实验结果表明本方法较现有其他同类方法获得了较优的识别能力。 展开更多
关键词 知识图谱 知识实体 命名实体识别 双向长短期记忆网络
下载PDF
职业院校产业学院实体化运行的基本特征、现实问题与对策建议 被引量:4
16
作者 薛振华 崔志钰 崔景贵 《教育与职业》 北大核心 2024年第5期51-58,共8页
职业院校产业学院作为一个办学实体已形成共识,而实体化运行是职业院校产业学院发挥功能的基本形态。职业院校产业学院实体化运行具有独立实体存在、主体协同作业、市场机制运作等基本特征。当前职业院校产业学院在实体化运行中存在着... 职业院校产业学院作为一个办学实体已形成共识,而实体化运行是职业院校产业学院发挥功能的基本形态。职业院校产业学院实体化运行具有独立实体存在、主体协同作业、市场机制运作等基本特征。当前职业院校产业学院在实体化运行中存在着一些较为突出的现实问题,主要表现为产业学院的独立性遭削弱、多元主体的协同性遇阻碍、管理运行的市场化陷困境。优化职业院校产业学院实体化运行,需要深化产权改革、提升产业学院独立性,优化治理体系、增强多元主体协同性,重构运行机制、推动业务活动市场化,让市场这一“看不见的手”在产权结构、组织架构、运行机制、核算体系中起主导作用。 展开更多
关键词 职业院校产业学院 实体化运行 独立实体 主体协同 市场运作
下载PDF
由医学模式的逆转倾向再论精神疾病的实体化
17
作者 周小东 朱宏日 +5 位作者 王朋 贾慧贤 胡兴娟 张俊纳 刘知霞 宁卫东 《国际神经精神科学杂志》 2024年第2期9-22,共14页
本文从医学模式的转变中,依循精神医学的简要历程,探寻学科未来的发展趋势,提出精神类疾病实体化倾向仍然是未来发展的总体脉络。非实体化思路仅仅是认识精神类疾病的一个方面而已。
关键词 医学模式 精神医学 实体 实体
下载PDF
结合核函数与神经网络的实体嵌入规范化
18
作者 谢晟祎 陈新元 陈庆强 《信息系统工程》 2024年第10期64-68,共5页
开放的知识库缺少本体信息,进一步影响服务下游应用的能力,需对实体进行规范化。传统相似性度量方法及现有机器学习/深度学习方法泛化能力有待提升。提出结合核函数与神经网络的规范化表示框架,引入外源辅助信息,与实体嵌入拼接,增强细... 开放的知识库缺少本体信息,进一步影响服务下游应用的能力,需对实体进行规范化。传统相似性度量方法及现有机器学习/深度学习方法泛化能力有待提升。提出结合核函数与神经网络的规范化表示框架,引入外源辅助信息,与实体嵌入拼接,增强细粒度的维度互动以改善语义识别能力,将相似性得分用于实体聚类。在行业数据集和开放知识图数据集上验证框架的实体规范化能力,并进一步开展链路预测任务,与基准模型比较以验证性能。 展开更多
关键词 知识图嵌入 实体规范化 实体消歧 行业领域 聚类
下载PDF
秉承“支付为民”理念,中国银联助力数字政务和实体经济发展
19
作者 杨青华 《中国信用卡》 2024年第3期82-83,共2页
为贯彻落实党的二十大提出的“加快数字政府建设”精神和《国务院关于加强数字政府建设的指导意见》要求,在人民银行的领导下,中国银联秉承“支付为民”的初心和理念,积极发挥清算机构的平台和枢纽作用,将自身发展融入产业变革大势和国... 为贯彻落实党的二十大提出的“加快数字政府建设”精神和《国务院关于加强数字政府建设的指导意见》要求,在人民银行的领导下,中国银联秉承“支付为民”的初心和理念,积极发挥清算机构的平台和枢纽作用,将自身发展融入产业变革大势和国家发展大局,赋能政府数字化改革,助力政府惠民生举措有效落地,服务实体经济发展。 展开更多
关键词 人民银行 产业变革 中国银联 枢纽作用 服务实体经济 实体经济发展 清算机构 惠民生
下载PDF
恐怖袭击事件实体语料库构建
20
作者 李林瑛 王孙和 曲云平 《现代信息科技》 2024年第19期44-47,52,共5页
针对恐怖袭击事件文本语料库匮乏的问题,文章制定了恐怖袭击事件的实体标注规范,通过对全球恐怖主义数据库(GTD)的数据进行实体标注,构建了恐怖袭击事件的实体语料库。同时,针对数据标注工作的高人力和高时间成本问题,由于百度通用信息... 针对恐怖袭击事件文本语料库匮乏的问题,文章制定了恐怖袭击事件的实体标注规范,通过对全球恐怖主义数据库(GTD)的数据进行实体标注,构建了恐怖袭击事件的实体语料库。同时,针对数据标注工作的高人力和高时间成本问题,由于百度通用信息抽取(Universal Information Extraction,UIE)模型在极小样本上具有较强的泛化能力,采用UIE模型进行辅助标注。实验结果证明了标注方案的有效性,并在一定程度上减少了标注时间。 展开更多
关键词 恐怖袭击事件 实体语料库 通用信息抽取 全球恐怖主义数据库 命名实体识别
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部