期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
生物医学实体关系抽取的研究 被引量:5
1
作者 吴明智 崔雷 《中华医学图书情报杂志》 CAS 2010年第5期5-10,共6页
人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚。作为生物医学研究成果载体的文献呈指数增长,已成... 人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚。作为生物医学研究成果载体的文献呈指数增长,已成为科研人员获取知识的瓶颈。文本挖掘能够解决信息超载问题,故对生物医学实体关系的挖掘流程和评价指标进行介绍,对生物医学文本挖掘在研究生物实体关系抽取中采用的基于统计的方法、基于自然语言处理的方法和基于模式匹配的方法进行了阐述,对各种方法进行了综合比较,同时介绍了国内外相关研究。 展开更多
关键词 生物医学文本挖掘 生物医学实体 关系抽取
下载PDF
基于共词分析的生物医学实体评价研究
2
作者 于琦 《晋图学刊》 2015年第3期1-4,共4页
本文提出了生物医学实体评价,并采用信息计量学中的共词分析予以实现.首先,以基于机器学习的识别方法为主,结合基于字典和基于启发式规则的识别方法,完成科研文献中生物医学实体的识别;进而,在生物医学实体识别基础上构建生物医学实体... 本文提出了生物医学实体评价,并采用信息计量学中的共词分析予以实现.首先,以基于机器学习的识别方法为主,结合基于字典和基于启发式规则的识别方法,完成科研文献中生物医学实体的识别;进而,在生物医学实体识别基础上构建生物医学实体共现网络;最后,通过生物医学实体共现网络分析实现生物医学实体的评价. 展开更多
关键词 生物医学实体 评价研究 共词分析
下载PDF
融合外部知识和图卷积神经网络的生物医学事件联合识别
3
作者 杨书鸿 牛玥 刘力铭 《科学技术与工程》 北大核心 2024年第22期9464-9473,共10页
利用自然语言处理技术从生物医学文本中抽取药物治疗、疾病诊断等事件以及事件中涉及的疾病、药物等实体,对于生物医学领域相关学术研究以及各类生物医学应用系统具有重要意义。针对生物医学文本中的缩略词及专业术语难以识别和生物医... 利用自然语言处理技术从生物医学文本中抽取药物治疗、疾病诊断等事件以及事件中涉及的疾病、药物等实体,对于生物医学领域相关学术研究以及各类生物医学应用系统具有重要意义。针对生物医学文本中的缩略词及专业术语难以识别和生物医学语义关系难以嵌入的问题,提出了一种融合外部知识和图卷积神经网络的生物医学信息联合识别模型。图卷积神经网络构建了包含实体和语义关系的异构图,能够迭代地融合本地知识图和外部知识图中的交互信息,根据得到的交互信息来进行生物医学实体对之间关系的抽取任务。预训练编码后利用图卷积神经网络构建本地和外部知识两个知识图,获得两个图中每个节点的特征表示,并且通过注意力实体链接的方法将两个图进行融合与信息迭代,进而抽取其最后一层隐藏层来完成最终的分类识别。其中统一医学语言系统(unified medical language system,UMLS)被用作实体消歧的外部知识库,实体链接器根据注意力权重选择对应实体。通过在MLEE语料库上进行的实验表明,联合任务能够实现事件抽取和触发词、元素识别的综合性能。 展开更多
关键词 生物医学事件抽取 外部知识库 生物医学实体链接 图卷积神经网络
下载PDF
基于词义增强的生物医学命名实体识别方法
4
作者 陈梦萱 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机工程》 CAS CSCD 北大核心 2023年第10期305-312,共8页
生物医学命名实体识别(BioNER)是生物医学文本挖掘的核心任务之一,能够为下游任务提供有力支撑。与通用领域相比,生物医学数据中存在更多的未登录词,现有BioNER方法通常将未登录词拆分为语素进行表示学习,这种方法缓解了未登录词表示信... 生物医学命名实体识别(BioNER)是生物医学文本挖掘的核心任务之一,能够为下游任务提供有力支撑。与通用领域相比,生物医学数据中存在更多的未登录词,现有BioNER方法通常将未登录词拆分为语素进行表示学习,这种方法缓解了未登录词表示信息不足的问题,但是破坏了单词的内部信息,对语素进行标签预测时容易出现标签不一致和跨实体标签问题。此外,将单词分割为语素导致句子长度变长,加重了训练中存在的梯度消失问题。提出一种通过BiLSTM-Biaffine结构进行词义增强的BioNER方法。通过BioBERT预训练模型获取语素表示信息,使用BiLSTM-Biaffine进行词义增强,在单词层面利用BiLSTM分别获取语素的前向和后向序列信息,采用Biaffine注意力机制增强其关联信息并重新融合为单词表示,最后通过BiLSTM-CRF模型获取输入句子的标签序列。实验结果表明,在数据集BC2GM、NCBI-Disease、BC5CDR-chem和JNLPBA上,该方法的F1值分别达到84.94%、89.07%、92.14%和74.57%,与主流序列标注模型MTM-CW、MT-BioNER等相比平均分别提高了2.99、1.84、3.09和1.03个百分点,验证了所提方法在BioNER任务中的有效性。 展开更多
关键词 生物医学命名实体识别 语素 词义增强 双向长短期记忆网络 注意力机制
下载PDF
基于字符级特征自适应的生物医学命名实体识别 被引量:3
5
作者 于祥钦 王香 +1 位作者 李智强 徐贤 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1876-1883,共8页
生物医学领域新增实体数量和类型迅速增加,在预训练词表容量有限的情况下,字符嵌入可以在一定程度上解决未登录词问题,单一的字符级特征提取器所提取字符嵌入的潜在表征有一定局限性.针对此问题,提出一种字符级特征自适应融合的生物医... 生物医学领域新增实体数量和类型迅速增加,在预训练词表容量有限的情况下,字符嵌入可以在一定程度上解决未登录词问题,单一的字符级特征提取器所提取字符嵌入的潜在表征有一定局限性.针对此问题,提出一种字符级特征自适应融合的生物医学命名实体模型.首先利用卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)提取文本的字符向量,训练过程中动态计算文本单词两种字符向量的权重并进行拼接,使得模型在字符粒度上更加充分的利用信息,并加入词性信息和组块分析作为额外特征;将词向量、字符级特征和额外特征拼接后输入到BiLSTM-CRF神经网络模型进行训练.结果表明,所提模型在NCBI-disease和BiocreativeⅡGM语料库上平均F1值达到87.14%和81.04%,有效的提升了生物医学命名实体识别的效果. 展开更多
关键词 生物医学命名实体识别 双向长短期记忆网络 卷积神经网络 字符级特征 自适应
下载PDF
采用混合方法抽取生物医学实体间语义关系 被引量:3
6
作者 王秀艳 崔雷 《现代图书情报技术》 CSSCI 北大核心 2013年第3期77-82,共6页
以阿司匹林副作用为研究样本的主题,搜集PubMed数据库中与"药物副作用引起疾病"主题词关联规则相对应的文献记录,在文献摘要中提取出相应实体共现的句子,进而利用自然语言处理方法提取文献中表达生物医学实体间语义关系的动词... 以阿司匹林副作用为研究样本的主题,搜集PubMed数据库中与"药物副作用引起疾病"主题词关联规则相对应的文献记录,在文献摘要中提取出相应实体共现的句子,进而利用自然语言处理方法提取文献中表达生物医学实体间语义关系的动词,共提取出30个表示药物副作用与疾病关系的动词。研究结果表明:基于共现和自然语言处理提取语义关系动词的方法是可行的。 展开更多
关键词 生物医学实体 语义关系抽取 自然语言处理
原文传递
应用关键动词抽取生物医学实体间语义关系研究综述 被引量:1
7
作者 王秀艳 崔雷 《现代图书情报技术》 CSSCI 北大核心 2011年第9期21-27,共7页
对利用关键动词(即语义关系动词)进行关系抽取的研究进行回顾,并对生物医学语义关系抽取的常用方法进行详细介绍。认为目前关系抽取研究中所利用的关键动词主要是人工选取的,涉及的主观因素较多,影响关键动词选取的客观性、准确性和全... 对利用关键动词(即语义关系动词)进行关系抽取的研究进行回顾,并对生物医学语义关系抽取的常用方法进行详细介绍。认为目前关系抽取研究中所利用的关键动词主要是人工选取的,涉及的主观因素较多,影响关键动词选取的客观性、准确性和全面性。因此,如何自动化地找到这些动词可能会成为今后关系挖掘的一项关键任务。 展开更多
关键词 生物医学实体 语义关系抽取 信息抽取 关键动词
原文传递
基于深层条件随机场的生物医学命名实体识别 被引量:18
8
作者 孙晓 孙重远 任福继 《模式识别与人工智能》 EI CSCD 北大核心 2016年第11期997-1008,共12页
生物医学命名实体识别是从生物医学文献中获取关键知识的基础与关键任务.文中提出基于深层条件随机场的生物医学命名实体识别方法,构建多层结构的深层条件随机场模型,在不同层次的特征上结合增量式学习策略,选择最优特征集.最后通过基... 生物医学命名实体识别是从生物医学文献中获取关键知识的基础与关键任务.文中提出基于深层条件随机场的生物医学命名实体识别方法,构建多层结构的深层条件随机场模型,在不同层次的特征上结合增量式学习策略,选择最优特征集.最后通过基于〈全名,缩写〉对和基于领域信息的错误纠正算法,进一步修正识别结果.在生物医学命名实体评测语料JNLPBA上的实验验证文中方法的有效性. 展开更多
关键词 生物医学命名实体识别 深层条件随机场 增量式学习 错误纠正算法
下载PDF
基于感知器的生物医学命名实体边界识别算法 被引量:2
9
作者 胡俊锋 陈浩 +2 位作者 陈蓉 谭斌 于中华 《计算机应用》 CSCD 北大核心 2007年第12期3026-3028,3031,共4页
在生物信息学领域内生物医学命名实体识别(Bio-NER)是生物医学文献挖掘、利用的基础工作,由于实体边界识别的困难导致目前Bio-NER效率较低,因此提出了基于感知器的实体边界识别算法,该算法采用随机梯度下降算法训练权重,利用token过滤器... 在生物信息学领域内生物医学命名实体识别(Bio-NER)是生物医学文献挖掘、利用的基础工作,由于实体边界识别的困难导致目前Bio-NER效率较低,因此提出了基于感知器的实体边界识别算法,该算法采用随机梯度下降算法训练权重,利用token过滤器、n-gram模型及实体过滤器实现生物医学命名实体边界识别。在GENIA corpus 3.02语料库上进行的实验表明,该算法可以达到71.5%的准确率和79.2%的召回率,与相关工作相比均有一定提高。另外算法相对简单,识别算法速度较快,易在生产中应用。 展开更多
关键词 生物医学命名实体 感知器 N-GRAM模型 实体边界识别
下载PDF
一种松耦合的生物医学命名实体识别算法 被引量:2
10
作者 胡俊锋 陈蓉 +2 位作者 陈源 陈浩 于中华 《计算机应用》 CSCD 北大核心 2007年第11期2866-2869,共4页
生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENI... 生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。 展开更多
关键词 生物医学命名实体 启发规则过滤器 词性模板匹配 词根匹配 隐马尔科夫模型 松耦合算法
下载PDF
基于CNN-BLSTM-CRF模型的生物医学命名实体识别 被引量:121
11
作者 李丽双 郭元凯 《中文信息学报》 CSCD 北大核心 2018年第1期116-122,共7页
命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现出了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大。因此,... 命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现出了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大。因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体识别性能是有待解决的问题。该文提出一种基于CNN-BLSTM-CRF的神经网络模型。首先利用卷积神经网络(CNN)训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练中得到具有语义特征信息的词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF深层神经网络模型。实验结果表明,不依赖任何人工特征,该文方法在BiocreativeⅡGM和JNLPBA2004生物医学语料上都达到了目前最好的结果,F-值分别为89.09%和74.40%。 展开更多
关键词 生物医学命名实体识别 LSTM CNN
下载PDF
基于CRFs的多策略生物医学命名实体识别 被引量:2
12
作者 马瑞民 马民艳 《齐齐哈尔大学学报(自然科学版)》 2011年第1期39-42,共4页
生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采取有效的识别策略是提高生物医学命名实体识别性能的关键,鉴于条件随机域算法在自然语言处理领域的优势... 生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采取有效的识别策略是提高生物医学命名实体识别性能的关键,鉴于条件随机域算法在自然语言处理领域的优势,本文采用该算法并结合多种识别策略对生物医学命名实体识别进行研究。实验取得了良好的效果,F测度达到了70.52%,与其它相关系统比较,识别性能有了明显提高。 展开更多
关键词 生物医学命名实体识别 特征提取 缩写词识别 条件随机域
下载PDF
基于分类器串联融合的生物医学命名实体识别
13
作者 马瑞民 马民艳 王浩畅 《大庆石油学院学报》 CAS 北大核心 2011年第2期91-94,122,共4页
鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该... 鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该模型的识别性能与单一分类器和JNLPBA专题会议相关的系统比较,取得很好成绩,F测度达到70.7%,证明该融合方法有效. 展开更多
关键词 条件随机域 最大熵 分类器融合 特征提取 生物医学命名实体识别
下载PDF
结合CRF的边界组合生物医学命名实体识别 被引量:7
14
作者 扈应 陈艳平 +1 位作者 黄瑞章 秦永彬 《计算机应用研究》 CSCD 北大核心 2021年第7期2025-2031,共7页
许多的生物医学命名实体识别(Bio-NER)工作都集中于提取扁平化的实体,而忽略了嵌套实体和不连续实体。此外,大多数生物医学命名实体都未遵循统一的命名法,具有许多典型的领域特征,但其使用效率较低。为此提出一种结合CRF的边界组合命名... 许多的生物医学命名实体识别(Bio-NER)工作都集中于提取扁平化的实体,而忽略了嵌套实体和不连续实体。此外,大多数生物医学命名实体都未遵循统一的命名法,具有许多典型的领域特征,但其使用效率较低。为此提出一种结合CRF的边界组合命名实体识别方法,有效地利用了生物医学实体特征。该方法包括边界检测、边界组合和实体筛选三个步骤。首先使用神经网络模型和基于特征的CRF模型识别实体开始和结束边界,然后经过边界组合产生候选实体,最后使用多输入的卷积神经网络模型对候选实体进行筛选并分类。实验表明,该方法能够有效地识别生物医学文献中的嵌套和不连续实体,在GENIA数据集上达到81.89%的F值。 展开更多
关键词 生物医学命名实体识别 深度学习 条件随机场 信息抽取
下载PDF
基于HMM的生物医学命名实体的识别与分类 被引量:10
15
作者 陈锦 常致全 许军 《计算机时代》 2006年第10期40-42,共3页
为了解决从MEDLINE摘要里抽取出生物医学命名实体并加以归类,提出了一种基于隐马尔可夫模型(HMM)的信息抽取方法。结合若干单词特征,用语料库GENIAcorpus3.02训练和测试后,系统的F值达到62.6。
关键词 信息抽取 生物医学命名实体 隐马尔可夫模型 单词特征
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部