期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于条件随机域的生物命名实体识别 被引量:17
1
作者 彭春艳 张晖 +1 位作者 包玲玉 陈昌平 《计算机工程》 CAS CSCD 北大核心 2009年第22期197-199,共3页
提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测试结果表明,引入距离依赖后,系统的识别性能比只利用单特性的条件随机域方法提高2.54%,可获得较好的识别效... 提出一种基于条件随机域模型的生物命名实体识别方法,结合单词构词特性以及距离依赖特性,在JNLPBA的GENIAV3.02数据上进行实验,测试结果表明,引入距离依赖后,系统的识别性能比只利用单特性的条件随机域方法提高2.54%,可获得较好的识别效果,提高了系统的识别效率。 展开更多
关键词 生物命名实体识别 条件随机域 隐马尔科夫模型
下载PDF
基于词义增强的生物医学命名实体识别方法
2
作者 陈梦萱 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机工程》 CAS CSCD 北大核心 2023年第10期305-312,共8页
生物医学命名实体识别(BioNER)是生物医学文本挖掘的核心任务之一,能够为下游任务提供有力支撑。与通用领域相比,生物医学数据中存在更多的未登录词,现有BioNER方法通常将未登录词拆分为语素进行表示学习,这种方法缓解了未登录词表示信... 生物医学命名实体识别(BioNER)是生物医学文本挖掘的核心任务之一,能够为下游任务提供有力支撑。与通用领域相比,生物医学数据中存在更多的未登录词,现有BioNER方法通常将未登录词拆分为语素进行表示学习,这种方法缓解了未登录词表示信息不足的问题,但是破坏了单词的内部信息,对语素进行标签预测时容易出现标签不一致和跨实体标签问题。此外,将单词分割为语素导致句子长度变长,加重了训练中存在的梯度消失问题。提出一种通过BiLSTM-Biaffine结构进行词义增强的BioNER方法。通过BioBERT预训练模型获取语素表示信息,使用BiLSTM-Biaffine进行词义增强,在单词层面利用BiLSTM分别获取语素的前向和后向序列信息,采用Biaffine注意力机制增强其关联信息并重新融合为单词表示,最后通过BiLSTM-CRF模型获取输入句子的标签序列。实验结果表明,在数据集BC2GM、NCBI-Disease、BC5CDR-chem和JNLPBA上,该方法的F1值分别达到84.94%、89.07%、92.14%和74.57%,与主流序列标注模型MTM-CW、MT-BioNER等相比平均分别提高了2.99、1.84、3.09和1.03个百分点,验证了所提方法在BioNER任务中的有效性。 展开更多
关键词 生物医学命名实体识别 语素 词义增强 双向长短期记忆网络 注意力机制
下载PDF
基于字符级特征自适应的生物医学命名实体识别 被引量:4
3
作者 于祥钦 王香 +1 位作者 李智强 徐贤 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1876-1883,共8页
生物医学领域新增实体数量和类型迅速增加,在预训练词表容量有限的情况下,字符嵌入可以在一定程度上解决未登录词问题,单一的字符级特征提取器所提取字符嵌入的潜在表征有一定局限性.针对此问题,提出一种字符级特征自适应融合的生物医... 生物医学领域新增实体数量和类型迅速增加,在预训练词表容量有限的情况下,字符嵌入可以在一定程度上解决未登录词问题,单一的字符级特征提取器所提取字符嵌入的潜在表征有一定局限性.针对此问题,提出一种字符级特征自适应融合的生物医学命名实体模型.首先利用卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)提取文本的字符向量,训练过程中动态计算文本单词两种字符向量的权重并进行拼接,使得模型在字符粒度上更加充分的利用信息,并加入词性信息和组块分析作为额外特征;将词向量、字符级特征和额外特征拼接后输入到BiLSTM-CRF神经网络模型进行训练.结果表明,所提模型在NCBI-disease和BiocreativeⅡGM语料库上平均F1值达到87.14%和81.04%,有效的提升了生物医学命名实体识别的效果. 展开更多
关键词 生物医学命名实体识别 双向长短期记忆网络 卷积神经网络 字符级特征 自适应
下载PDF
生物医学文本中命名实体识别研究 被引量:6
4
作者 张向喆 王明辉 +2 位作者 赵洪波 王起山 潘玉春 《上海交通大学学报(农业科学版)》 2010年第2期132-139,共8页
生物命名实体识别是对生物医学文本进行信息处理的关键技术。准确的生物命名实体识别工具是对文本进行后续工作如信息提取或文本分类等的先决条件。经过多年的研究,生命科学领域生物命名实体识别取得了一定的进展。本文总结了生物命名... 生物命名实体识别是对生物医学文本进行信息处理的关键技术。准确的生物命名实体识别工具是对文本进行后续工作如信息提取或文本分类等的先决条件。经过多年的研究,生命科学领域生物命名实体识别取得了一定的进展。本文总结了生物命名实体的特征,分析了基于不同方法的生物命名实体识别系统,及生物命名实体识别方法在提取蛋白质互作等方面的丰富应用,并展望了未来的发展趋势。 展开更多
关键词 生物信息学 生物命名实体识别 生物医学文献
下载PDF
基于深层条件随机场的生物医学命名实体识别 被引量:18
5
作者 孙晓 孙重远 任福继 《模式识别与人工智能》 EI CSCD 北大核心 2016年第11期997-1008,共12页
生物医学命名实体识别是从生物医学文献中获取关键知识的基础与关键任务.文中提出基于深层条件随机场的生物医学命名实体识别方法,构建多层结构的深层条件随机场模型,在不同层次的特征上结合增量式学习策略,选择最优特征集.最后通过基... 生物医学命名实体识别是从生物医学文献中获取关键知识的基础与关键任务.文中提出基于深层条件随机场的生物医学命名实体识别方法,构建多层结构的深层条件随机场模型,在不同层次的特征上结合增量式学习策略,选择最优特征集.最后通过基于〈全名,缩写〉对和基于领域信息的错误纠正算法,进一步修正识别结果.在生物医学命名实体评测语料JNLPBA上的实验验证文中方法的有效性. 展开更多
关键词 生物医学命名实体识别 深层条件随机场 增量式学习 错误纠正算法
下载PDF
基于CNN-BLSTM-CRF模型的生物医学命名实体识别 被引量:123
6
作者 李丽双 郭元凯 《中文信息学报》 CSCD 北大核心 2018年第1期116-122,共7页
命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现出了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大。因此,... 命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现出了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大。因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体识别性能是有待解决的问题。该文提出一种基于CNN-BLSTM-CRF的神经网络模型。首先利用卷积神经网络(CNN)训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练中得到具有语义特征信息的词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF深层神经网络模型。实验结果表明,不依赖任何人工特征,该文方法在BiocreativeⅡGM和JNLPBA2004生物医学语料上都达到了目前最好的结果,F-值分别为89.09%和74.40%。 展开更多
关键词 生物医学命名实体识别 LSTM CNN
下载PDF
基于CRFs的多策略生物医学命名实体识别 被引量:2
7
作者 马瑞民 马民艳 《齐齐哈尔大学学报(自然科学版)》 2011年第1期39-42,共4页
生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采取有效的识别策略是提高生物医学命名实体识别性能的关键,鉴于条件随机域算法在自然语言处理领域的优势... 生物医学命名实体识别是生物医学文本挖掘的基本任务。机器学习方法是生物医学命名实体研究的主流方法,选取有效的机器学习算法和采取有效的识别策略是提高生物医学命名实体识别性能的关键,鉴于条件随机域算法在自然语言处理领域的优势,本文采用该算法并结合多种识别策略对生物医学命名实体识别进行研究。实验取得了良好的效果,F测度达到了70.52%,与其它相关系统比较,识别性能有了明显提高。 展开更多
关键词 生物医学命名实体识别 特征提取 缩写词识别 条件随机域
下载PDF
基于分类器串联融合的生物医学命名实体识别
8
作者 马瑞民 马民艳 王浩畅 《大庆石油学院学报》 CAS 北大核心 2011年第2期91-94,122,共4页
鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该... 鉴于生物医学命名实体识别的多数模型使用单机器学习算法时识别效果不好,提出一种基于条件随机域(CRFs)与最大熵(Maxent)分类器融合的方法,利用基分类器之间的相关性和互补性,结合有效的特征集合,进行再学习,得到融合模型.实验表明,该模型的识别性能与单一分类器和JNLPBA专题会议相关的系统比较,取得很好成绩,F测度达到70.7%,证明该融合方法有效. 展开更多
关键词 条件随机域 最大熵 分类器融合 特征提取 生物医学命名实体识别
下载PDF
结合CRF的边界组合生物医学命名实体识别 被引量:7
9
作者 扈应 陈艳平 +1 位作者 黄瑞章 秦永彬 《计算机应用研究》 CSCD 北大核心 2021年第7期2025-2031,共7页
许多的生物医学命名实体识别(Bio-NER)工作都集中于提取扁平化的实体,而忽略了嵌套实体和不连续实体。此外,大多数生物医学命名实体都未遵循统一的命名法,具有许多典型的领域特征,但其使用效率较低。为此提出一种结合CRF的边界组合命名... 许多的生物医学命名实体识别(Bio-NER)工作都集中于提取扁平化的实体,而忽略了嵌套实体和不连续实体。此外,大多数生物医学命名实体都未遵循统一的命名法,具有许多典型的领域特征,但其使用效率较低。为此提出一种结合CRF的边界组合命名实体识别方法,有效地利用了生物医学实体特征。该方法包括边界检测、边界组合和实体筛选三个步骤。首先使用神经网络模型和基于特征的CRF模型识别实体开始和结束边界,然后经过边界组合产生候选实体,最后使用多输入的卷积神经网络模型对候选实体进行筛选并分类。实验表明,该方法能够有效地识别生物医学文献中的嵌套和不连续实体,在GENIA数据集上达到81.89%的F值。 展开更多
关键词 生物医学命名实体识别 深度学习 条件随机场 信息抽取
下载PDF
基于生物医学文献的蛋白质关系发现
10
作者 彭春艳 张晖 +1 位作者 包玲玉 陈昌平 《电脑知识与技术》 2008年第12期1719-1720,共2页
实验提出了一种基于词频统计的蛋白质关系知识发现方法,该方法首先通过生物命名实体识别技术识别出蛋白质实体,然后统计共出现频率,形成候选实体对,从而发现最有可能的实体关联。
关键词 知识发现 生物命名实体识别 实体关联
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部