期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
面向生物文本挖掘的语义标注研究
1
作者 陈波 吕晨 魏小梅 《湖北文理学院学报》 2015年第7期29-32,共4页
文章提出了一个新颖的模型——"基于特征结构的递归有向图",将其用于描述英文生物文本中定语后置的语义关系。后置定语的用法是复杂多变的,主要有三类情况:现在分词充当后置定语,过去分词充当后置定语,介词短语充当后置定语,... 文章提出了一个新颖的模型——"基于特征结构的递归有向图",将其用于描述英文生物文本中定语后置的语义关系。后置定语的用法是复杂多变的,主要有三类情况:现在分词充当后置定语,过去分词充当后置定语,介词短语充当后置定语,这为自动分析带来很多难题。我们总结和标注了这三类后置定语的语义信息。与依存结构相比,特征结构可以形式化为可递归的有向图,标注结果表明递归有向图更适合与生物文本挖掘中的复杂语义关系抽取。 展开更多
关键词 生物文本挖掘 语义标注 递归有向图 后置定语
下载PDF
面向语义关系的生物文本检索算法
2
作者 李姣 黄民烈 +2 位作者 丁石林 余浩 朱小燕 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第8期906-908,共3页
面向语义关系的生物文本检索算法通过从生物文本中自动生成满足一定语义关系的模板,将语义关系提取与文本信息检索技术有机融合,以满足用户对生物语义关系查询的需求.在国际性评测会议TREC Genomics提供的标准数据集上的实验结果表明,... 面向语义关系的生物文本检索算法通过从生物文本中自动生成满足一定语义关系的模板,将语义关系提取与文本信息检索技术有机融合,以满足用户对生物语义关系查询的需求.在国际性评测会议TREC Genomics提供的标准数据集上的实验结果表明,该算法可以显著地改善生物文本信息检索的性能(平均检索精度提高15.34%). 展开更多
关键词 生物文本检索 语义关系提取 融合策略 标准评价
下载PDF
结合引文信息的生物医学文本聚类研究 被引量:3
3
作者 顾钧 郑晓东 张连明 《计算机应用与软件》 CSCD 北大核心 2012年第10期5-7,共3页
近年来,生物医学文献数量激增,导致严重的信息过载。生物医学文献挖掘能够有效地缓解这一现象,而文献聚类是其中一个重要研究方向。当前文献聚类算法主要是基于文献内容信息实现的,并没有考虑文献间存在的大量引文信息。将引文信息引入... 近年来,生物医学文献数量激增,导致严重的信息过载。生物医学文献挖掘能够有效地缓解这一现象,而文献聚类是其中一个重要研究方向。当前文献聚类算法主要是基于文献内容信息实现的,并没有考虑文献间存在的大量引文信息。将引文信息引入到文献聚类中,提出一种结合引文信息和内容信息的聚类算法,实验结果表明了该方法的有效性。 展开更多
关键词 文献聚类 引文信息 生物文本挖掘
下载PDF
中文生物医学文本无词典分词方法研究 被引量:4
4
作者 王军辉 胡铁军 +2 位作者 李丹亚 钱庆 方安 《情报学报》 CSSCI 北大核心 2011年第2期197-203,共7页
为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取... 为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取两方面对其进行了改进.实验结果表明,该方法可以在不需要词典和语料库学习的情况下,实现对生物医学文本中关键性专业术语的有效抽取,分词准确率约为84.51%.最后,基于本研究中的分词结果,对生物医学领域的词长分布进行了初步探讨,结果表明中文生物医学领域的词长分布与普通汉语文本有非常大的差异.研究结果对在处理中文生物医学文本时N-gram模型中N值的确定具有一定的参考价值. 展开更多
关键词 无词典分词 结构式摘要 生物医学文本
下载PDF
文本挖掘在生物医学领域中的应用及其系统工具 被引量:19
5
作者 吕婷 姜友好 《中华医学图书情报杂志》 CAS 2010年第4期56-64,共9页
系统介绍了生物医学文本挖掘的具体流程和文本挖掘技术在生物医学领域中的应用情况,并着重从自然语言处理和本体、命名实体识别、关系抽取、文本分类与聚类、共现分析、系统工具及评价、可视化等方面分别做了阐述。
关键词 生物医学文本挖掘 自然语言处理 命名实体识别 关系抽取 共现分析
下载PDF
子宫内膜癌相关基因的生物医学文本分析研究 被引量:2
6
作者 张凯 刘玲玲 薛凤霞 《中华医学图书情报杂志》 CAS 2019年第6期1-8,共8页
目的:寻找与子宫内膜癌发生、发展相关的关键基因。方法:从医学信息检索平台Coremine Medical中筛选出与子宫内膜癌关系最为密切的几种关键基因,再利用生物医学文本挖掘工具Chilibot对从Pub Med中获取的相关文献摘要进行分析,深入探究... 目的:寻找与子宫内膜癌发生、发展相关的关键基因。方法:从医学信息检索平台Coremine Medical中筛选出与子宫内膜癌关系最为密切的几种关键基因,再利用生物医学文本挖掘工具Chilibot对从Pub Med中获取的相关文献摘要进行分析,深入探究关键基因与子宫内膜癌之间的相互关系,并通过UALCAN在线工具分析关键基因的表达水平和甲基化水平。结果:确定了与子宫内膜癌关系最密切的5种关键基因。在子宫内膜癌组织中,MLH1基因的甲基化水平比正常子宫内膜组织的甲基化水平要高(P<0. 001),MLH1基因甲基化的发生导致了DNA错配修复基因的突变,从而促进了子宫内膜癌的发生。与正常子宫内膜组织相比,MSH2基因和PMS2基因在子宫内膜癌组织中表达量较高(P<0. 001),MSH6基因和抑癌基因PTEN在子宫内膜癌组织中的表达均比正常子宫内膜组织表达要低(P<0. 001)。错配修复基因MLH1、MSH2、MSH6以及PMS2的突变,促进了相应修复蛋白的缺失,进而导致了子宫内膜癌的发生、发展。结论:错配修复基因MLH1、MSH2、MSH6、PMS2以及抑癌基因PTEN是子宫内膜癌发生、发展的关键基因。 展开更多
关键词 生物医学文本挖掘 子宫内膜癌 关键基因 Coremine MEDICAL Chilibot
下载PDF
基于生物医学文本挖掘工具的白血病和基因关系研究 被引量:2
7
作者 朱祥 张云秋 冯佳 《中华医学图书情报杂志》 CAS 2015年第10期28-32,共5页
利用COREMINE Medical寻找与白血病相关的基因,确定关系最为密切的5种基因,再通过生物医学文本挖掘工具Chilibot对从Pub Med中所获相关文献的摘要进行分析,通过对相互作用的深入分析,发现了白血病和基因的相互作用关系。
关键词 生物医学文本挖掘 白血病 基因 COREMINE MEDICAL Chilibot
下载PDF
浅析俄语科技语体中生物类型文本的语言特点
8
作者 王巧时 《活力》 2017年第21期21-21,共1页
作为俄语功能语体中的五大语体之一,科技语体一直以其逻辑性、准确性、严密性、抽象性和概括性著称。随着中俄两国科技的不断发展、在科技领域的合作越来越多,而科技翻译扮演着关键性的角色。文章通过一些具体实例、浅析俄语科技语体... 作为俄语功能语体中的五大语体之一,科技语体一直以其逻辑性、准确性、严密性、抽象性和概括性著称。随着中俄两国科技的不断发展、在科技领域的合作越来越多,而科技翻译扮演着关键性的角色。文章通过一些具体实例、浅析俄语科技语体中生物类型文本的语言主要特点。 展开更多
关键词 俄语科技语体 生物文本 语言特点
下载PDF
国外生物医学文本语料库分类及特点研究 被引量:2
9
作者 晏归来 安新颖 +1 位作者 范少萍 周永称 《医学信息学杂志》 CAS 2018年第10期74-80,共7页
通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究... 通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究奠定基础。 展开更多
关键词 生物医学文本语料库 语义类型 语义关系
下载PDF
基于距离学习的生物医学文本聚类算法研究 被引量:1
10
作者 袁伟 朱山风 《计算机应用与软件》 CSCD 2010年第11期4-5,19,共3页
近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对... 近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对生物医学文本的特点提出了基于距离学习的聚类算法,实验结果证明了该方法的有效性。 展开更多
关键词 向量空间模型 文本聚类 生物医学文本
下载PDF
基于双代价参数SVM的生物医学文本指代消解研究
11
作者 张丽君 李丽双 范国龙 《大连理工大学学报》 EI CAS CSCD 北大核心 2015年第4期405-410,共6页
生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于... 生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于实验结果的影响.最后与其他先进方法进行了对比.结果表明,在同样的语料上,基于双代价参数SVM方法优于其他先进的方法. 展开更多
关键词 生物医学文本 指代消解 SVM 双代价参数
下载PDF
基于注意力机制的生物医学文本分类模型 被引量:3
12
作者 李启行 廖薇 《中国医学物理学杂志》 CSCD 2022年第4期518-523,共6页
对生物医学文本进行准确分类,是促进医院信息化发展的一个重要途径。本研究提出一种基于注意力机制的双层次文本分类模型,用于对生物医学文本进行有效分类。该模型结合卷积神经网络与循环神经网络的优势,对用户输入的疾病文本进行特征... 对生物医学文本进行准确分类,是促进医院信息化发展的一个重要途径。本研究提出一种基于注意力机制的双层次文本分类模型,用于对生物医学文本进行有效分类。该模型结合卷积神经网络与循环神经网络的优势,对用户输入的疾病文本进行特征提取。首先,在第一层次通过Bi-GRU通道与Bi-LSTM通道提取文本中的上下文关联信息,同时,为增强模型的特征提取能力,在该层次引入注意力机制。其次,将两个通道提取到的时序特征进行特征拼接,并将拼接后的结果传入第二层次,从而进一步提取文本的局部特征,最后利用分类器输出最终的分类结果。对生物医学文本进行分类性能评估,结果表明,与基线模型相比,该模型的分类准确率可达91.45%,具有显著的分类性能。 展开更多
关键词 生物医学文本 注意力机制 卷积神经网络 循环神经网络 文本分类
下载PDF
跨文化生物医学文本的语言学方法和应用
13
作者 范健 《科教文汇》 2013年第2期80-81,共2页
本文介绍了在生物学英文文本纷繁芜杂的当今,面对中英文本的文化差异,生物医学自然语言处理(Natural Language processing for Biology,BioNLP)的基本概念和方法。归纳总结了BioNLP在挖掘生物医学文献信息中的重要方面。通过研究实例分... 本文介绍了在生物学英文文本纷繁芜杂的当今,面对中英文本的文化差异,生物医学自然语言处理(Natural Language processing for Biology,BioNLP)的基本概念和方法。归纳总结了BioNLP在挖掘生物医学文献信息中的重要方面。通过研究实例分析了常见的以"词"、"句"、"篇"为语言单位的分析方法并指出这些方法的局限性,最后展望了生物医学计算语言学研究趋势。 展开更多
关键词 计算语言学生物医学自然语言处理文本挖掘 跨文化
下载PDF
利用膜粒子群优化和信息熵的医学文本特征选择 被引量:4
14
作者 豆增发 高琳 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第4期45-51,共7页
针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作... 针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作为进化规则.作为进化规则的粒子群优化算法,分别以局部搜索速率和全局搜索速率搜索得到文本信息熵最大的解,并在不同膜区域之间传递搜索结果,直到膜区域之间的消息传递结束或者达到限定的迭代次数.实验结果表明,利用提出的方法对医学文本特征进行选择后,对其进行分类,能使分类精确度和召回率分别提高2%和3%左右. 展开更多
关键词 膜系统 粒子群优化 生物医学文本 特征选择 信息熵
下载PDF
生物医学实体关系抽取的研究 被引量:5
15
作者 吴明智 崔雷 《中华医学图书情报杂志》 CAS 2010年第5期5-10,共6页
人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚。作为生物医学研究成果载体的文献呈指数增长,已成... 人类基因组计划使生物医学的研究取得了前所未有的成就,在研究结果中得到了大量的生物医学实体,如基因、蛋白质、器官、疾病和药物等,但这些生物实体之间存在什么样的关系仍不完全清楚。作为生物医学研究成果载体的文献呈指数增长,已成为科研人员获取知识的瓶颈。文本挖掘能够解决信息超载问题,故对生物医学实体关系的挖掘流程和评价指标进行介绍,对生物医学文本挖掘在研究生物实体关系抽取中采用的基于统计的方法、基于自然语言处理的方法和基于模式匹配的方法进行了阐述,对各种方法进行了综合比较,同时介绍了国内外相关研究。 展开更多
关键词 生物医学文本挖掘 生物医学实体 关系抽取
下载PDF
生物翻译:环境界之间的翻译
16
作者 卡莱维.库尔 彼得.特洛普 钱亚旭 《鄱阳湖学刊》 2014年第4期15-21,共7页
重新界定翻译的概念,让我们有可能实现与非人类符号系统间的翻译转换。翻译技术能够在具有符号体系的生命体间传输生物文本(biotext)的意义,同时又不破坏它,因此生物学家的目标之一即是掌握通过翻译技术理解生命体的生物学方法。有别于... 重新界定翻译的概念,让我们有可能实现与非人类符号系统间的翻译转换。翻译技术能够在具有符号体系的生命体间传输生物文本(biotext)的意义,同时又不破坏它,因此生物学家的目标之一即是掌握通过翻译技术理解生命体的生物学方法。有别于真正的翻译(eutranslation),生物翻译存在于生命体环境界间信息传递的宏观层面上,既包括种内(intraspecific)翻译,有时又包括种间(interspecific)翻译。把翻译界定为环境界间的信息传递涵盖了语言翻译的概念,但就句法而言,生物翻译与人类的语言翻译具有一定差异,它在较低的程度上呈现,因此,本文在生物语境中引入了前句法(prosyntax)这一概念。 展开更多
关键词 生物翻译 生物文本 环境界 前句法
下载PDF
国际生物医学科学数据审编研究热点探析
17
作者 侯丽 吴萌 +1 位作者 侯震 李姣 《医学信息学杂志》 CAS 2017年第5期74-79,共6页
以2015-2016年两届国际生物医学审编会议上领域专家讨论的报告和会议论文集,以及PubMedCentral中近5年来有关Biocuration和Data Biocuration的研究文献为数据源,采用内容分析法对生物医学科学数据审编的研究主题进行分析、归纳和总结,... 以2015-2016年两届国际生物医学审编会议上领域专家讨论的报告和会议论文集,以及PubMedCentral中近5年来有关Biocuration和Data Biocuration的研究文献为数据源,采用内容分析法对生物医学科学数据审编的研究主题进行分析、归纳和总结,重点从Biocuration的工作机制、生物医学数据标准构建与应用、集成与可视化、审编与应用、生物医学文本挖掘等方面进行梳理,以期为我国生物医学科学数据审编的发展提供国际经验。 展开更多
关键词 生物医学数据 数据审编 生物医学文本挖掘 生物医学数据标准与本体
下载PDF
面向生物医学实体链接的联合式学习方法 被引量:6
18
作者 胡宇 申德荣 +1 位作者 聂铁铮 寇月 《计算机学报》 EI CAS CSCD 北大核心 2022年第4期748-765,共18页
生物医学文本蕴含着丰富的探索价值,其为生物医学工作者进行研究提供了宝贵的领域知识.充分且高效地利用海量的生物医学文献,并从中发现重要的隐藏信息、获取专业领域知识,对生物医学研究具有重要的意义.生物医学实体链接是对生物医学... 生物医学文本蕴含着丰富的探索价值,其为生物医学工作者进行研究提供了宝贵的领域知识.充分且高效地利用海量的生物医学文献,并从中发现重要的隐藏信息、获取专业领域知识,对生物医学研究具有重要的意义.生物医学实体链接是对生物医学文本中的命名实体进行识别,并将表示该实体的某些字符串映射到生物医学领域知识库中对应概念.生物医学实体链接任务通常面临两个主要的挑战:(1)自然语言描述的歧义性.(2)自然语言文本与生物医学知识库的异构性.传统的方法基于特征选择或规则发现,依赖于手动选择特征或定义规则,处理分阶段模型中也可能出现误差传播.因此,本工作提出了一种深度学习和知识库相结合的实体链接方法,通过深度挖掘自然语言文本的隐藏特征,及其与知识库概念图间结构的相似性,将生物医学实体识别与实体-概念对齐两个任务进行联合式处理.该方法旨在通过标准的生物医学知识库,自动获取生物医学实体的语义信息,挖掘生物医学实体之间的语义关系.实验表明,该方法在实体识别与对齐方面取得了较好的效果,显著提高了任务的精确性,在实体链接核心任务上取得了超过10%的性能提升. 展开更多
关键词 实体识别 实体对齐 语义分析 生物医学文本挖掘 生物医学知识库
下载PDF
基于改进二进制粒子群优化的特征选择 被引量:1
19
作者 豆增发 《现代导航》 2014年第3期214-218,共5页
为了在文本数据中选择有效的文本特征,本文提出一种新的基于改进二进制粒子群优化的特征选择算法,该算法利用翻转角度,局部翻转因子和全局翻转因子来决定粒子群的进化,通过求解目标函数的最优解,得到二进制特征选择系数,选择特征选择系... 为了在文本数据中选择有效的文本特征,本文提出一种新的基于改进二进制粒子群优化的特征选择算法,该算法利用翻转角度,局部翻转因子和全局翻转因子来决定粒子群的进化,通过求解目标函数的最优解,得到二进制特征选择系数,选择特征选择系数为1的特征为有效特征。实验证明,该方法不仅有效地降低了运算开销,而且提高了文本分类的准确度。 展开更多
关键词 二进制粒子群优化 特征选择 生物文本分类
下载PDF
利用膜粒子群优化的条件随机域特征选择 被引量:3
20
作者 豆增发 高琳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2012年第5期107-112,共6页
提出了一种新的基于膜粒子群优化的特征选择方法.该方法利用了膜系统的分层结构和消息传递机制,将粒子群优化算法作为区域子算法部署到各个区域中.不同于传统粒子群优化算法,该方法将粒子群优化的搜索速率分解为局部搜索速率和全局搜索... 提出了一种新的基于膜粒子群优化的特征选择方法.该方法利用了膜系统的分层结构和消息传递机制,将粒子群优化算法作为区域子算法部署到各个区域中.不同于传统粒子群优化算法,该方法将粒子群优化的搜索速率分解为局部搜索速率和全局搜索速率.膜系统的所有外层区域采用局部搜索速率,搜索局部最优解;最内层区域采用全局搜索速率,搜索全局最优解.所有外部区域将最优解传递给相邻内部区域,内部区域将最差解传递给相邻外部区域,最内区域向相邻外部区域传递最差解.当各个区域之间的解传递在一段时间内停止时,或者算法迭代次数达到限定次数时,算法收敛,取最内层区域的最优解为最终解.以条件随机域模型的最大似然估计函数为目标函数,利用膜粒子群优化计算各个特征权重系数,最后剔除那些权重系数小于阈值的特征.实验结果表明,在进行生物文本的基因名称识别时,利用该方法对条件随机域的特征进行选择后,可以消除冗余特征的干扰,能获得更高的准确度。 展开更多
关键词 膜系统 粒子群优化 生物医学文本 特征选择 条件随机域
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部