期刊文献+
共找到63篇文章
< 1 2 4 >
每页显示 20 50 100
基于深度学习的非结构化医学文本知识抽取
1
作者 耿飙 梁成全 +1 位作者 魏炜 朱长元 《计算机工程与设计》 北大核心 2024年第1期177-186,共10页
为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head... 为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head attention机制,采用CRF模型根据相邻标签的相互依赖关系得到最优预测序列。旨在将非结构化的医学文本转换成结构化的数据,在阿里云天池中文糖尿病标注数据集上进行综合实验,实验结果表明,该模型在医学文本知识抽取中具有优越的性能。 展开更多
关键词 深度学习 非结构化文本 医学文本 知识抽取 实体识别 关系抽取 序列标注
下载PDF
面向中文医学文本的知识图谱通用评测系统设计 被引量:1
2
作者 林晓兰 梁铭标 +8 位作者 王浩 张志辉 江之晗 麻硕 钱鹏 谷祥拓 陈秀娟 黄帅 梁会营 《医疗卫生装备》 CAS 2023年第1期13-18,共6页
目的:设计一种面向中文医学文本的知识图谱通用评测系统,以为医学研究人员、医疗机构及企业评估知识图谱技术水平提供手段。方法:该系统以医学专家人工标注的标准评测数据集为基础,以深度学习算法模型为支撑,采用浏览器/服务器(Browser/... 目的:设计一种面向中文医学文本的知识图谱通用评测系统,以为医学研究人员、医疗机构及企业评估知识图谱技术水平提供手段。方法:该系统以医学专家人工标注的标准评测数据集为基础,以深度学习算法模型为支撑,采用浏览器/服务器(Browser/Server,B/S)架构设计,采用Python 3.7编程,由评测任务以及数据集配置与管理、知识图谱任务评测、评测指标记录与对比3个功能模块组成。结果:采用该系统可以根据知识图谱评测需求自定义评测项目,灵活配置必选和可选的评测内容,且在评测后可以提供单方面或者综合能力的量化成绩。结论:该系统解决了医学知识图谱领域面临的无法评估技术性能水平的痛点,为医学领域的知识图谱评测提供了参考。 展开更多
关键词 医学文本 知识图谱 知识图谱评测 深度学习
下载PDF
目的论框架下不同类别医学文本的翻译策略
3
作者 黄闰润 《英语广场(学术研究)》 2023年第34期42-45,共4页
医学文本作为科学文本的一部分,其翻译的主要目标是信息传递。不同类型的医学文本之间存在着一些微妙的差异。当前医学翻译处于市场环境中,客户需求是职业译者首要考虑的因素。本文选取五种常见医学文本类别,在目的论框架下以客户需求... 医学文本作为科学文本的一部分,其翻译的主要目标是信息传递。不同类型的医学文本之间存在着一些微妙的差异。当前医学翻译处于市场环境中,客户需求是职业译者首要考虑的因素。本文选取五种常见医学文本类别,在目的论框架下以客户需求为中心,确定翻译目的,并根据目的分析适用的翻译策略。 展开更多
关键词 目的论 客户需求 医学文本翻译
下载PDF
中文生物医学文本无词典分词方法研究 被引量:4
4
作者 王军辉 胡铁军 +2 位作者 李丹亚 钱庆 方安 《情报学报》 CSSCI 北大核心 2011年第2期197-203,共7页
为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取... 为了在不利用词典的条件下实现对中文生物医学文本的有效切分,结合中文生物医学文本专业术语多、新术语不断出现和结构式摘要的特点,引入一种基于重现原理的无词典分词方法,并在实际应用过程中从分词长度上限值的设定和层次特征项抽取两方面对其进行了改进.实验结果表明,该方法可以在不需要词典和语料库学习的情况下,实现对生物医学文本中关键性专业术语的有效抽取,分词准确率约为84.51%.最后,基于本研究中的分词结果,对生物医学领域的词长分布进行了初步探讨,结果表明中文生物医学领域的词长分布与普通汉语文本有非常大的差异.研究结果对在处理中文生物医学文本时N-gram模型中N值的确定具有一定的参考价值. 展开更多
关键词 无词典分词 结构式摘要 生物医学文本
下载PDF
利用膜粒子群优化和信息熵的医学文本特征选择 被引量:4
5
作者 豆增发 高琳 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第4期45-51,共7页
针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作... 针对生物医学文本挖掘中有效特征选择困难的问题,提出了一种新的基于膜粒子群优化和信息熵的文本特征选择方法.该方法以文本信息熵总和为目标函数,以膜系统的层次结构作为框架,以膜系统的消息传递机制作为进化方向,以粒子群优化进化作为进化规则.作为进化规则的粒子群优化算法,分别以局部搜索速率和全局搜索速率搜索得到文本信息熵最大的解,并在不同膜区域之间传递搜索结果,直到膜区域之间的消息传递结束或者达到限定的迭代次数.实验结果表明,利用提出的方法对医学文本特征进行选择后,对其进行分类,能使分类精确度和召回率分别提高2%和3%左右. 展开更多
关键词 膜系统 粒子群优化 生物医学文本 特征选择 信息熵
下载PDF
子宫内膜癌相关基因的生物医学文本分析研究 被引量:2
6
作者 张凯 刘玲玲 薛凤霞 《中华医学图书情报杂志》 CAS 2019年第6期1-8,共8页
目的:寻找与子宫内膜癌发生、发展相关的关键基因。方法:从医学信息检索平台Coremine Medical中筛选出与子宫内膜癌关系最为密切的几种关键基因,再利用生物医学文本挖掘工具Chilibot对从Pub Med中获取的相关文献摘要进行分析,深入探究... 目的:寻找与子宫内膜癌发生、发展相关的关键基因。方法:从医学信息检索平台Coremine Medical中筛选出与子宫内膜癌关系最为密切的几种关键基因,再利用生物医学文本挖掘工具Chilibot对从Pub Med中获取的相关文献摘要进行分析,深入探究关键基因与子宫内膜癌之间的相互关系,并通过UALCAN在线工具分析关键基因的表达水平和甲基化水平。结果:确定了与子宫内膜癌关系最密切的5种关键基因。在子宫内膜癌组织中,MLH1基因的甲基化水平比正常子宫内膜组织的甲基化水平要高(P<0. 001),MLH1基因甲基化的发生导致了DNA错配修复基因的突变,从而促进了子宫内膜癌的发生。与正常子宫内膜组织相比,MSH2基因和PMS2基因在子宫内膜癌组织中表达量较高(P<0. 001),MSH6基因和抑癌基因PTEN在子宫内膜癌组织中的表达均比正常子宫内膜组织表达要低(P<0. 001)。错配修复基因MLH1、MSH2、MSH6以及PMS2的突变,促进了相应修复蛋白的缺失,进而导致了子宫内膜癌的发生、发展。结论:错配修复基因MLH1、MSH2、MSH6、PMS2以及抑癌基因PTEN是子宫内膜癌发生、发展的关键基因。 展开更多
关键词 生物医学文本挖掘 子宫内膜癌 关键基因 Coremine MEDICAL Chilibot
下载PDF
基于生物医学文本挖掘工具的白血病和基因关系研究 被引量:2
7
作者 朱祥 张云秋 冯佳 《中华医学图书情报杂志》 CAS 2015年第10期28-32,共5页
利用COREMINE Medical寻找与白血病相关的基因,确定关系最为密切的5种基因,再通过生物医学文本挖掘工具Chilibot对从Pub Med中所获相关文献的摘要进行分析,通过对相互作用的深入分析,发现了白血病和基因的相互作用关系。
关键词 生物医学文本挖掘 白血病 基因 COREMINE MEDICAL Chilibot
下载PDF
Lattice LSTM神经网络法中文医学文本命名实体识别模型研究 被引量:9
8
作者 王博冉 林夏 +2 位作者 朱晓东 朱万琳 马学华 《中国卫生信息管理杂志》 2019年第1期84-88,共5页
目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword)... 目的探索利用点阵(lattice)长短期记忆(long short term mermory network,LSTM)神经网络构建命名实体识别(named entity recognition,NER)模型解决中文医学文本的信息提取问题。方法利用Lattice LSTM来表征句子中的词汇词(lexiconword),从而将潜在词信息整合到基于字符的长短期记忆网络—条件随机场(long short term memory-conditional random?eld,LSTM-CRF)模型中。进一步使用一个大型自动获取的词典来匹配句子,进而构建基于词的Lattice。利用Lattice LSTM结构自动控制从句子开头至结尾的信息流。结果门控单元可用于将来自不同路径的信息动态传送到每个字符。在NER数据基础上进行训练后,LatticeLSTM能够学会从语境中自动找到更有用的词汇,以取得更好的NER性能。结论与基于字符和词的NER方法相比,本文所提出的模型优势在于利用显性词汇信息而不是字符序列进行标注,同时较少出现分词误差。 展开更多
关键词 神经网络 中文医学文本 命名实体识别
下载PDF
生态翻译学视域下的医学文本翻译研究 被引量:3
9
作者 闫秀静 刘瑛 +1 位作者 兰长江 丁坤敏 《福建茶叶》 2019年第6期156-156,共1页
医学文本的翻译研究是医学领域进行学术交流的关键,也是医学学术领域重要的组合部分,在我国医学领域不断进步和发展的过程中,对生态翻译学医学文本翻译研究也更加重视。医学文本翻译中翻译者要懂得翻译主体的转化,能够灵活翻译中医学文... 医学文本的翻译研究是医学领域进行学术交流的关键,也是医学学术领域重要的组合部分,在我国医学领域不断进步和发展的过程中,对生态翻译学医学文本翻译研究也更加重视。医学文本翻译中翻译者要懂得翻译主体的转化,能够灵活翻译中医学文本的文化内涵与专业理论,这个过程中翻译和适应贯穿于整个过程,两者相互交织、相互作用,从而更好的呈现出翻译内容,展现翻译的动态与平衡美。本文以生态翻译学为视角,对医学文本翻译进行相关研究。 展开更多
关键词 生态翻译学 医学文本翻译 选择 适用
下载PDF
基于全文索引与余弦公式医学文本相似性分析 被引量:1
10
作者 谢翠萍 陈家益 白金山 《微型电脑应用》 2014年第1期25-27,共3页
医学文本相似性问题是医学文本挖掘中的重要内容,如何能够快速计算出大数据量下的医学文本的相似性情况是医学文本相似性计算的重点。针对基于传统余弦公式医学文本相似性分析算法在性能上的缺陷,提出了一种基于全文索引技术与余弦公式... 医学文本相似性问题是医学文本挖掘中的重要内容,如何能够快速计算出大数据量下的医学文本的相似性情况是医学文本相似性计算的重点。针对基于传统余弦公式医学文本相似性分析算法在性能上的缺陷,提出了一种基于全文索引技术与余弦公式医学文本相似性分析算法,对医学文本相似性进行分析。采用全文索引技术对医学文本数据相关关键词进行索引,并根据若干关键词在索引中检索出部分数据,从而减少计算复杂度,提高效率。实验表明,该方法比基于传统余弦公式医学文本相似性分析算法具有更优的性能。 展开更多
关键词 医学文本相似性 余弦公式 全文索引 文本挖掘 向量空间模型
下载PDF
自然语言处理在医学文本挖掘中的应用 被引量:4
11
作者 王勇 李帅 《电子技术与软件工程》 2019年第7期190-190,共1页
随着医学领域的发展,医学文本数据积累越来越多,需要使用合理的方式来挖掘其价值。本文首先简单介绍了自然语言处理技技术,随后对自然语言处理在医学文本挖掘中的应用进行了分析研究,以供参考。
关键词 医学文本 自然语言处理 人工智能
下载PDF
CHIP2020评测任务1概述:中文医学文本命名实体识别 被引量:3
12
作者 李雯昕 张坤丽 +4 位作者 关同峰 张欢 朱田恬 常宝宝 陈清财 《中文信息学报》 CSCD 北大核心 2022年第4期66-72,共7页
第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体... 第六届中国健康信息处理会议(China Conference on Health Information Processing,CHIP2020)组织了中文医疗信息处理方面的6个评测任务,其中任务1为中文医学文本命名实体识别任务,该任务的主要目标是自动识别医学文本中的医学命名实体。共有253支队伍报名参加评测,最终37支队伍提交了80组结果,该评测以微平均F_(1)值作为最终评估标准,提交结果中最高值达68.35%。 展开更多
关键词 命名实体识别 医学文本 自然语言处理
下载PDF
基于隐含主题和语义树的医学文本自动批注 被引量:1
13
作者 李博 文敦伟 +1 位作者 王珂 刘景鑫 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第1期234-239,共6页
针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究... 针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究相关联,设计出一种基于潜在狄利克雷分配和潜在语义树模型的文本处理方法,可针对不同类型的医学文本生成有一定可读性的自动批注。该方法形成的自动批注主观性低,其准确度和可读性均高于关键词模型的处理结果,可辅助医生进行医学文本的批注和分类,从而减轻其工作量。程序结果表明,该方法目前可应用于对医学图像所见形成诊断意见、对病人病历进行摘要形成和对病症描述给出对症处方等方面,批注的语义匹配度可达67.7%,文本的平均可读性为60.02%。 展开更多
关键词 信息处理技术 医学文本 自动批注 潜在狄利克雷分配 潜在语义分析 语义树
下载PDF
国外生物医学文本语料库分类及特点研究 被引量:2
14
作者 晏归来 安新颖 +1 位作者 范少萍 周永称 《医学信息学杂志》 CAS 2018年第10期74-80,共7页
通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究... 通过梳理国外31个生物医学文本语料库标注内容,根据语料库标注实体类型,参照UMLS语义类型将其划分为6大类。总结语料库在语义类型、数据源等方面特点,阐述生物医学文本语料库构建流程及关键步骤,以期为我国生物医学文本语料库相关研究奠定基础。 展开更多
关键词 生物医学文本语料库 语义类型 语义关系
下载PDF
CHIP 2020评测任务2概述:中文医学文本实体关系抽取 被引量:2
15
作者 甘子发 昝红英 +5 位作者 关同峰 李雯昕 张欢 朱田恬 穗志方 陈清财 《中文信息学报》 CSCD 北大核心 2022年第6期101-108,共8页
第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关... 第六届中国健康信息处理会议(China conference on Health Information Processing,CHIP 2020)组织了中文医疗信息处理方面的6个评测任务,其中任务2为中文医学文本实体关系抽取任务,该任务的主要目标为自动抽取中文医学文本中的实体关系三元组。共有174支队伍参加了评测任务,最终17支队伍提交了42组结果,该任务以微平均F_(1)值为最终评估标准,提交结果中F_(1)最高值达0.6486。 展开更多
关键词 实体关系抽取 中文医学文本处理 信息抽取
下载PDF
医学文本表示学习方法与质量评测研究综述 被引量:1
16
作者 刘晓聪 王华珍 +2 位作者 何霆 缑锦 陈坚 《计算机应用研究》 CSCD 北大核心 2021年第7期1930-1936,1946,共8页
为了及时掌握医学文本表示学习的研究现状,对其现有研究进行系统全面综述。首先,基于技术范式对现有技术进行分类,分别从基于统计学习的方法、基于知识图谱表示的方法和基于图表示的方法,对医学文本表示学习主流方法和相应的代表性成果... 为了及时掌握医学文本表示学习的研究现状,对其现有研究进行系统全面综述。首先,基于技术范式对现有技术进行分类,分别从基于统计学习的方法、基于知识图谱表示的方法和基于图表示的方法,对医学文本表示学习主流方法和相应的代表性成果进行总结。然后,提出了运用定量和定性的质量评测体系,系统地梳理和总结了医学文本表示学习的质量评测方法。最后,对医学文本表示学习的研究趋势进行了展望。 展开更多
关键词 医学文本 表示学习 知识图谱表示学习 图表示学习 质量评测
下载PDF
基于距离学习的生物医学文本聚类算法研究 被引量:1
17
作者 袁伟 朱山风 《计算机应用与软件》 CSCD 2010年第11期4-5,19,共3页
近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对... 近年来,随着生物医学文献数量的大量增加,对生物医学文献进行搜索和挖掘,查找有用的信息成为了生物信息学的一个重要研究方向。聚类作为一种无监督的自动化程度很高的机器学习方法,在信息检索和生物信息学领域中获得了广泛的运用。针对生物医学文本的特点提出了基于距离学习的聚类算法,实验结果证明了该方法的有效性。 展开更多
关键词 向量空间模型 文本聚类 生物医学文本
下载PDF
基于医学大数据的预训练语言模型及其医学文本分类研究 被引量:2
18
作者 黄敏婷 赵静 于涛 《中华医学图书情报杂志》 CAS 2020年第11期39-46,共8页
目的:构建基于医学文本的预训练语言模型,以解决基于通用语料的预训练语言模型不适应医学文本分类的问题。方法:使用PubMed医学论文摘要数据和PMC医学论文全文数据在通用预训练语言模型Bert上进行二次预训练,得到医学领域的预训练语言模... 目的:构建基于医学文本的预训练语言模型,以解决基于通用语料的预训练语言模型不适应医学文本分类的问题。方法:使用PubMed医学论文摘要数据和PMC医学论文全文数据在通用预训练语言模型Bert上进行二次预训练,得到医学领域的预训练语言模型BioBert,使用标注好的文本数据对BioBert进行微调,得到最终的医学文本分类模型。结果:病历文本和医学论文摘要文本两个数据集的分类实验显示,经过医学文本二次预训练的预训练语言模型在两个数据集上都取得了较好的分类效果。结论:通过自训练的方式对大量医学文本进行预训练得到的医学领域预训练语言模型,能在一定程度上解决使用通用预训练语言模型无法很好适配医学文本分布而导致分类性能偏低的问题。 展开更多
关键词 医学文本 预训练语言模型 文本分类
下载PDF
基于指针标注的中文医学文本实体关系抽取研究 被引量:1
19
作者 罗文龙 王勇 《计算机科学与应用》 2022年第1期169-177,共9页
随着医学领域科学技术的不断发展,产生了大量的医学文本数据,如何从海量的非结构化数据中获取有效的信息成为医学和自然语言处理的研究热点。作为信息抽取的关键一环,实体关系抽取可以获取自然语言句子中实体对及其之间的语义关系。当... 随着医学领域科学技术的不断发展,产生了大量的医学文本数据,如何从海量的非结构化数据中获取有效的信息成为医学和自然语言处理的研究热点。作为信息抽取的关键一环,实体关系抽取可以获取自然语言句子中实体对及其之间的语义关系。当前中文医学文本的实体关系抽取方法存在词组信息缺失和关系重叠等问题,基于此,本文提出了一个Flat-Lattice-指针标注联合抽取模型。利用相对位置对词组信息进行编码,增强实体边界,并通过指针标注框架,将关系作为一种主实体到客实体的映射函数,解决了关系重叠的问题。在中文医学文本数据集上与多个基准模型进行对比,证明了该模型在中文医学文本实体关系抽取上的有效性,其准确率、召回率和F1值均高于基准模型。 展开更多
关键词 实体关系抽取 中文医学文本 关系重叠 词组信息
下载PDF
基于双代价参数SVM的生物医学文本指代消解研究
20
作者 张丽君 李丽双 范国龙 《大连理工大学学报》 EI CAS CSCD 北大核心 2015年第4期405-410,共6页
生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于... 生物医学文本中的指代消解是生物医学信息抽取领域的一个重要组成部分.通过引入双代价参数对基本SVM方法进行改进,并在FlyBase语料集上进行了测试,准确率、召回率、F值分别达到53.9%、69.5%、60.7%.同时研究了特征向量的选择和取值对于实验结果的影响.最后与其他先进方法进行了对比.结果表明,在同样的语料上,基于双代价参数SVM方法优于其他先进的方法. 展开更多
关键词 生物医学文本 指代消解 SVM 双代价参数
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部