期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种融合PLSA模型和树模型的文本病历语义分析新方法
1
作者 黄文博 燕杨 李博 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2013年第4期666-670,共5页
将文本语义分析领域中的概率潜语义分析(PLSA)模型和语义树模型进行融合,设计一种新模型,并将其应用在文本病历语义分析上,较好地解决了文本病历语义分析过程中存在的"多词一义"情况,降低了语义维度,简化了窗口语义树的结构.... 将文本语义分析领域中的概率潜语义分析(PLSA)模型和语义树模型进行融合,设计一种新模型,并将其应用在文本病历语义分析上,较好地解决了文本病历语义分析过程中存在的"多词一义"情况,降低了语义维度,简化了窗口语义树的结构.通过语义分解和语义检索实验证明了该模型在文本病历语义分析上的优势. 展开更多
关键词 PLSA-tree模型 文本病历 语义分析 新方法
下载PDF
中文病历文本分词方法研究 被引量:8
2
作者 李国垒 陈先来 +1 位作者 夏冬 杨荣 《中国生物医学工程学报》 CAS CSCD 北大核心 2016年第4期477-481,共5页
探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义词典、ICTCLAS+统计分词和ICTCLAS+自定义词典结合互信息统计分词4种策略,对1 500份出院记录中的病历文... 探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义词典、ICTCLAS+统计分词和ICTCLAS+自定义词典结合互信息统计分词4种策略,对1 500份出院记录中的病历文本进行分词处理,并从准确率、召回率和综合指标值等3个方面对分词结果进行评价。以人工分词的50份出院记录结果为标准依据,4种分词策略的综合指标值分别为45.77%、58.76%、64.93%和78.06%。结果证实,自定义词典结合基于互信息的统计分词方法,能够有效地对病历中出院记录文本进行分词处理,可以满足临床数据分析的需求,具有良好的推广意义。 展开更多
关键词 病历文本 中文分词 统计分词 词典分词 出院记录
下载PDF
基于医学影像和病历文本的甲状腺多模态语料库构建与应用 被引量:9
3
作者 林玉萍 龙红 +3 位作者 李彪 郭钦钵 王娟 岳婕 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第2期198-206,共9页
多模态语料库作为一种新型计算机辅助医学诊断与学习研究的工具,有利于相似病例的诊治借鉴,但基于直观影像和电子病历标注的多模态医学语料库并不多见,且多数为人工构建,费时费力,如甲状腺等语料库。因此,该文提出了一种基于医学影像和... 多模态语料库作为一种新型计算机辅助医学诊断与学习研究的工具,有利于相似病例的诊治借鉴,但基于直观影像和电子病历标注的多模态医学语料库并不多见,且多数为人工构建,费时费力,如甲状腺等语料库。因此,该文提出了一种基于医学影像和病历文本的甲状腺多模态语料库的自动构建方法。由于甲状腺结节的声像图表现复杂多样以及良恶性判断困难,基于传统深度学习的医学影像分类方法的精度较低,该文提出基于特征筛选的深度学习分类方法去除冗余和噪声特征,提高良恶性分类准确率,并结合自然语言处理方法提取电子病历的关键文本特征信息以构建多模态语料库。实验结果表明,该文提出的分类算法在甲状腺超声影像数据集可以实现甲状腺结节良恶性的精确分类识别,有效构建医学影像与电子病历多模态语料库。该语料库的建立有利于相关案例教学,方便医学生自学有关的医学知识,也为医务工作者更为全面和准确地解读疾病的病理信息提供重要的参考价值。 展开更多
关键词 多模态语料库 深度学习 特征筛选 电子病历文本 自然语言处理
下载PDF
基于电子病历文本的诊疗事件实体抽取研究 被引量:8
4
作者 袁贞明 沈辉 +1 位作者 俞凯 沈伟富 《中国数字医学》 2021年第7期33-38,共6页
目的:在电子病历文本中提取诊疗事件用于判断合理诊疗行为。方法:提出了一种在电子病历文本中抽取诊疗事件实体的方法,将抽取过程分为提取时间表示和提取临床实体两个步骤,首先采用正则表达式完成事件的时间表达提取和规范化,然后使用基... 目的:在电子病历文本中提取诊疗事件用于判断合理诊疗行为。方法:提出了一种在电子病历文本中抽取诊疗事件实体的方法,将抽取过程分为提取时间表示和提取临床实体两个步骤,首先采用正则表达式完成事件的时间表达提取和规范化,然后使用基于BERT-BiLSTM-CRF的深度学习模型提取临床医疗实体。结果:使用中国知识图谱与语义计算会议2019评测任务数据集的1379份电子病历文本进行模型验证,基于正则表达式的时间表达提取方法具有92.76%的综合识别率;基于BERT-BiLSTM-CRF模型的诊疗事件实体识别准确率为83.66%,召回率为87.66%,F1值为85.61%。结论:实验表明本研究的方法具有良好的实体抽取准确率和召回率,可以为基于电子病历文本的合理诊疗行为判断提供帮助。 展开更多
关键词 电子病历文本 诊疗事件抽取 命名实体识别 自然语言处理
下载PDF
数据挖掘在支气管炎电子病历中的应用研究 被引量:1
5
作者 郑丽青 张育嘉 彭剑桥 《数字技术与应用》 2019年第5期55-56,58,共3页
本文针对支气管炎电子病历数据,利用改进的基于统计的中文分词算法、粗糙集和决策树理论对数据做了处理;最后采用改进的Apriori算法进行关联分析,实现“数据-信息-知识-价值”的转变过程。
关键词 电子文本病历 反向最大匹配 APRIORI 关联规则
下载PDF
基于BLSTM网络的医学时间短语识别 被引量:3
6
作者 张顺利 王应军 姬东鸿 《计算机应用研究》 CSCD 北大核心 2020年第4期1059-1062,共4页
从医学文本中识别时间短语是临床医学自然语言处理的关键技术之一。传统基于规则和机器学习的方法需要设计复杂规则和提取特征,而且大多数系统采用串行方法会导致错误的传播。提出了一种基于双向长短时记忆网络(BLSTM)的神经网络架构,... 从医学文本中识别时间短语是临床医学自然语言处理的关键技术之一。传统基于规则和机器学习的方法需要设计复杂规则和提取特征,而且大多数系统采用串行方法会导致错误的传播。提出了一种基于双向长短时记忆网络(BLSTM)的神经网络架构,在识别时间表示式的同时判别它们的类型:首先使用卷积神经网络(CNN)学习得到单词的字符级别向量和大规模生物医学背景语料上训练得到的词向量进行组合作为BLSTM的输入,然后使用BLSTM网络学习单词的上下文语义表示,最后使用条件随机场(CRF)对BLSTM输出的序列进行标签优化。实验基于SemEval-2016 task 12,结果表明没有添加任何特征的神经网络学习方法比该任务中官方提供的最高分的F1值提高了3%。 展开更多
关键词 时间短语 病历文本 长短时记忆网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部