-
题名电子病历文本挖掘研究综述
被引量:42
- 1
-
-
作者
吴宗友
白昆龙
杨林蕊
王仪琦
田英杰
-
机构
中国科学院大学经济与管理学院
中国科学院大学计算机与科学技术学院
中国科学院虚拟经济与数据科学研究中心(中国科学院大学)
中国科学院大数据挖掘与知识管理重点实验室(中国科学院大学)
中国科学院大学中丹学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2021年第3期513-527,共15页
-
基金
国家自然科学基金项目(71731009,61472390)
中国科学院科技服务网络计划项目(KFJ-STS-ZDTP-060)。
-
文摘
电子病历是医院信息化发展的产物,其中包含了丰富的医疗信息和临床知识,是辅助临床决策和药物挖掘等的重要资源.因此,如何高效地挖掘大量电子病历数据中的信息是一个重要的研究课题.近些年来,随着计算机技术尤其是机器学习以及深度学习的蓬勃发展,对电子病历这一特殊领域数据的挖掘有了更高的要求.电子病历综述旨在通过对电子病历研究现状的分析来指导未来电子病历文本挖掘领域的发展.具体而言,综述首先介绍了电子病历数据的特点和电子病历的数据预处理的常用方法;然后总结了电子病历数据挖掘的4个典型任务(医学命名实体识别、关系抽取、文本分类和智能问诊),并且围绕典型任务介绍了常用的基本模型以及研究人员在任务上的部分探索;最后结合糖尿病和心脑血管疾病2类特定疾病,对电子病历的现有应用场景做了简单介绍.
-
关键词
电子病历
自然语言处理
数据挖掘
机器学习
深度学习
-
Keywords
electronic medical records
natural language processing
data mining
machine learning
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多目标数学规划的网络入侵检测方法
被引量:16
- 2
-
-
作者
汪波
聂晓伟
-
机构
中国科学院虚拟经济与数据科学研究中心(中国科学院大学)
中国科学院大数据挖掘与知识管理重点实验室(中国科学院大学)
中国科学院信息安全国家重点实验室(中国科学院信息工程研究所)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第10期2239-2246,共8页
-
基金
国家自然科学基金重点项目(71331005)
国家自然科学基金国际(地区)合作与交流项目(71110107026)
+2 种基金
国家自然科学基金面上项目(11271361
61472390)
国家自然科学基金青年科学基金项目(61402429)
-
文摘
多分类模型常用于解决诸如信用卡客户分析和疾病诊断预测等具有多类情况的现实问题.网络安全中的攻击形式有很多种,这为多分类问题的研究成果提供了很好的应用背景.事实上,如果把建立防火墙来拦截网络攻击看作被动的防御,人们更希望通过借助对网络攻击者行为的分析去进行主动的防御.借助数据挖掘中解决分类问题的基本思想,提出了用多目标数学规划(multi-criteria mathematical programming,MCMP)模型分析多类网络攻击行为的方法.与直接寻找凸规划问题最优解方法不同,该方法通过对相关矩阵的直接运算寻找最优解,大大降低了问题求解的难度.进一步,运用e-支持向量的概念,可以实现对大规模应用问题的计算.同时,使用了核技巧来解决非线性可分的问题.基于一个新近已知的NSL-KDD网络入侵数据集,通过数值实验证实了所提模型可以有效解决网络入侵中的多分类问题,同时达到较高的分类精度和较低的错误报警率.
-
关键词
网络入侵检测
多分类问题
多目标数学规划
e-支持向量
错误报警率
-
Keywords
network intrusion detection
multi-class classification problem
multi-criteria mathematical programming(MCMP)
e-support vector
false alarm rate
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-