在医疗领域,普遍存在的数据缺失现象会加剧构建临床预测模型的难度.针对某些具有重要医学价值的特征因数据缺失率较高而被丢弃的问题,提出基于互信息加权的K近邻填补算法(Weighted KNN Imputation Algorithm Based on Mutual Informatio...在医疗领域,普遍存在的数据缺失现象会加剧构建临床预测模型的难度.针对某些具有重要医学价值的特征因数据缺失率较高而被丢弃的问题,提出基于互信息加权的K近邻填补算法(Weighted KNN Imputation Algorithm Based on Mutual Information,MIW-KNN).首先,在心力衰竭合并艰难梭菌感染患者的数据集上,与多重插补法、K近邻(K-nearest neighbor,KNN)填补法、均值法等方法进行对比验证所提出方法的有效性.其次,对比不同模型的死亡风险预测效果以验证所提出方法的性能优势.通过单变量分析法所筛选的20个特征,根据9种机器学习算法分别构建预测模型.采用AUC(Area Under the Receiver Operating Characteristic Curve)与准确率作为主要指标以评估模型的性能,通过SHAP(Shapley Additive Explanations)解释分析不同临床特征对模型的影响.最终表明,MIW-KNN算法具有最高的填补精度,基于该方法填补的数据集所构建的随机森林模型实现了最佳的预测性能.AUC为0.841,准确率为0.821.SHAP显示红细胞宽度、晶体输注、白细胞计数是最具影响力的前三个特征.展开更多
保证光伏电池始终输出最大功率的前提是准确定位光伏电池最大功率点,为此研究基于仿真电路模拟器(simulation program with integrated circuit emphasis,SPICE)模型与互信息的光伏电池最大功率点定位算法。通过基于SPICE模型的光伏电...保证光伏电池始终输出最大功率的前提是准确定位光伏电池最大功率点,为此研究基于仿真电路模拟器(simulation program with integrated circuit emphasis,SPICE)模型与互信息的光伏电池最大功率点定位算法。通过基于SPICE模型的光伏电池建模方法,将光伏电池电路网表、最大功率点电压、最大功率点电流、开路电压、短路电流数据输入SPICE模型,构建光伏电池模型,仿真拟合光伏电池运行状态;由基于最大互信息的最大功率点定位算法,将最大互信息值设成最大功率点定位的测度指标,使用改进新型狮群算法,检索光伏电池模型电路中满足最大互信息值约束条件的最大功率点。研究表明,此算法可利用SPICE模型准确仿真分析电池运行状态;最大功率点定位时,定位偏差最大值仅有0.1 W;在光伏电池功率调控任务中,此算法辅助定位后,光伏电池功率调控振荡较小,说明定位精度可满足使用需求。展开更多
为了更好地实现图像拼接的实时性、提高特征点匹配的效率和图像拼接的准确度,本文提出了一种基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)与互信息的图像拼接算法.首先,为了图像拼接的实时性,用ORB(Orient...为了更好地实现图像拼接的实时性、提高特征点匹配的效率和图像拼接的准确度,本文提出了一种基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)与互信息的图像拼接算法.首先,为了图像拼接的实时性,用ORB(Oriented FAST and Rotated BRIEF)算法快速提取特征点,在此基础上利用DBSCAN聚类算法快速构建邻接图,通过邻接图估算图像的重叠区域;然后,用二值化互信息与欧式距离方法相结合的筛选方法,实现特征点的粗匹配,该方法可以提高特征点匹配准确度,此外根据估算的重叠区域,可以提高特征点匹配的效率;最后,用改进的RANSAC算法,计算出更精确的变换矩阵,使图像拼接的结果更准确.实验证明该方法能够实时的、高效的、精准的实现图像拼接.展开更多
文摘在医疗领域,普遍存在的数据缺失现象会加剧构建临床预测模型的难度.针对某些具有重要医学价值的特征因数据缺失率较高而被丢弃的问题,提出基于互信息加权的K近邻填补算法(Weighted KNN Imputation Algorithm Based on Mutual Information,MIW-KNN).首先,在心力衰竭合并艰难梭菌感染患者的数据集上,与多重插补法、K近邻(K-nearest neighbor,KNN)填补法、均值法等方法进行对比验证所提出方法的有效性.其次,对比不同模型的死亡风险预测效果以验证所提出方法的性能优势.通过单变量分析法所筛选的20个特征,根据9种机器学习算法分别构建预测模型.采用AUC(Area Under the Receiver Operating Characteristic Curve)与准确率作为主要指标以评估模型的性能,通过SHAP(Shapley Additive Explanations)解释分析不同临床特征对模型的影响.最终表明,MIW-KNN算法具有最高的填补精度,基于该方法填补的数据集所构建的随机森林模型实现了最佳的预测性能.AUC为0.841,准确率为0.821.SHAP显示红细胞宽度、晶体输注、白细胞计数是最具影响力的前三个特征.
文摘保证光伏电池始终输出最大功率的前提是准确定位光伏电池最大功率点,为此研究基于仿真电路模拟器(simulation program with integrated circuit emphasis,SPICE)模型与互信息的光伏电池最大功率点定位算法。通过基于SPICE模型的光伏电池建模方法,将光伏电池电路网表、最大功率点电压、最大功率点电流、开路电压、短路电流数据输入SPICE模型,构建光伏电池模型,仿真拟合光伏电池运行状态;由基于最大互信息的最大功率点定位算法,将最大互信息值设成最大功率点定位的测度指标,使用改进新型狮群算法,检索光伏电池模型电路中满足最大互信息值约束条件的最大功率点。研究表明,此算法可利用SPICE模型准确仿真分析电池运行状态;最大功率点定位时,定位偏差最大值仅有0.1 W;在光伏电池功率调控任务中,此算法辅助定位后,光伏电池功率调控振荡较小,说明定位精度可满足使用需求。
文摘为了更好地实现图像拼接的实时性、提高特征点匹配的效率和图像拼接的准确度,本文提出了一种基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)与互信息的图像拼接算法.首先,为了图像拼接的实时性,用ORB(Oriented FAST and Rotated BRIEF)算法快速提取特征点,在此基础上利用DBSCAN聚类算法快速构建邻接图,通过邻接图估算图像的重叠区域;然后,用二值化互信息与欧式距离方法相结合的筛选方法,实现特征点的粗匹配,该方法可以提高特征点匹配准确度,此外根据估算的重叠区域,可以提高特征点匹配的效率;最后,用改进的RANSAC算法,计算出更精确的变换矩阵,使图像拼接的结果更准确.实验证明该方法能够实时的、高效的、精准的实现图像拼接.