期刊文献+
共找到432篇文章
< 1 2 22 >
每页显示 20 50 100
自监督深度学习的心脏磁共振图像配准算法
1
作者 刘子兴 廉钰 +1 位作者 李汉军 唐晓英 《中国医疗设备》 2024年第11期27-32,38,共7页
目的通过使用合成图像的方法解决在配准过程中缺少金标准的问题,并应用深度学习算法进行心脏T_(1)定量图配准。方法首先利用T_(1)加权图像的先验信息合成无运动的参考图像;其次使用DeepIPMCNet卷积神经网络来学习和配准层内运动。另一... 目的通过使用合成图像的方法解决在配准过程中缺少金标准的问题,并应用深度学习算法进行心脏T_(1)定量图配准。方法首先利用T_(1)加权图像的先验信息合成无运动的参考图像;其次使用DeepIPMCNet卷积神经网络来学习和配准层内运动。另一个网络DeepTPMDNet用于检测和消除穿层运动。使用在自由呼吸条件下采集的STONE序列T_(1)映射数据集进行训练、验证和测试,以验证本文方法的有效性。通过T_(1)标准差和SD map标准差来评估性能。结果在配准后,左心室和室间隔的Dice系数、T_(1)标准差和SD map标准差均得到了改善(通过DeepIPMCNet,左心室的Dice系数从0.88提高到0.90,室间隔的T_(1)标准差从121.91 ms降低到86.99 ms,SD map标准差从46.49 ms降低到36.53 ms;通过DeepTPMCNet,左心室的Dice系数从0.74提高到0.93,室间隔的T_(1)标准差从192.02 ms降低到114.37 ms,SD map标准差从93.41 ms降低到50.53 ms),差异均有统计学意义(P<0.001)。结论本研究提出的深度学习方法可有效缓解心脏和呼吸运动对心脏T_(1)定量图的影响。 展开更多
关键词 心脏磁共振(CMR) T_(1)定量图 配准算法 监督深度学习 卷积神经网络 DeepIPMCNet DeepTPMDNet
下载PDF
基于改进Boosting算法的车险理赔额组合模型预测
2
作者 邢铭轩 赵锦艳 《科技与创新》 2024年第9期1-6,共6页
针对车险理赔额预测中单一机器学习方法存在的问题,提出一种基于Optuna调参后的XGBoost(eXtreme Gradient Boosting)-LightGBM(Light Gradient Boosting Machine)组合模型预测方法。首先,分别构建XGBoost与LightGBM单个模型,并使用Optun... 针对车险理赔额预测中单一机器学习方法存在的问题,提出一种基于Optuna调参后的XGBoost(eXtreme Gradient Boosting)-LightGBM(Light Gradient Boosting Machine)组合模型预测方法。首先,分别构建XGBoost与LightGBM单个模型,并使用Optuna框架对模型参数进行优化;其次,将2个优化后的模型预测结果进行加权融合;最后,采用法国第三方责任险的车险保单数对融合模型进行验证。结果表明,与单一的XGBoost和LightGBM模型相比,经过参数优化后的组合模型在预测车险理赔额时展现出更低的均方根误差,从而证明其更高的预测精度。 展开更多
关键词 机器学习 boosting算法 组合模型 Optuna算法
下载PDF
带约束弱监督学习算法的企业专利附图高关联性自动化推荐
3
作者 任鹏 《电子设计工程》 2024年第20期134-139,共6页
常规企业专利附图高关联性自动化推荐主要依托于朴素贝叶斯算法,通过构建图片推荐模型实现自动化推荐。但此方法由于缺少专利文本与附图匹配交互图的建立,导致得到的归一化折损累积增益较小,推荐效果欠佳。为此,提出基于带约束弱监督学... 常规企业专利附图高关联性自动化推荐主要依托于朴素贝叶斯算法,通过构建图片推荐模型实现自动化推荐。但此方法由于缺少专利文本与附图匹配交互图的建立,导致得到的归一化折损累积增益较小,推荐效果欠佳。为此,提出基于带约束弱监督学习算法的企业专利附图高关联性自动化推荐方法。根据企业专利文本与附图之间的匹配关系,采用卷积神经网络对附图的深层次视觉特征进行识别,并设计样本采样策略,建立文本与附图匹配的交互图,结合带约束弱监督学习算法计算企业专利偏好的预测概率向量值,进而构建企业专利配图偏好模型,以此为依据,求取每个附图的综合评分,将评分最高的附图构造为推荐列表,由此实现企业专利附图高关联性自动化推荐。对比实验结果表明,所设计的方法得到的归一化折损累积增益较大,企业专利附图推荐效果较好,可以满足实际应用需求。 展开更多
关键词 带约束弱监督学习算法 企业专利附图 高关联性自动化推荐 附图特征
下载PDF
基于半监督学习代理辅助的混合进化算法
4
作者 任志海 李贞 《科学技术创新》 2024年第12期91-95,共5页
针对目标函数评价昂贵的优化问题,在计算资源有限的情况下很难获得足够数据训练一个准确的全局代理模型,然而,不准确的全局代理模型其潜在优势是可以平滑局部极值点,从而可以引导算法加速找到最优解。另一方面,局部模型虽然不能辅助算... 针对目标函数评价昂贵的优化问题,在计算资源有限的情况下很难获得足够数据训练一个准确的全局代理模型,然而,不准确的全局代理模型其潜在优势是可以平滑局部极值点,从而可以引导算法加速找到最优解。另一方面,局部模型虽然不能辅助算法跳出局部最优,但是其相对于全局模型在局部区域具有较好的拟合效果。本文利用这两类模型的优点,针对计算昂贵问题提出了基于半监督学习代理模型的混合进化算法(SSL-SAHA)。在现有算法的基础上,对局部搜索部分进行了改进。利用在全局搜索过程中建立的集成模型选择一些未真实计算的个体,一起用于训练局部模型,从而提高局部RBF模型的估值准确度。实验结果表明,此算法可以有效求解计算昂贵问题。 展开更多
关键词 代理模型 元启发式算法 全局搜索 局部搜索 监督学习
下载PDF
一种结合半监督Boosting方法的迁移学习算法 被引量:4
5
作者 洪佳明 陈炳超 印鉴 《小型微型计算机系统》 CSCD 北大核心 2011年第11期2169-2173,共5页
迁移学习是数据挖掘中的一个研究方向,试图重用相关领域的数据样本,将相关领域的知识"迁移"到新领域中帮助训练.当前,基于实例的迁移学习算法容易产生过度拟合的问题,不能充分利用相关领域中的有用数据.为了避免这个问题,通... 迁移学习是数据挖掘中的一个研究方向,试图重用相关领域的数据样本,将相关领域的知识"迁移"到新领域中帮助训练.当前,基于实例的迁移学习算法容易产生过度拟合的问题,不能充分利用相关领域中的有用数据.为了避免这个问题,通过引入目标领域的无标记样本参与训练,利用半监督Boosting方法,提出一种新的迁移学习算法,能够对样本的相关性进行更好的判断,减少选择性偏差的影响.在大量文本数据集上的实验表明了新算法的有效性. 展开更多
关键词 迁移学习 跨领域学习 boosting算法 监督学习
下载PDF
基于K-means无监督机器学习算法的移动通信数据清洗方法
6
作者 李羽晨 《消费电子》 2024年第9期57-59,共3页
移动通信数据清洗通常仅通过设定固定的阈值来识别异常值,可能会出现误判或漏判的情况,导致清洗质量较差,为此研究基于K-means无监督机器学习算法的移动通信数据清洗方法。该方法首先进行移动通信数据信息的预处理,保证数据的准确性和... 移动通信数据清洗通常仅通过设定固定的阈值来识别异常值,可能会出现误判或漏判的情况,导致清洗质量较差,为此研究基于K-means无监督机器学习算法的移动通信数据清洗方法。该方法首先进行移动通信数据信息的预处理,保证数据的准确性和一致性。随后,通过特征提取技术,从预处理后的数据中提取出关键特征,为后续的数据处理提供基础。接着利用K-means无监督机器学习算法对移动通信数据进行聚类分析,识别并处理异常值,消除数据中的错误。最后,处理允余数据,进一步实现数据清洗,提升数据质量。实验结果表明:该方法在移动通信数据清洗的质量效果方面表现出色,不仅在数据完整性、准确性和一致性上有所提升,而且在降低允余度方面也有显著效果,实际应用价值更高。 展开更多
关键词 K-means无监督机器学习算法 K-means学习算法 移动通信数据 移动通信 数据清洗
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
7
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 监督学习 机器学习 神经网络 K-MEANS聚类 特征空间增强 mixup算法
下载PDF
非独立同分布下联邦半监督学习的数据分享研究
8
作者 顾永跟 高凌轩 +1 位作者 吴小红 陶杰 《计算机工程》 CAS CSCD 北大核心 2024年第6期188-196,共9页
联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标... 联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标签数据提升系统性能和如何缓解数据异质性带来的负面影响是两大挑战。针对标签数据仅在服务器场景,基于分享的思想,设计一种可应用在联邦半监督学习系统上的方法Share&Mark,该方法将客户端的分享数据由专家标记后参与联邦训练。同时,为充分利用分享的数据,根据各客户端模型在服务器数据集上的损失值动态调整各客户端模型在联邦聚合时的占比,即ServerLoss聚合算法。综合考虑隐私牺牲、通信开销以及人工标注成本3个方面的因素,对不同分享率下的实验结果进行分析,结果表明,约3%的数据分享比例能平衡各方面因素。此时,采用Share&Mark方法的联邦半监督学习系统FedMatch在CIFAR-10和Fashion-MNIST数据集上训练的模型准确率均可提升8%以上,并具有较优的鲁棒性。 展开更多
关键词 联邦半监督学习 联邦学习 数据非独立同分布 鲁棒性 聚合算法 数据分享
下载PDF
改进的采样算法与无监督聚类相结合的软件缺陷预测模型
9
作者 石海鹤 周世文 +1 位作者 钟林辉 肖正兴 《江西师范大学学报(自然科学版)》 CAS 北大核心 2024年第3期301-310,共10页
该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同... 该文首先在自适应综合过采样算法ADASYN(adaptive synthetic sampling)的基础上,考虑少数类内部不同密度簇之间的连接性问题,将与采样点距离为中等的点纳入新样本生成范围,改进得到T-ADASYN过采样优化算法,有效地增加了少数类内部不同密度簇的连接性,生成了分布更为均衡的数据集.然后使用基于连接的spectral clustering算法进行聚类预测操作,将过采样算法和无监督聚类相结合,提出一种新型实用的软件缺陷预测模型TA-SC(T-ADASYN+spectral clustering).以F-score为评价指标,spectral clustering为聚类模型进行验证.实验结果表明:改进的T-ADASYN过采样算法在公开的PROMISE数据集和NASA数据集上比常用的过采样算法均有6%的性能提升,且TA-SC模型在PROMISE和NASA 2个数据集上比常用聚类算法分别有3%和2%的性能提升. 展开更多
关键词 软件缺陷预测 类别不平衡 过采样算法 聚类算法 监督学习
下载PDF
基于Tri-training-SSAE半监督学习算法的电力系统暂态稳定评估 被引量:2
10
作者 卫志农 李超凡 +4 位作者 丁爱飞 孙国强 黄蔓云 臧海祥 方熙程 《电力自动化设备》 EI CSCD 北大核心 2023年第7期110-116,共7页
基于机器学习的暂态稳定评估方法主要采用监督学习方法,为了解决监督学习方法所需的有标签样本难以获取的问题,提出基于三体训练-稀疏堆叠自动编码器(Tri-training-SSAE)半监督学习算法的电力系统暂态稳定评估方法。构建基于堆叠稀疏自... 基于机器学习的暂态稳定评估方法主要采用监督学习方法,为了解决监督学习方法所需的有标签样本难以获取的问题,提出基于三体训练-稀疏堆叠自动编码器(Tri-training-SSAE)半监督学习算法的电力系统暂态稳定评估方法。构建基于堆叠稀疏自动编码器的暂态稳定评估模型;在传统的三体训练过程中加入伪标签样本置信度判断,以减小噪声数据对模型训练的影响;以堆叠稀疏自动编码器为基分类器构建三体训练-稀疏堆叠自动编码器模型,利用大量的无标签样本提高模型的泛化能力。通过IEEE 39节点系统与华东某省级电网进行分析验证,结果表明,所提方法在有标签样本数较少时具有更高的评估准确度。 展开更多
关键词 暂态稳定评估 机器学习 监督学习 三体训练算法 堆叠稀疏自动编码器
下载PDF
基于半监督学习标签传播-极端随机树算法的光伏阵列故障诊断及定位 被引量:4
11
作者 徐先峰 李芷菡 +4 位作者 刘状壮 王轲 马志雄 姚景杰 蔡路路 《电网技术》 EI CSCD 北大核心 2023年第3期1038-1046,共9页
对光伏阵列故障进行精确诊断和定位有助于提升光伏发电系统的可靠性。针对现有的诊断方法过度依赖大量有标签样本,难以同时兼顾故障类型诊断、故障定位及低成本等问题,将多传感器法与半监督学习算法相结合,构建了一种融合标签传播算法(l... 对光伏阵列故障进行精确诊断和定位有助于提升光伏发电系统的可靠性。针对现有的诊断方法过度依赖大量有标签样本,难以同时兼顾故障类型诊断、故障定位及低成本等问题,将多传感器法与半监督学习算法相结合,构建了一种融合标签传播算法(label propagation,LP)和极端随机树(extra-trees,ET)的半监督学习算法LP-ET。为克服工程实际故障样本较少且往往缺失故障标签的问题,搭建了光伏阵列故障仿真模型获取样本,引入LP算法,基于少量含故障类型及定位信息的有标签故障样本,实现原始故障样本集全标注;继而引入ET模型,持续构建大量决策树形成极端随机树,采用多数投票机制(Bagging)获得故障类型及定位结果。实验结果表明,所提出的LP-ET模型可以在含有大比例未标注样本数据集情况下实现短路、断路、退化及遮阴故障的较高精度诊断,兼顾单组件及多组件故障,有效解决光伏阵列故障诊断及定位问题。 展开更多
关键词 光伏阵列 故障诊断及定位 多传感器法 监督学习 标签传播-极端随机树算法
下载PDF
一种无需手工标注的半监督学习关键词抽取方法 被引量:1
12
作者 蔡茂东 沈国华 黄志球 《小型微型计算机系统》 CSCD 北大核心 2024年第1期69-74,共6页
关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据... 关键词的自动抽取技术是为了满足信息时代人们对特定领域知识快速便捷获取的需求.它也是机器翻译、信息检索、知识图谱构建等应用场景中的关键基础问题和研究热点.监督学习方法的效果是建立在有现成的大量的带有准确标注的高质量的数据集的前提上的,无法在低资源环境下快速运用.本文提出了一种考虑词频、词长以及词大小写特征的无监督算法以及结合了该无监督算法的自扩展迭代的半监督学习关键词抽取方法.半监督学习方法在同样无需手工标注关键词的前提下,相比无监督算法具有更高的F1值. 展开更多
关键词 监督学习 监督算法 自扩展迭代 低资源环境 关键词抽取
下载PDF
一种半监督的多标签Boosting分类算法 被引量:1
13
作者 赵晨阳 佀洁 《计算机应用研究》 CSCD 北大核心 2012年第9期3266-3268,共3页
针对标记数据不足的多标签分类问题,提出一种新的半监督Boosting算法,即基于函数梯度下降方法给出一种半监督Boosting多标签分类的框架,并将非标记数据的条件熵作为一个正则化项引入分类模型。实验结果表明,对于多标签分类问题,新的半监... 针对标记数据不足的多标签分类问题,提出一种新的半监督Boosting算法,即基于函数梯度下降方法给出一种半监督Boosting多标签分类的框架,并将非标记数据的条件熵作为一个正则化项引入分类模型。实验结果表明,对于多标签分类问题,新的半监督Boosting算法的分类效果随着非标记数据数量的增加而显著提高,在各方面都优于传统的监督Boosting算法。 展开更多
关键词 boosting算法 监督学习 多标签分类
下载PDF
基于半监督学习和支持向量机的铀矿分选方法研究
14
作者 吴泽彬 陈锐 《金属矿山》 CAS 北大核心 2024年第3期229-236,共8页
为了识别可冶炼铀矿石,提高资源利用率,采用X射线透射技术,并结合半监督学习算法—ITSVM,实现对铀矿的智能分选。同时为进一步优化模型性能,引入了亮暗校正方法以解决图像噪声问题,该方法通过归一化处理,将噪声图片中的每个像素点进行映... 为了识别可冶炼铀矿石,提高资源利用率,采用X射线透射技术,并结合半监督学习算法—ITSVM,实现对铀矿的智能分选。同时为进一步优化模型性能,引入了亮暗校正方法以解决图像噪声问题,该方法通过归一化处理,将噪声图片中的每个像素点进行映射,从而提升图像质量。通过改进的直线凹点检测与切割算法和切片方法,攻克了支持向量机对多目标分类任务的难题,该算法通过检测像素点相对于直线的位置和距离,利用约束条件判断凹点,采用最小距离切割方法获得对应的切割线,再通过切片的方法将多目标检测问题转化为多个独立的单一目标检测问题。通过综合这2种优化方法,最终建立了ITSVM铀矿分选模型。通过X射线投射技术收集到的2000张铀矿图片对该模型进行训练测试,并与SVM和TSVM模型进行结果对比。结果表明,经过亮暗校正,模型在检测铀矿的准确性方面提升了2.9个百分点;通过使用改进的直线凹点检测与切割算法和切片方法,使ITSVM模型具备多目标检测功能,模型对多目标铀矿图片检测的准确性达到95.7%;在测试集上,ITSVM模型检测铀矿的准确性达到97.3%。相比于SVM和TSVM,ITSVM在检测铀矿的准确性和持续优化模型方面具有更大优势,实验结果验证了ITSMV模型在铀矿分选领域的可行性。 展开更多
关键词 监督学习 ITSVM 亮暗校正 改进的直线凹点检测与切割算法
下载PDF
基于无监督机器学习的抽取式文本摘要与翻译技术研究
15
作者 颜婷婷 戎慧敏 《广西民族大学学报(自然科学版)》 CAS 2024年第1期99-104,共6页
翻译是促进不同语言和文化之间交流和合作的重要手段,文本摘要作为一种有效的信息提取方法,可以帮助翻译者快速准确地把握原文的核心内容和语义信息。基于此,研究引入了无监督机器学习TextRank算法应用于文本摘要抽取中,同时结合了双向... 翻译是促进不同语言和文化之间交流和合作的重要手段,文本摘要作为一种有效的信息提取方法,可以帮助翻译者快速准确地把握原文的核心内容和语义信息。基于此,研究引入了无监督机器学习TextRank算法应用于文本摘要抽取中,同时结合了双向编码器表示、基于相似度关系的多特征融合计算机制以及改进的最大边界相关算法加以改进。结果显示,当抽取3条摘要时,改进TextRank算法的各项Rouge值分别高达48.01%、31.54%、37.86%。同时,改进TextRank算法在DailyMail数据集上双语评估研究指标高达69.81%。说明研究所提的改进TextRank算法在文本摘要抽取和翻译方面具有显著的性能优势,为现代翻译领域提供了一种有效的文本摘要抽取和翻译方法。 展开更多
关键词 监督机器学习 抽取式文本摘要 翻译技术 TextRank算法
下载PDF
基于监督学习算法的乳腺癌复发预测
16
作者 刘巧红 赫英臣 +2 位作者 牛硕 张雷明 张捷 《现代仪器与医疗》 CAS 2023年第4期7-11,共5页
为了更好的发掘数据分析在辅助医学诊断上的价值,对医疗数据进行精准分析,本文基于Weka平台研究了十八种常见的监督机器学习算法对乳腺癌数据的分类预测,达到准确的预测乳腺癌是否复发的目的,并从统计学和机器学习指标对所有模型的预测... 为了更好的发掘数据分析在辅助医学诊断上的价值,对医疗数据进行精准分析,本文基于Weka平台研究了十八种常见的监督机器学习算法对乳腺癌数据的分类预测,达到准确的预测乳腺癌是否复发的目的,并从统计学和机器学习指标对所有模型的预测效果进行对比分析。结果表明统计学指标RMSE和RRSE较小的前3位算法依次为LMT、J48、AdaBoostM1,机器学习指标中性能表现较好的算法依次为BayesNet、AdaBoostM1和LMT。综合所有指标,分类预测效果较好的算法有LMT和AdaBoostM1,在乳腺癌数据集上表现出良好的分类预测,具有价高的预测价值。 展开更多
关键词 监督学习算法 数据挖掘 WEKA 乳腺癌 预测
下载PDF
半监督学习算法下数字化信息归并分类仿真
17
作者 胡建平 严永康 《计算机仿真》 北大核心 2023年第12期502-505,562,共5页
由于数字化信息具有无限性、高维度以及不平衡等特征,难以准确分类,为此提出基于半监督学习的数字化信息归并分类算法。检测原始数字化信息中的概念漂移数据,滤除噪声数据,降低对后续分类结果精度的影响;利用半监督学习训练K均值聚类算... 由于数字化信息具有无限性、高维度以及不平衡等特征,难以准确分类,为此提出基于半监督学习的数字化信息归并分类算法。检测原始数字化信息中的概念漂移数据,滤除噪声数据,降低对后续分类结果精度的影响;利用半监督学习训练K均值聚类算法,利用训练后算法训练数据块,构建基础分类器,通过对目标函数求解获得最优聚类中心;构建基于SDClass算法的归并分类器,计算每个数据块类标签的估计值,以及估计值与簇中心间距离,找出最近的簇,将对应的数据块划分到该簇中,实现数字化信息的归并分类。选取6种不同类型的数据集对所提方法展开实验测试,结果表明,所提方法针对不同类型的数据集均可实现高精准分类,且具有较高的分类效率。 展开更多
关键词 监督学习 数字化信息 归并分类 均值聚类算法 簇中心
下载PDF
一种最大化样本可分性半监督Boosting算法 被引量:4
18
作者 侯杰 茅耀斌 孙金生 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第5期675-681,共7页
针对数据实际分布与假设不匹配时半监督学习算法难以改善分类器性能的问题,该文提出一种最大化样本可分性半监督Boosting算法,通过引入"高密度区域局部散度最小、样本空间全局散度最大"准则来学习未标注的样本。该准则使用两... 针对数据实际分布与假设不匹配时半监督学习算法难以改善分类器性能的问题,该文提出一种最大化样本可分性半监督Boosting算法,通过引入"高密度区域局部散度最小、样本空间全局散度最大"准则来学习未标注的样本。该准则使用两种半监督假设(聚类假设和流形假设),减少了因半监督假设与数据不匹配造成的准确率下降问题。实验结果表明,该文算法有效提高了Boosting算法在符合聚类假设数据集和符合流形假设数据集上的准确性,提高了分类器噪声数据的稳定性。 展开更多
关键词 监督学习 boosting算法 可分性 分类器
下载PDF
机器学习算法在金融控股公司信息系统审计中的应用探究
19
作者 车纲 王振宇 《市场周刊》 2024年第24期88-91,共4页
随着金融行业的数字化转型,信息系统的安全性和效率对金融控股公司至关重要。文章探讨了无监督学习算法,特别是隔离森林算法,在金融信息系统审计中的应用。通过分析具体的安全事件,文章展示了无监督学习算法如何帮助审计师识别异常行为... 随着金融行业的数字化转型,信息系统的安全性和效率对金融控股公司至关重要。文章探讨了无监督学习算法,特别是隔离森林算法,在金融信息系统审计中的应用。通过分析具体的安全事件,文章展示了无监督学习算法如何帮助审计师识别异常行为,提前发现潜在的安全漏洞和非法活动;研究提出了将隔离森林算法集成到现有审计流程中的方案,并讨论了集成方法的优势,包括提高审计效率、增强审计准确性和加强数据保护。此外,文章还进行了理论模拟的案例分析,深入探讨了算法在信用卡交易数据中的应用,并提出了未来研究方向;讨论了引入AI算法的挑战,包括数据隐私、技术整合、算法透明度和问责性,并提出了相应的建议。 展开更多
关键词 信息系统审计 金融控股公司 监督学习算法 隔离森林算法
下载PDF
Boosting家族AdaBoost系列代表算法 被引量:27
20
作者 涂承胜 刁力力 +1 位作者 鲁明羽 陆玉昌 《计算机科学》 CSCD 北大核心 2003年第3期30-34,145,共6页
Boosting is one of the most representational ensemble prediction methods. It can be divided into two se-ries: Boost-by-majority and Adaboost. This paper briefly introduces the research status of Boosting and one of it... Boosting is one of the most representational ensemble prediction methods. It can be divided into two se-ries: Boost-by-majority and Adaboost. This paper briefly introduces the research status of Boosting and one of its seri-als-AdaBoost,analyzes the typical algorithms of AdaBoost. 展开更多
关键词 boosting Adaboost.R算法 Adaboost.oc算法 学习算法 ADAboost算法
下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部