期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
可减轻腰椎间盘样本集类重叠的采样算法
1
作者 赵鑫鑫 吴晓锋 《软件工程》 2025年第1期40-45,共6页
医学数据的类重叠问题会严重影响疾病的智能诊断效果。为了减轻腰椎间盘样本的类重叠对分类器产生的不良影响,提出了一种可减轻类重叠的混合采样算法——CO_HS算法。该算法将训练样本划分为核心样本、边界样本和噪声样本,对重叠区域的... 医学数据的类重叠问题会严重影响疾病的智能诊断效果。为了减轻腰椎间盘样本的类重叠对分类器产生的不良影响,提出了一种可减轻类重叠的混合采样算法——CO_HS算法。该算法将训练样本划分为核心样本、边界样本和噪声样本,对重叠区域的样本进行采样,以减轻样本集的类重叠程度。采用CO_HS算法产生的新训练样本集训练RF等分类模型,并建立了6种新的腰椎间盘退变分类器。实验结果显示,建立的新分类器在多项性能指标上均实现了显著提升,其中准确度提升了7.8百分点~12.7百分点,kappa系数提升了11.6百分点~20.2百分点,敏感性提升了7.9百分点~16.8百分点,特异性提升了9.0百分点~18.2百分点,F指标提升了9.4百分点~18.4百分点。因此,CO_HS算法被证明是一种能有效解决样本类重叠问题、改善分类性能的高效方法。 展开更多
关键词 智能医学 类重叠 混合采样 腰椎间盘退变
下载PDF
面向类重叠日志的一致性异常检测模型
2
作者 吕宗平 梁孟孟 +2 位作者 顾兆军 刘春波 王志 《计算机应用与软件》 北大核心 2024年第8期367-375,共9页
在系统日志异常检测中,决策边界出现的类重叠问题将导致传统分类器很难实现正确分类。为避免耗时的预处理技术或依赖特定算法,提出一致性异常检测模型。该模型计算样本与不同类别的隶属度,根据传统分类器的准确率差值选择最佳模糊度分... 在系统日志异常检测中,决策边界出现的类重叠问题将导致传统分类器很难实现正确分类。为避免耗时的预处理技术或依赖特定算法,提出一致性异常检测模型。该模型计算样本与不同类别的隶属度,根据传统分类器的准确率差值选择最佳模糊度分离出类重叠日志;通过集成分类器的不一致性度量函数得到p值,根据预设置信度得到类重叠日志标签。实验结果表明,相比传统分类器,该模型的召回率和F值等平均提高10百分点左右,验证了该模型在处理类重叠问题的有效性。 展开更多
关键词 异常检测 类重叠 一致性检测 模糊度 置信度
下载PDF
以类重叠度为优化目标的不平衡数据学习方法
3
作者 孙博 周倩 陈海燕 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第11期2139-2146,共8页
分类是机器学习中的一项重要学习任务,基本思想是使用在训练样例集上生成的分类器对测试样例的类别进行预测.然而,很多实际应用中的训练集具有不平衡的类分布,这通常会制约学习算法的分类性能.为此,本文提出以类重叠度为优化目标的不平... 分类是机器学习中的一项重要学习任务,基本思想是使用在训练样例集上生成的分类器对测试样例的类别进行预测.然而,很多实际应用中的训练集具有不平衡的类分布,这通常会制约学习算法的分类性能.为此,本文提出以类重叠度为优化目标的不平衡数据学习方法(COA-RBU).将相对类间势作为多数类样例效用的评价标准,并根据训练集的类重叠度自适应地确定合适欠采样比例,以降低不平衡训练集的数据复杂性.实验结果表明,类重叠度能较好地反映数据集的学习难度,并且COA-RBU具有良好的性能和较高的效率.因此,本文工作从类重叠数据复杂性角度为合适欠采样比例的确定提供了一种新的思路. 展开更多
关键词 分类 类不平衡 欠采样 类重叠度 数据复杂性 机器学习
下载PDF
我国“交叠式”家校社课后体育服务机制构建与实践路径 被引量:2
4
作者 刘建武 钟丽萍 +1 位作者 范成文 隋晓东 《体育学刊》 CAS CSSCI 北大核心 2024年第3期118-125,共8页
运用文献资料、逻辑分析等方法,发现我国家校社推进课后体育服务的“分离式”困境表现为:家校社协同意识不强、家校社协同供给缺乏、家校社有效沟通不足、家校社协同管理不到位。以交叠影响域理论为基础,构建我国“交叠式”家校社课后... 运用文献资料、逻辑分析等方法,发现我国家校社推进课后体育服务的“分离式”困境表现为:家校社协同意识不强、家校社协同供给缺乏、家校社有效沟通不足、家校社协同管理不到位。以交叠影响域理论为基础,构建我国“交叠式”家校社课后体育服务机制,提出我国“交叠式”家校社课后体育服务机制的实践路径:营造协同氛围,达成体育育人目标共识;协调三方资源,强化课后体育服务育人成效;健全沟通机制,促进家校社深度融合;搭建智慧平台,优化课后体育服务管理。 展开更多
关键词 学校体育 课后体育服务 家校社协同 交叠影响域 服务机制
下载PDF
基于改进主动生成式过采样的个人信用风险评估研究
5
作者 顾哲涵 黄宝凤 《软件导刊》 2024年第9期163-169,共7页
针对个人信用风险评估中的样本不均衡和类别重叠问题,提出一种改进的主动生成式过采样模型。首先,在辅助分类器生成对抗网络(ACGAN)框架的基础上引入Wasserstein距离改善真假判别损失函数,加入梯度惩罚以防止模式崩溃;其次,采用Focallos... 针对个人信用风险评估中的样本不均衡和类别重叠问题,提出一种改进的主动生成式过采样模型。首先,在辅助分类器生成对抗网络(ACGAN)框架的基础上引入Wasserstein距离改善真假判别损失函数,加入梯度惩罚以防止模式崩溃;其次,采用Focalloss代替传统交叉熵损失,以增强对困难样本的识别能力;最后,利用所提模型对不平衡数据进行过采样,以提升分类器性能。针对真实信贷数据的实验表明,该模型将分类器的分类性能指标F1、AUC及G-means分别提升11.2%、1.7%、12.8%,在增强样本多样性、减少类别重叠及提升分类器针对非平衡数据集的分类效能方面取得了显著成效。 展开更多
关键词 深度学习 不平衡数据 类重叠 ACGAN focalloss Wasserstein距离
下载PDF
分类中的类重叠问题及其处理方法研究 被引量:9
6
作者 熊海涛 吴俊杰 +1 位作者 刘洪甫 刘鲁 《管理科学学报》 CSSCI 北大核心 2013年第4期8-21,共14页
类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的... 类重叠问题是数据挖掘与机器学习领域的瓶颈问题之一.如果其中还存在类不均衡问题时,情况变得更加复杂.有鉴于此,本文在已有文献基础上归纳了三种类重叠学习算法及提出一种新的方法:分隔法,并首次将支持向量数据描述算法用于实际数据的重叠样本识别,对类重叠问题及其与类不均衡问题的相互影响进行了系统研究.在真实数据上采用五种分类器的实验结果表明:1)多数情况下"分隔法"是表现最佳的类重叠学习算法;2)分隔法通常对基于分界面而非规则的分类器更为有效;3)分隔法在类不均衡问题中表现很好,当基础分类器为支持向量机时尤为突出.最后针对支持向量机的实验结果给出了理论分析. 展开更多
关键词 数据挖掘 分类 类重叠 类不均衡 支持向量数据描述
下载PDF
基于油中气体分析与类重叠特征的变压器分层故障诊断模型 被引量:9
7
作者 陈铁 冷昊伟 +1 位作者 李咸善 陈一夫 《中国电力》 CSCD 北大核心 2022年第7期22-32,41,共12页
油中溶解气体分析可以有效识别变压器放电故障与过热故障,为提高变压器故障诊断准确度,提出一种基于类重叠特征的变压器分层故障诊断方法。首先使用支持向量数据描述(SVDD)划分出变压器故障样本数据空间的重叠区域,选择类重叠率与类重... 油中溶解气体分析可以有效识别变压器放电故障与过热故障,为提高变压器故障诊断准确度,提出一种基于类重叠特征的变压器分层故障诊断方法。首先使用支持向量数据描述(SVDD)划分出变压器故障样本数据空间的重叠区域,选择类重叠率与类重叠度作为重叠特征,分别对类重叠程度和样本点重要性进行描述,然后以类重叠率为分层标准建立分层故障诊断模型,采用分隔训练法将各诊断层的样本集分开训练,针对分类难度较大的重叠区,基于类重叠度构造二分类模糊支持向量机(FSVM)进行故障诊断。实验结果表明,相比于其他模型,所提方法具有更高的准确度。 展开更多
关键词 变压器故障诊断 类重叠 分层诊断 支持向量数据描述 模糊支持向量机
下载PDF
类别混叠度对非均衡数据分类的有效性分析 被引量:2
8
作者 邢延 陈嘉锋 +1 位作者 贾小彦 汪新 《数据采集与处理》 CSCD 北大核心 2018年第5期936-944,共9页
类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易。实际分类任务中存在大量的非均衡数据,大类与小类样本之间悬殊的数量差别给分类造成了极大的困难。本... 类别混叠度是指不同类别数据之间互相交叠、混合的程度,其量化指标包含基于几何统计的和基于信息论的两类,用于衡量数据分类的难易。实际分类任务中存在大量的非均衡数据,大类与小类样本之间悬殊的数量差别给分类造成了极大的困难。本文采用实验研究的方法,验证类别混叠度量化指标指导非均衡数据分类的有效性,以减少甚至避免盲目试错带来的庞大计算开销。首先,针对两类分类问题,设计验证实验,在不同类数据非均衡率,不同别边界形状、不同特征类型、不同概率分布的非均衡仿真数据上研究类别混叠度的有效性。其次,在实验研究的基础上,分析数据的非均衡性对类别混叠度的影响规律,找出类别混叠度指导非均衡分类的有效方法。最后,在真实的非均衡数据上验证类别混叠度指导非均衡分类的实际效果。实验结果表明,对数据的非均衡率具有较强鲁棒性的类别混叠度量化指标可以有效地指导非均衡数据的分类器选择。 展开更多
关键词 类别混叠度 分类复杂度 非均衡数据 分类 非均衡率
下载PDF
面向ICS不平衡数据的重叠区混合采样方法 被引量:1
9
作者 高冰 顾兆军 +1 位作者 周景贤 隋翯 《计算机工程与应用》 CSCD 北大核心 2023年第19期305-315,共11页
工业控制系统异常检测面临着数据不平衡问题,其中,不平衡数据存在的类重叠现象加剧了分类器的检测难度。基于数据类别平衡或数据重叠检测的应对策略较常被采用,但这些策略方法存在着模型稳定性差或重叠识别率低等问题。对此,提出了一种... 工业控制系统异常检测面临着数据不平衡问题,其中,不平衡数据存在的类重叠现象加剧了分类器的检测难度。基于数据类别平衡或数据重叠检测的应对策略较常被采用,但这些策略方法存在着模型稳定性差或重叠识别率低等问题。对此,提出了一种面向重叠区域的混合采样方法:OverlapRHS。该方法利用支持向量数据描述分别在多数类和少数类样本上构建重叠检测模型,并通过将合成少数类与邻域清洗进行组合,对重叠数据区域内的样本施以混合采样。最后该方法与4种经典分类器结合,在4个公开的不平衡数据集上进行了测试,并与其他4种处理不平衡问题的采样方法进行了比较。实验结果表明,所提方法能够有效检测出不平衡数据集中的重叠数据,并通过高效且针对性强的数据混合采样改善了分类器的训练效果,提高了分类器对不平衡数据的异常检测性能,展现了较之于其他采样方法在不平衡数据处理上的显著优势。 展开更多
关键词 工业控制系统 不平衡数据 类重叠 支持向量数据描述 混合采样 异常检测
下载PDF
多分类SVDD混叠域识别新方法与故障诊断应用 被引量:6
10
作者 蔡金燕 杜敏杰 《航天控制》 CSCD 北大核心 2012年第6期83-88,共6页
针对支持向量数据描述(SVDD)多分类方法中混叠域样本识别精度差的问题,提出了一种提高精度的K近邻隶属度估计算法。首先提取训练样本中的两类混叠样本并在混叠域分别搜寻测试样本的K个近邻,然后通过估计待测样本到K近邻样本中心欧式距... 针对支持向量数据描述(SVDD)多分类方法中混叠域样本识别精度差的问题,提出了一种提高精度的K近邻隶属度估计算法。首先提取训练样本中的两类混叠样本并在混叠域分别搜寻测试样本的K个近邻,然后通过估计待测样本到K近邻样本中心欧式距离的方法计算样本隶属度,最后通过比较隶属度大小实现样本识别。仿真和UCI数据及模拟电路故障诊断应用验证了算法较传统方法更为有效,尤其适用于不平衡数据的识别。 展开更多
关键词 支持向量数据描述 多分类 混叠 K近邻 隶属度 故障诊断
下载PDF
基于GIS的图层叠加法在地震次生火灾区划单元中的应用 被引量:3
11
作者 陈艳华 张琳 《河北联合大学学报(自然科学版)》 CAS 2014年第2期124-128,共5页
通过比较现有区划单元的确定方法,分析了现有区划单元确定方法的优缺点,论证了利用地理信息系统(GIS)图层叠加法进行基本区划单元确定的可行性。并以此将收集到的曹妃甸地区相关影响因子按照点、线、面进行分类、提取,并结合实地情况的... 通过比较现有区划单元的确定方法,分析了现有区划单元确定方法的优缺点,论证了利用地理信息系统(GIS)图层叠加法进行基本区划单元确定的可行性。并以此将收集到的曹妃甸地区相关影响因子按照点、线、面进行分类、提取,并结合实地情况的权重,将曹妃甸工业区划分为1391个地震次生火灾基本区划单元,为今后进行地震次生火灾综合评价提供基础,为今后有针对性地进行抗震防灾工作提供借鉴。 展开更多
关键词 地理信息系统 地震次生火灾 区划单元 图层叠加
下载PDF
公母畜间有不同的年龄组数目条件下控制近交最大化选择反应 被引量:2
12
作者 唐国庆 李学伟 《畜牧兽医学报》 CAS CSCD 北大核心 2006年第3期209-215,共7页
一种扩展的动态选择规则能够在公母畜间有不同的年龄组数目的世代重叠群体内约束年近交速率为一个预定义值,逐年最大化遗传反应。该规则考虑在世代重叠群体中按性别-年龄分组,通过限制父母亲群体性别-年龄组的平均加性遗传相关的增加,... 一种扩展的动态选择规则能够在公母畜间有不同的年龄组数目的世代重叠群体内约束年近交速率为一个预定义值,逐年最大化遗传反应。该规则考虑在世代重叠群体中按性别-年龄分组,通过限制父母亲群体性别-年龄组的平均加性遗传相关的增加,从而限制新生后代平均近交系数的增加。动态选择程序通过输入候选个体的BLUP估计育种值、所有个体的加性遗传相关矩阵和所有性别-年龄组的长期遗传贡献,给出最适宜的选留个体数及其每个选留个体最适宜的后代数。猪核心群随机模拟结果显示该动态选择规则能够获得预定义的近交速率。在相同的近交速率条件下,动态选择比截断选择获得高达10%的更多年遗传进展。 展开更多
关键词 动态选择 近交 世代重叠 性别一年龄组
下载PDF
关于课程间交叉渗透问题的分析 被引量:1
13
作者 唐杰 云建军 王兆明 《长春大学学报》 2006年第6期98-100,共3页
对高等职业教育课程改革中的部分问题进行了浅析。着重阐述了课程间交叉渗透的研究在课程改革中的影响与作用,并以机电类专业为例探讨了在教学中如何处理课程间交叉渗透的问题。
关键词 职业教育 课程改革 交叉渗透 机电类
下载PDF
多子超球支持向量机算法研究
14
作者 陈鹏 刘爽 李灵华 《微电子学与计算机》 CSCD 北大核心 2014年第12期28-33,共6页
提出了一种多子超球支持向量机算法.首先计算所有类别的分类超球,然后统计所有超球的位置关系,记入相应的数据集合.对相交集合中的超球,通过键值索引映射计算其交叉系数,根据该系数选择相交类别数据差异度最大的超球划分子超球,子超球... 提出了一种多子超球支持向量机算法.首先计算所有类别的分类超球,然后统计所有超球的位置关系,记入相应的数据集合.对相交集合中的超球,通过键值索引映射计算其交叉系数,根据该系数选择相交类别数据差异度最大的超球划分子超球,子超球个数由交叉系数确定.实验结果表明提出的算法在提高分类精度的同时,降低了决策规则求解的复杂度. 展开更多
关键词 超球支持向量机 多分类 相交 交叉系数 差异度
下载PDF
切削形状冰下螺旋桨诱导轴承力的数值计算
15
作者 王超 李兴 +1 位作者 孙盛夏 熊伟鹏 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第11期1740-1745,共6页
针对冰桨非接触工况下的螺旋桨水动力性能,本文采用重叠网格方法建立了粘性流场中冰桨相互作用下螺旋桨轴承力的数值模拟的模型。计算中流域采用切割体网格,螺旋桨旋转计算域与冰表面计算域之间采用重叠网格进行数据传递,同时对冰桨间... 针对冰桨非接触工况下的螺旋桨水动力性能,本文采用重叠网格方法建立了粘性流场中冰桨相互作用下螺旋桨轴承力的数值模拟的模型。计算中流域采用切割体网格,螺旋桨旋转计算域与冰表面计算域之间采用重叠网格进行数据传递,同时对冰桨间隙处进行网格局部加密来保证流场细节捕捉。计算结果表明:与模型试验结果比对,水动力性能误差控制在5%以内,验证了本文计算方法的可行性;桨前切削形状冰的存在会对伴流场产生很大的干扰,螺旋桨轴承力会出现"三阶段"下降的趋势。 展开更多
关键词 轴承力 冰区螺旋桨 重叠网格 数值计算 切削形状冰 水动力性
下载PDF
朝鲜语词缀、词类和词尾范畴的相互渗透现象
16
作者 赵新建 《解放军外国语学院学报》 北大核心 2006年第5期49-52,共4页
朝鲜语形态学和词类学中存在着一些属性不确定的范畴,尚待进一步研究。从认知语言学典型范畴理论来看,这些问题主要是由于相邻范畴之间相互渗透所导致。对于属性不确定的范畴,需要进一步寻找相关范畴的本质特征,或依据相似性程度确定兼... 朝鲜语形态学和词类学中存在着一些属性不确定的范畴,尚待进一步研究。从认知语言学典型范畴理论来看,这些问题主要是由于相邻范畴之间相互渗透所导致。对于属性不确定的范畴,需要进一步寻找相关范畴的本质特征,或依据相似性程度确定兼类范畴的归属,也可以将部分兼类范畴独立化。本文选取词尾与其相邻的两个范畴(词缀与词类)作为代表,分析范畴相互渗透的表现和原因,并提出典型范畴观下的范畴相对界定原则。 展开更多
关键词 朝鲜语 词缀 词类 词尾 相互渗透
下载PDF
简论动词性双音化结构的句法语义和语序效应——与英语对比的视角
17
作者 刘晓林 《重庆三峡学院学报》 2014年第6期106-112,共7页
在学界对汉语双音化研究成果的基础上,系统探讨了双音化的句法语序效应:双音化动词(组)削弱了动性,宾语基本能够提前为话题,增强了汉语话题优先性类型特征;动词性双音化在历时发展中凝固了过程义和结果义,作格性增强,使汉语的词类交叉... 在学界对汉语双音化研究成果的基础上,系统探讨了双音化的句法语序效应:双音化动词(组)削弱了动性,宾语基本能够提前为话题,增强了汉语话题优先性类型特征;动词性双音化在历时发展中凝固了过程义和结果义,作格性增强,使汉语的词类交叉更为明显;动词性双音化蕴含一定的体意义,使汉语体系统更加完备;动词性双音化加强了汉语基本语言单位的可分析性。 展开更多
关键词 动词性双音化 话题优先 作格化 分析性
下载PDF
可缓解类重叠问题的跨版本软件缺陷预测方法 被引量:3
18
作者 曲豫宾 陈翔 李龙 《吉林大学学报(理学版)》 CAS 北大核心 2021年第2期372-378,共7页
针对软件缺陷预测过程中未充分使用源代码语义特征以及训练数据集中的类重叠问题,提出一种面向类重叠的跨版本软件缺陷深度特征学习方法.该方法采用混合式最近邻清理策略缓解深度学习语义特征中存在的类重叠问题.在PROMISE公开数据集上... 针对软件缺陷预测过程中未充分使用源代码语义特征以及训练数据集中的类重叠问题,提出一种面向类重叠的跨版本软件缺陷深度特征学习方法.该方法采用混合式最近邻清理策略缓解深度学习语义特征中存在的类重叠问题.在PROMISE公开数据集上进行测试的结果表明,该策略能提升基于深度语义学习的软件缺陷预测性能,分类性能最多在中值上提升14.8%.实验结果表明,在跨版本深度缺陷预测问题中可采用混合式最近邻清理策略缓解类重叠问题. 展开更多
关键词 软件缺陷预测 深度学习 类重叠 语义特征
下载PDF
改进边界分类的Borderline-SMOTE过采样方法 被引量:2
19
作者 马贺 宋媚 祝义 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期1003-1012,共10页
针对不平衡数据中类重叠区域易造成分类错误的问题,提出一种引入合成因子改进边界分类的Borderline-SMOTE过采样方法(IBSM).首先根据少数类样本近邻分布情况找出处于边界的少数类样本,然后计算边界样本对应的合成因子,并根据其取值更新... 针对不平衡数据中类重叠区域易造成分类错误的问题,提出一种引入合成因子改进边界分类的Borderline-SMOTE过采样方法(IBSM).首先根据少数类样本近邻分布情况找出处于边界的少数类样本,然后计算边界样本对应的合成因子,并根据其取值更新该样本需生成的样本数,最后在近邻中根据合成因子挑选距离最近的top-Z少数类样本进行新样本生成.将提出的方法与八种采样方法在KNN和SVM两种分类器、10个KEEL不平衡数据集上进行对比实验,结果表明,提出的方法在大部分数据集上的F1,G-mean,AUC(Area under Curve)均获得最优值,且F1与AUC的Friedman排名最优,证明所提方法和其余采样方法相比,在处理不平衡数据中的边界样本分类问题时有更好的表现,通过合成因子设定一定的约束条件与分配策略,可以为同类研究提供思路. 展开更多
关键词 不平衡数据 边界样本 类重叠 Borderline-SMOTE 过采样
下载PDF
邻域欠采样的AdaBoostv算法 被引量:1
20
作者 张振莲 鲁淑霞 翟俊海 《小型微型计算机系统》 CSCD 北大核心 2023年第1期97-102,共6页
针对类别非平衡情况下的类重叠问题,引入了两种基于邻域的欠采样方法:共同近邻搜索欠采样和递归搜索欠采样,其主要思想是通过消除重叠区域中的负类样本来缓解类别非平衡问题,学习算法采用AdaBoost v算法,通过最大化样本的最小间隔(最优... 针对类别非平衡情况下的类重叠问题,引入了两种基于邻域的欠采样方法:共同近邻搜索欠采样和递归搜索欠采样,其主要思想是通过消除重叠区域中的负类样本来缓解类别非平衡问题,学习算法采用AdaBoost v算法,通过最大化样本的最小间隔(最优间隔)来提高分类器的分类能力.为了进一步解决非平衡数据分类问题,AdaBoost v算法的基分类器采用加权最优间隔分布机模型,对模型中的间隔均值项和铰链损失项加权,权值是依据数据的非平衡比给出的,并利用带有方差减小的随机梯度下降方法对优化模型进行求解,以提高算法的收敛速度.对比实验表明,提出的算法在非平衡数据分类问题上具有明显的优势. 展开更多
关键词 欠采样 AdaBoost v 最优间隔分布机 类重叠问题 权值
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部