期刊文献+
共找到272,556篇文章
< 1 2 250 >
每页显示 20 50 100
面向多模态数据的新型数据库技术专题前言
1
作者 彭智勇 高云君 +1 位作者 李国良 许建秋 《软件学报》 EI CSCD 北大核心 2024年第3期1049-1050,共2页
以数字技术为标志的新一轮科技革命方兴未艾,将人类带入数字经济时代.全球各行各业数据量呈现爆炸式增长,数据类型和数据格式也呈现多种形式,例如结构化关系表、半结构化JSON/XML、非结构化文本/图像/视频,以及图数据、流数据和时序数据... 以数字技术为标志的新一轮科技革命方兴未艾,将人类带入数字经济时代.全球各行各业数据量呈现爆炸式增长,数据类型和数据格式也呈现多种形式,例如结构化关系表、半结构化JSON/XML、非结构化文本/图像/视频,以及图数据、流数据和时序数据等.这要求数据库系统能够同时高效地管理多种不同类型的数据.多模态数据管理与分析成为亟需解决的问题.目前的方法主要通过拓展现有的数据库或通过集成各种不同模态数据管理引擎来支持多模态数据管理与分析,缺少新颖的理论、方法与技术的支撑.本专题围绕多模态数据管理与分析的整个生命周期,通过结合大数据技术和人工智能方法探讨新型数据库系统理论、方法和技术,包括多模态数据统一建模、存储与索引、查询与挖掘、并发控制、多模态数据库系统构建及其典型应用等主题,赋予数据库系统新的管理能力,形成多模态数据管理与分析在各行各业的最新应用成果. 展开更多
关键词 数据库系统 多模态数据 数据库技术 人工智能方法 并发控制 大数据技术 数据类型 统一建模
下载PDF
前言
2
作者 李戈 邢颖 +2 位作者 刘芳 刘辉 刘璘 《计算机研究与发展》 EI CSCD 北大核心 2024年第2期289-290,共2页
在当前的科技发展背景下,生成式人工智能(artificial intelligence,AI)已经开始为软件工程领域赋能,并衍生为一种新的生产力.生成式AI将大大加速软件开发过程,减少测试的时间和人工成本,提高测试的覆盖率、准确性和可靠性,增强代码的质... 在当前的科技发展背景下,生成式人工智能(artificial intelligence,AI)已经开始为软件工程领域赋能,并衍生为一种新的生产力.生成式AI将大大加速软件开发过程,减少测试的时间和人工成本,提高测试的覆盖率、准确性和可靠性,增强代码的质量和可维护性,同时帮助软件管理人员更好地进行项目管理与维护,提供自动化软件部署方式,并推动软件开发效率和质量的快速提升.以ChatGPT为例,其自问世以来,已经被应用在软件工程领域并得到了初步的探索.生成式AI作为一种新颖的简化代码开发方式,使得测试用例的开发流程与技术手段更加简单、高效. 展开更多
关键词 软件工程领域 自动化软件 软件开发效率 软件开发过程 测试用例 人工智能 开发流程 部署方式
下载PDF
多区域注意力的细粒度图像分类网络
3
作者 白尚旺 王梦瑶 +1 位作者 胡静 陈志泊 《计算机工程》 CSCD 北大核心 2024年第1期271-278,共8页
目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型... 目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型关注次要特征;然后通过背景去除以及上采样的方法获取图像更精准的局部图像,对提取到的局部特征进行位置统计,并以矩形框的方式获取图像整体,减少细节信息丢失;最后对局部与整体图像进行更加细致的学习。此外,设计联合损失函数,通过动态平衡难易样本和缩小类内差距的方法改善模型的识别效果。实验结果表明,该方法在公开的细粒度图像数据集CUB-200-2011、Stanford-Cars和FGVC-Aircraft上的准确率分别达到89.2%、94.8%、94.0%,相较于对比方法性能更优。 展开更多
关键词 多区域注意力 细粒度图像分类 擦除策略 联合损失 深度学习 卷积神经网络
下载PDF
非平衡概念漂移数据流主动学习方法
4
作者 李艳红 王甜甜 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第3期589-606,共18页
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真... 数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 展开更多
关键词 数据流分类 主动学习 概念漂移 多类不平衡
下载PDF
基于格拉姆角场和PSO-CNN的滚动轴承故障诊断方法
5
作者 张国栋 尹强 羊柳 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第4期301-308,共8页
针对卷积神经网络的结构对滚动轴承故障诊断精度有较大影响的问题,提出一种基于格拉姆角场和粒子群优化卷积神经网络结构的故障诊断方法。采用格拉姆角场对一维轴承振动数据重构,保留原始数据信息的同时包含了时间相关性;采用粒子群优... 针对卷积神经网络的结构对滚动轴承故障诊断精度有较大影响的问题,提出一种基于格拉姆角场和粒子群优化卷积神经网络结构的故障诊断方法。采用格拉姆角场对一维轴承振动数据重构,保留原始数据信息的同时包含了时间相关性;采用粒子群优化算法对编码后的卷积神经网络结构迭代寻优。利用西储大学的轴承数据集进行试验验证,试验结果表明,该方法可自适应生成网络结构,平均诊断精度为99%,相对于其他主流卷积神经网络结构可以获得更好的故障诊断精度。 展开更多
关键词 格拉姆角场 粒子群优化算法 卷积神经网络 滚动轴承 故障诊断
下载PDF
“1+1”院级实验室信息综合管理平台建设与实践
6
作者 付丽红 董成亮 +1 位作者 吴祝武 冯晓巍 《实验室研究与探索》 CAS 北大核心 2024年第5期240-244,共5页
鉴于院级实验室信息管理系统管理功能简单粗放,与实际工作存在出入,且无前台访问界面等现状,升级建设“前台网站+后台系统”(1+1)的院级实验室信息综合管理平台。重点建设院级实验室前台网站以及开放实验管理、仪器设备维修保养模块和... 鉴于院级实验室信息管理系统管理功能简单粗放,与实际工作存在出入,且无前台访问界面等现状,升级建设“前台网站+后台系统”(1+1)的院级实验室信息综合管理平台。重点建设院级实验室前台网站以及开放实验管理、仪器设备维修保养模块和借用模块,该平台实现了实验资源的全方位开放共享、开放实验的全过程管理、实验设备的全生命周期动态化管理,并为实验室的文化宣传提供载体,为建立实验室的现代化管理新模式提供了一定参考。 展开更多
关键词 实验室 信息化 院级管理平台 开放实验管理
下载PDF
农业大数据开发中的计算机系统安全探讨——以“2023首届农业农村大数据大会”为例
7
作者 刘睿潇 袁彦莉 《核农学报》 CAS CSCD 北大核心 2024年第6期I0003-I0004,共2页
农业大数据的发展为农业生产和管理提供了前所未有的机会,但也带来了计算机系统安全问题。随着农业大数据应用的不断深入,涉及到的信息量越来越大,因此对于农业大数据的计算机系统安全问题的研究显得尤为重要。在农业大数据开发中,计算... 农业大数据的发展为农业生产和管理提供了前所未有的机会,但也带来了计算机系统安全问题。随着农业大数据应用的不断深入,涉及到的信息量越来越大,因此对于农业大数据的计算机系统安全问题的研究显得尤为重要。在农业大数据开发中,计算机系统安全受到威胁的方式多种多样,可能面临网络攻击、数据泄露、恶意软件感染等风险。特别是在农业领域,一旦计算机系统遭到攻击或数据泄露,可能会对农业生产、市场供需平衡等方面造成严重影响,因此加强对农业大数据计算机系统安全的研究具有重要意义。 展开更多
关键词 计算机系统安全 恶意软件 大数据 网络攻击 数据泄露 信息量 农业
下载PDF
一种麒麟系统下基于Django的网络性能管理系统设计与实现
8
作者 李朝阳 周维贵 +1 位作者 张小锋 熊宗炬 《计算机应用与软件》 北大核心 2024年第3期130-133,共4页
通过对网络性能管理系统在网络运维中的重要作用和国产麒麟操作系统在各关键领域得到广泛应用的事实进行分析阐述的基础上,该文基于Django框架设计集数据采集、存储、分析、显示及管理于一体的综合网络性能管理系统。结合Pysnmp、Django... 通过对网络性能管理系统在网络运维中的重要作用和国产麒麟操作系统在各关键领域得到广泛应用的事实进行分析阐述的基础上,该文基于Django框架设计集数据采集、存储、分析、显示及管理于一体的综合网络性能管理系统。结合Pysnmp、Django、Highcharts等开源工具包,重点阐述设计中所包含的各关键模块的具体实现技术细节,并给出相应的应用实例效果图。实践表明,该设计实现方法稳妥可靠,具有进一步推广应用的价值。 展开更多
关键词 DJANGO 网络性能 SNMP KYLIN PYTHON
下载PDF
基于路侧摄像头的多目标跟踪算法优化设计
9
作者 王平 姚宇阳 王新红 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第4期541-550,共10页
针对当前多目标追踪算法应对路侧交通场景的缺陷,提出一种基于路侧摄像头的多目标追踪算法。选择one‐shot追踪算法路线,基于FairMOT设计神经网络,使单个网络同时生成目标检测结果与外观特征结果,增强实时性效果;采用新的数据关联方式,... 针对当前多目标追踪算法应对路侧交通场景的缺陷,提出一种基于路侧摄像头的多目标追踪算法。选择one‐shot追踪算法路线,基于FairMOT设计神经网络,使单个网络同时生成目标检测结果与外观特征结果,增强实时性效果;采用新的数据关联方式,减少遮挡对追踪器的影响;引入新的运动相似度度量方式——缓冲交并比,弥补线性运动预测模型产生的误差;提出基于速度判别的丢失轨迹移除算法和基于历史位置匹配算法,实现长时间遮挡轨迹的身份恢复。在UA‐DETRAC公开多目标追踪数据集上进行实验,验证该算法有效性。为证明该算法在真实路侧环境的适用性,在国家智能网联汽车(上海)试点示范区开放道路采集真实路侧场景数据。最后,将该算法和SORT、DeepSORT、ByteTrack、FairMOT算法在真实路侧场景数据上进行对比实验。实验结果表明,本算法在identification F‐Score、ID switch、fragmentation、mostly tracked、mostly lost、multiple object tracking accuracy等评估指标上优于其他算法。 展开更多
关键词 多目标追踪 目标检测 路侧感知
下载PDF
基于轻量化YOLOv5的交通标志检测
10
作者 张震 王晓杰 +1 位作者 晋志华 马继骏 《郑州大学学报(工学版)》 CAS 北大核心 2024年第2期12-19,共8页
为了提高道路交通标志的检测速度,提出一种基于轻量化YOLOv5的改进模型。首先,使用Ghost卷积和深度分离卷积(DWConv)构建新的主干模块,减少计算量和参数量;引入加权特征融合网络(BiFPN)结构,增强特征融合能力;将CIoU损失函数替换为SIoU... 为了提高道路交通标志的检测速度,提出一种基于轻量化YOLOv5的改进模型。首先,使用Ghost卷积和深度分离卷积(DWConv)构建新的主干模块,减少计算量和参数量;引入加权特征融合网络(BiFPN)结构,增强特征融合能力;将CIoU损失函数替换为SIoU损失函数,关注真实锚框与预测的角度信息,提升检测精度。其次,对TT100K数据集进行优化,筛选出标签个数大于200的交通标志图片和标注信息共24类。最后,实验结果取得84%的准确率、81.2%的召回率和85.4%的所有类别平均精确率的平均值mAP@0.5,相比原始YOLOv5,参数量减少29.0%,计算量减少29.4%,mAP@0.5仅下降0.1百分点,检测帧率提升了34帧/s。使用改进后的模型进行检测,检测速度有了明显提升,基本达到了在保持检测精度的基础上压缩模型的目的。 展开更多
关键词 交通标志检测 轻量化YOLOv5 SIoU损失函数 Ghost卷积 TT100K BiFPN
下载PDF
基于融合影响因素PSO-Prophet模型的农产品价格预测
11
作者 刘合兵 王一飞 +2 位作者 王垒 席磊 尚俊平 《湖北农业科学》 2024年第1期185-189,共5页
为了提高价格预测的准确度,在Prophet模型中融入了消费者物价指数(CPI)和经济政策不确定性指数(EPU)等影响因素,并使用粒子群算法优化参数。利用国际大蒜贸易网中的日价格数据,将该方法应用于山东省大蒜的价格预测。结果表明,融合影响... 为了提高价格预测的准确度,在Prophet模型中融入了消费者物价指数(CPI)和经济政策不确定性指数(EPU)等影响因素,并使用粒子群算法优化参数。利用国际大蒜贸易网中的日价格数据,将该方法应用于山东省大蒜的价格预测。结果表明,融合影响因素的PSO-Prophet模型大蒜价格预测结果的平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)比Prophet模型分别降低了82.88%、82.86%和77.49%。融合影响因素的PSO-Prophet模型可以有效提高预测精度。 展开更多
关键词 价格预测 融合影响因素 Prophet模型 PSO-Prophet模型 农产品
下载PDF
工程认证背景下计算机专业课程教学模式的重构与实践——以数据结构课程为例
12
作者 宋婉娟 杨鹤 曹茂峰 《湖北第二师范学院学报》 2024年第2期66-71,共6页
针对传统计算机专业课程教学模式以知识传授为主、实践能力较弱和评价方式不合理等问题,在工程认证的背景下,基于OBE思想,以数据结构课程为例,结合双在线教学平台(超星学习通和Eudcoder实践平台)进行课程体系重构,设计并实施以实践能力... 针对传统计算机专业课程教学模式以知识传授为主、实践能力较弱和评价方式不合理等问题,在工程认证的背景下,基于OBE思想,以数据结构课程为例,结合双在线教学平台(超星学习通和Eudcoder实践平台)进行课程体系重构,设计并实施以实践能力培养为重点的混合教学模式,给予多元化评价方式并建立反馈机制促进课程的持续改进,最终达到以学生为中心,重点培养学生实践能力,提升教学效果的目的。 展开更多
关键词 OBE 工程认证 数据结构 混合式教学
下载PDF
基于BB-递归核函数SVR算法的U型折弯件模型参数优化研究
13
作者 徐承亮 胡梓枫 +1 位作者 曹志勇 张详林 《湖北大学学报(自然科学版)》 CAS 2024年第1期115-121,共7页
影响U型折弯件回弹的因素众多,工件尺寸、力学性能、负载条件、材料各向异性等相互耦合,表现出高度复杂的非线性,从而导致回弹预测结果的不确定性。本研究以板料折弯件回弹后的张开角(α)为目标函数,构建一个递归核函数支持向量回归(SVR... 影响U型折弯件回弹的因素众多,工件尺寸、力学性能、负载条件、材料各向异性等相互耦合,表现出高度复杂的非线性,从而导致回弹预测结果的不确定性。本研究以板料折弯件回弹后的张开角(α)为目标函数,构建一个递归核函数支持向量回归(SVR)模型,并部署到分支界限法(BB)中,从而筛选出维度为4的最优的特征变量参数子集,其决定系数(R^(2))为0.982147,均方误差(MSE)为0.00433,模型预测精度相对较高。算法优化得到的折弯件参数为:厚度(t)为12 mm,上模宽度(d)为90 mm,上模圆角半径(r)为9 mm,载荷速度(v)为10 mm/s。BB递归核函数SVR算法、有限元模拟和实际测量的α分别为16.3°、17.5°和18.2°,尽管有限元结果更接近于实际值,但是BB递归核函数SVR算法可以为有限元模拟提供筛选出的参数(t,d,r,v)的数据,以快速进行模拟并预测张开角α,并实现回弹补偿装置的高效设计。 展开更多
关键词 U型折弯件 支持向量机 分支界限法 SVR算法
下载PDF
基于熵和置信度的非平衡问题欠采样Boosting框架
14
作者 冯本勇 徐勇军 《计算机应用与软件》 北大核心 2024年第1期269-277,284,共10页
为了解决传统方法中存在的边界过拟合、泛化性能差、重要信息丢失问题,提出一种基于熵和置信度的非平衡问题欠采样Boosting框架。将动态重采样方法与Boosting集成在一起,以解决边界过拟合问题,提高泛化性能;在Ecuboost中使用置信度和熵... 为了解决传统方法中存在的边界过拟合、泛化性能差、重要信息丢失问题,提出一种基于熵和置信度的非平衡问题欠采样Boosting框架。将动态重采样方法与Boosting集成在一起,以解决边界过拟合问题,提高泛化性能;在Ecuboost中使用置信度和熵作为基准,以保证欠采样过程中大多数样本的有效性和结构分布,提出的基于置信度的Boosting框架使动态采样方法进一步提升方法的泛化能力。用两个大型数据集上的实验对比结果验证了该方法的有效性。 展开更多
关键词 置信度 欠采样 不平衡
下载PDF
基于ChatGPT的医院租金收入财务管理智能化浅探
15
作者 周莹 李凡 胡杨 《现代医院》 2024年第4期606-609,共4页
为了规范医院租金收入的财务管理,保证国有资产的保值增值,同时兼顾成本与效益,近年来,医院财务部门一直把信息化作为工作中的重要抓手。ChatGPT特有的深度学习、人机协同能力,能很好地助力医院租金收入管理系统实现从非智能化向智能化... 为了规范医院租金收入的财务管理,保证国有资产的保值增值,同时兼顾成本与效益,近年来,医院财务部门一直把信息化作为工作中的重要抓手。ChatGPT特有的深度学习、人机协同能力,能很好地助力医院租金收入管理系统实现从非智能化向智能化的转变,系统升级后医院将实现租金收入的预算填报、会计核算、台账生成、报告出具与更新工作自动化。由此可见,ChatGPT技术的应用不仅能减轻财务部门重复且大量的日常核算工作压力,它对财务基础数据质量提升,及高效的财务预测、分析、决策更是意义重大。 展开更多
关键词 ChatGPT 公立医院 智慧医院 租金收入 智能化
下载PDF
实时数据库数据的批量写入及性能测试研究
16
作者 李群 邓先永 +1 位作者 吴海莉 宋艳 《软件》 2024年第1期75-78,共4页
通过对石油化工行业使用较多的PHD实时数据库在多模式下的数据批量写入,以标准差指标对测试值进行可信度分析、测试调校,得出多模式下实时数据批量修改、更新测试的最优结果,探索一种行之有效的工业实时数据库优化、应用的方法。
关键词 实时数据库 JAVA 测试
下载PDF
基于ChatGPT的课程学习助手系统的设计与实现
17
作者 孙洪迪 贾民政 杨民峰 《北京工业职业技术学院学报》 2024年第1期17-22,共6页
计算机编程语言类课程在学生学习和教师教学过程中遇到诸多困难,聊天机器人程序ChatGPT的出现,为该类课程的学习带来新的尝试。通过设计一款基于ChatGPT的计算机编程语言类课程学习助手系统,帮助学生解决程序代码输入量少、程序代码输... 计算机编程语言类课程在学生学习和教师教学过程中遇到诸多困难,聊天机器人程序ChatGPT的出现,为该类课程的学习带来新的尝试。通过设计一款基于ChatGPT的计算机编程语言类课程学习助手系统,帮助学生解决程序代码输入量少、程序代码输出困难的问题。从ChatGPT接入、数据集构建到关键字配置三个方面阐述系统的设计和实现,并通过实际运行测试,效果良好。 展开更多
关键词 聊天机器人程序 课程学习助手 计算机编程语言
下载PDF
基于数据挖掘的电炉企业财务数据分类管理系统设计
18
作者 王冠卓 刘大旭 孙聪 《工业加热》 CAS 2024年第3期59-63,共5页
为提升电炉企业财务数据处理效率、提高财务数据分类管理效果,本文研究提出并设计出了一种基于数据挖掘的财务数据分类管理系统。设计系统主要在传统硬件的基础上,优化系统功能模块,其主要包括财务数据管理模块、网络管理模块等。在财... 为提升电炉企业财务数据处理效率、提高财务数据分类管理效果,本文研究提出并设计出了一种基于数据挖掘的财务数据分类管理系统。设计系统主要在传统硬件的基础上,优化系统功能模块,其主要包括财务数据管理模块、网络管理模块等。在财务数据管理模块中,本次采用数据挖掘方法确定属性相似的财务数据,并借助Hadoop架构对电炉企业财务数据进行管理;在系统网络管理模块中,通过光纤/DDN传输中实现系统通信网络拓扑的搭建,并在TCP/IP等通信协议的支持下,完成网络管理模块的设计。通过优化各个功能模块,完成电炉企业财务数据分类管理系统设计,实现电炉企业财务数据分类管理功能。实验结果表明:所提系统响应速度快,CPU占有率低,分类管理准确度高于93%,用户反馈满意率高于80%,均优于对比方法,具有较大的应用价值。 展开更多
关键词 数据挖掘 人工智能 电炉企业财务数据 数据分类 管理系统
下载PDF
基于MEC边缘云的智慧商城数据更新控制算法
19
作者 陈占伟 胡晓 《计算机仿真》 2024年第2期477-481,共5页
针对智慧商城中数据量较大的问题,提出基于MEC边缘云的智慧商城数据更新控制算法。在MEC边缘云环境中将数据信息经过整合分类处理后直接推送至用户端,将万有引力搜索算法和布谷鸟搜索算法融合构建CS-GSA算法,用于MEC边缘云智慧商城数据... 针对智慧商城中数据量较大的问题,提出基于MEC边缘云的智慧商城数据更新控制算法。在MEC边缘云环境中将数据信息经过整合分类处理后直接推送至用户端,将万有引力搜索算法和布谷鸟搜索算法融合构建CS-GSA算法,用于MEC边缘云智慧商城数据库数据清洗。在差分数据更新方法中引入游程编码和哈夫曼编码,采用游程编码将连续重复的数据压缩处理,降低数据规模,然后通过哈夫曼编码再次压缩,降低传输过程中的通信开销,实现MEC边缘云智慧商城数据更新。实验结果表明,所提方法的解编码时间、数据更新时间更短、通信开销较小,说明其能够提高数据更新质量。 展开更多
关键词 边缘云 智慧商城 数据更新控制 数据清洗 差分数据更新
下载PDF
基于权重距离的优势边界小类样本合成算法
20
作者 何田中 郑艺峰 胡敏杰 《闽南师范大学学报(自然科学版)》 2024年第1期54-64,共11页
提出基于权重距离的优势边界小类样本合成算法(ABWD)来克服数据类别不平衡的问题.ABWD算法具有如下特点:1)定义权重距离,并基于该距离选取样本近邻;2)根据样本近邻确定该样本是否为小类的边界样本;3)对每个小类的边界样本确定其合成位... 提出基于权重距离的优势边界小类样本合成算法(ABWD)来克服数据类别不平衡的问题.ABWD算法具有如下特点:1)定义权重距离,并基于该距离选取样本近邻;2)根据样本近邻确定该样本是否为小类的边界样本;3)对每个小类的边界样本确定其合成位置与合成数量,使该小类样本合成后近邻中小类个数不少于大类的个数,确保该小类样本具有优势边界.实验结果表明,与其他典型过抽样算法相比,算法较大提高了小类的分类性能,在G-mean、F-measure及查全率三种度量上均取得很好的实验结果. 展开更多
关键词 数据挖掘 不平衡数据 过抽样 优势边界 权重距离
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部