期刊文献+
共找到29,372篇文章
< 1 2 250 >
每页显示 20 50 100
基于Sub-Nyquist采样的单通道频谱感知技术 被引量:4
1
作者 杨鹏 樊昀 +2 位作者 黄知涛 柳征 姜文利 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期121-127,共7页
宽带频谱感知技术在认知无线电中具有广泛的应用。基于时分的思想,将信号采集时间以固定长度的时间片进行划分,分别与不同的伪随机码信号相乘,经过低通滤波和sub-Nyquist采样,利用采样数据求出信号的频率支集。与已有的多通道频谱感知... 宽带频谱感知技术在认知无线电中具有广泛的应用。基于时分的思想,将信号采集时间以固定长度的时间片进行划分,分别与不同的伪随机码信号相乘,经过低通滤波和sub-Nyquist采样,利用采样数据求出信号的频率支集。与已有的多通道频谱感知结构相比,本文用相对简单的单通道结构实现,同样能够利用低速率的采样点完成频谱感知。仿真实验结果表明,在信号的频率支集未知的情况下,该算法能够有效利用sub-Nyquist采样的数据实现频谱感知。 展开更多
关键词 时分 sub-nyquist采样 单通道 频谱感知 认知无线电
下载PDF
利用字典优化方法实现sub-Nyquist采样数据的频率估计 被引量:1
2
作者 杨鹏 柳征 姜文利 《宇航学报》 EI CAS CSCD 北大核心 2013年第12期1614-1620,共7页
在稀疏重构理论中,重构信号需要预先设定稀疏表示字典,针对预设字典与真实字典之间的失配对信号稀疏表示造成的不利影响,提出一种基于字典优化和稀疏贝叶斯学习(Sparse Bayesian Learning,SBL)的频率估计算法。该算法首先构造基于sub-Ny... 在稀疏重构理论中,重构信号需要预先设定稀疏表示字典,针对预设字典与真实字典之间的失配对信号稀疏表示造成的不利影响,提出一种基于字典优化和稀疏贝叶斯学习(Sparse Bayesian Learning,SBL)的频率估计算法。该算法首先构造基于sub-Nyquist采样数据的信号稀疏表达式,然后利用SBL算法估计信号频率,同时根据估计结果优化字典,最后反复迭代上述步骤直至计算出的频率值和对应的幅度值趋于稳定。仿真结果校验了方法的有效性。 展开更多
关键词 sub-nyquist采样 随机解调器 稀疏贝叶斯学习 字典优化 频率估计
下载PDF
基于重采样和混合集成学习的不平衡窃电检测 被引量:2
3
作者 游文霞 梁皓 +3 位作者 杨楠 李清清 吴永华 李文武 《电网技术》 EI CSCD 北大核心 2024年第2期730-739,共10页
针对电力用户类别不平衡导致窃电检测具有偏向性问题,该文提出一种基于重采样和混合集成学习的不平衡窃电检测模型。首先以Easy-ensemble混合集成学习框架为基础确定最佳采样子集数;然后通过重采样自适应策略,即根据用户用电数据集的不... 针对电力用户类别不平衡导致窃电检测具有偏向性问题,该文提出一种基于重采样和混合集成学习的不平衡窃电检测模型。首先以Easy-ensemble混合集成学习框架为基础确定最佳采样子集数;然后通过重采样自适应策略,即根据用户用电数据集的不平衡度以及最佳采样子集数确定检测模型的重采样方式,使用电数据达到平衡;最后按照先串行集成减小偏差、后并行集成降低方差的混合集成方式,对重采样后的均衡样本进行窃电检测。算例对比分析表明所提检测模型通过重采样和混合集成有效解决了传统集成算法在不平衡窃电检测中的偏向问题,降低了由于用电数据的不平衡性对集成结果的影响,提高了用户类别不平衡的窃电检测效果,在多种不平衡度下模型的准确率、F1值和G均值均表现优异。 展开更多
关键词 窃电检测 不平衡数据 采样 集成学习 Easy-Ensemble集成框架
下载PDF
基于邻域采样的多任务图推荐算法
4
作者 张俊三 肖森 +3 位作者 高慧 邵明文 张培颖 朱杰 《计算机工程与应用》 CSCD 北大核心 2024年第9期172-180,共9页
近年来,图神经网络(GNN)成为解决协同过滤的主流方法之一。它通过构建用户-物品图,模拟用户与物品的交互关系,并用GNN学习它们的特征表示。尽管现有在模型结构上的研究已取得了较大进展,但如何在图结构上更有效地进行负采样仍未有效解... 近年来,图神经网络(GNN)成为解决协同过滤的主流方法之一。它通过构建用户-物品图,模拟用户与物品的交互关系,并用GNN学习它们的特征表示。尽管现有在模型结构上的研究已取得了较大进展,但如何在图结构上更有效地进行负采样仍未有效解决。为此,提出一种基于邻域采样的多任务图推荐算法。该算法提出了一种基于GNN的邻域采样策略,该策略以每个用户为中心构建子图,将次高阶物品作为用户邻域采样的负样本,可以更有效地挖掘强负样本并提高采样质量。通过GNN对图结点进行信息聚合与特征提取,得到结点的最终嵌入表示。设计一种余弦边际损失来过滤部分冗余负样本,以有效减少采样过程中的噪声数据。同时,该算法引入了多任务策略对模型进行联合优化,以增强模型的泛化能力。在3个公开数据集上进行的大量实验表明,该算法在大多数情况下明显优于其他主流算法。 展开更多
关键词 图神经网络 协同过滤 采样 邻域采样 余弦边际损失 多任务策略
下载PDF
基于均匀相位采样提高阻抗谱测量精度的研究
5
作者 王选择 蔡玉雄 +2 位作者 尹晋平 翟中生 冯维 《科学技术与工程》 北大核心 2024年第2期604-610,共7页
周期性信号采样中,等效采样利用较低采样频率的A/D转换实现高频周期信号的采集,一定程度上弥补欠采样测量精度低的缺陷。为了有效地提高高频测量中阻抗谱测量精度与稳定性,提出一种基于等效采样思想的均匀相位采样的阻抗谱测量方法。利... 周期性信号采样中,等效采样利用较低采样频率的A/D转换实现高频周期信号的采集,一定程度上弥补欠采样测量精度低的缺陷。为了有效地提高高频测量中阻抗谱测量精度与稳定性,提出一种基于等效采样思想的均匀相位采样的阻抗谱测量方法。利用单片机共时钟基准的模/数转换器(digital to analog convertor,DAC)与数/模转换器(analog to digital convertor,ADC)模块,在完成激励信号产生、输入输出信号同步采集的基础上,合理设计激励信号频率、采集频率与信号重构方法,实现高频信号单周期内均匀相位分布的等效高频采样,同时为克服常规A/D转换速度条件下难以准确实现高频阻抗谱测量的问题提供了新思路。从误差假设与拟合算法的角度,理论上分析证明了该方法降低误差的原因。并通过两种等效电路模型的阻抗谱测量对比实验,表明该方法在所设计的20~100 kHz高频段上,阻抗测量精度与稳定性得到了显著的提高。 展开更多
关键词 等效采样 均匀相位采样 阻抗谱 畸变误差
下载PDF
危险废物鉴别采样技术要点解析
6
作者 郝雅琼 黄泽春 +1 位作者 杨玉飞 傅海辉 《环境工程技术学报》 CAS CSCD 北大核心 2024年第3期1043-1047,共5页
我国危险废物产生源和种类非常复杂,产生量巨大且持续增长,规范化环境管理和污染防治面临较大压力。危险废物鉴别是识别固体废物危险特性和确定危险废物环境管理对象的重要技术手段和关键依据。根据危险废物鉴别经验以及发布的危险废物... 我国危险废物产生源和种类非常复杂,产生量巨大且持续增长,规范化环境管理和污染防治面临较大压力。危险废物鉴别是识别固体废物危险特性和确定危险废物环境管理对象的重要技术手段和关键依据。根据危险废物鉴别经验以及发布的危险废物鉴别报告复核工作简报发现,部分鉴别单位在危险废物鉴别过程中,由于对HJ 298—2019《危险废物鉴别技术规范》中采样技术要求未充分掌握,采样不规范,致使危险废物鉴别结论依据不充分甚至错误。因此,对确定生产工艺过程中产生废水处理污泥采样对象、堆存状态固体废物采样对象、平行线固体废物份样数、连续产生固体废物采样时间和频次、间歇产生固体废物采样时间和频次、生产工艺过程产生固体废物的采样方法等采样技术要求进行解析,同时给出了常见的错误采样方式,以期为危险废物鉴别过程中样品采集提供借鉴。 展开更多
关键词 危险废物 鉴别 采样 技术要求 环境管理
下载PDF
基于径流事件的农业面源监测采样间隔分析
7
作者 王超 王剑 +4 位作者 文立群 秦赫 柳根 贾海燕 尹炜 《中国环境科学》 EI CAS CSCD 北大核心 2024年第2期1085-1093,共9页
选择丹江口库区的五龙池小流域为对象,以典型降雨径流事件的水质水量加密监测数据作为径流过程真实值,通过不同时间间隔和水量间隔模拟采样,分析污染负荷通量估算误差,并确定有效采样间隔.结果显示,五龙池小流域降雨径流事件具有明显的... 选择丹江口库区的五龙池小流域为对象,以典型降雨径流事件的水质水量加密监测数据作为径流过程真实值,通过不同时间间隔和水量间隔模拟采样,分析污染负荷通量估算误差,并确定有效采样间隔.结果显示,五龙池小流域降雨径流事件具有明显的峰值特征(初始流量55m^(3)/h,峰值流量977.3m^(3)/h),TP浓度与径流高度同步(初始浓度为0.05mg/L,峰值浓度为0.25mg/L),TN随径流达到峰值后下降不明显(初始浓度为2mg/L,峰值浓度为8mg/L).模拟采样表明,时间间隔5,10,15,20,30,60,120,240,480,720min,采样点数量从1957个减少到14个;水量间隔16,32,64,128,256,384,576,800,1600,3200m^(3),采样点数量从2893个减少到14个;水量间隔采样对径流峰值的捕捉能力明显高于时间间隔采样.负荷估算误差显示,TP误差波动大于TN;以±5%作为允许的误差范围,降雨径流事件采样监测的有效时间间隔为120min,有效水量间隔为1600m^(3). 展开更多
关键词 降雨径流事件 小流域 农业面源 自动监测 采样间隔
下载PDF
蜜蜂资源形态测定的采样与保存方法研究
8
作者 庄明亮 李剑飞 +6 位作者 迟永娟 葛蓬 王志 蒋海宾 王进州 戚竞文 李志勇 《特产研究》 2024年第2期22-24,29,共4页
形态测定是蜜蜂种质资源评价必不可少的技术手段,本研究旨在优化采样与保存方法来提高蜜蜂形态测定工作的效率。通过各试验组不同采样与保存方法对比蜜蜂样品的伸吻率、组织损坏数量、色度及韧性的变化。结果表明,试验组B毙杀20 s、30s... 形态测定是蜜蜂种质资源评价必不可少的技术手段,本研究旨在优化采样与保存方法来提高蜜蜂形态测定工作的效率。通过各试验组不同采样与保存方法对比蜜蜂样品的伸吻率、组织损坏数量、色度及韧性的变化。结果表明,试验组B毙杀20 s、30s的伸吻率差异不显著(P>0.05),但均显著高于其他试验组(P<0.05);试验组D的蜜蜂组织损坏数量显著低于试验组E、F、G和对照组(P<0.05);在4℃环境中保存1~3个月对蜜蜂样本的色度和样本的韧性均没有影响。蜜蜂资源形态测定的样品建议使用2L/min流速的CO_(2)毙杀20 s,浸泡在75%酒精和0.5%甘油的保存液中,保存3个月内完成形态测定工作。 展开更多
关键词 蜜蜂 采样 保存 资源鉴定 形态测定
下载PDF
基于熵和置信度的非平衡问题欠采样Boosting框架
9
作者 冯本勇 徐勇军 《计算机应用与软件》 北大核心 2024年第1期269-277,284,共10页
为了解决传统方法中存在的边界过拟合、泛化性能差、重要信息丢失问题,提出一种基于熵和置信度的非平衡问题欠采样Boosting框架。将动态重采样方法与Boosting集成在一起,以解决边界过拟合问题,提高泛化性能;在Ecuboost中使用置信度和熵... 为了解决传统方法中存在的边界过拟合、泛化性能差、重要信息丢失问题,提出一种基于熵和置信度的非平衡问题欠采样Boosting框架。将动态重采样方法与Boosting集成在一起,以解决边界过拟合问题,提高泛化性能;在Ecuboost中使用置信度和熵作为基准,以保证欠采样过程中大多数样本的有效性和结构分布,提出的基于置信度的Boosting框架使动态采样方法进一步提升方法的泛化能力。用两个大型数据集上的实验对比结果验证了该方法的有效性。 展开更多
关键词 置信度 采样 不平衡
下载PDF
面向大数据的可扩展正则采样并行排序算法
10
作者 王莹 陈志广 卢宇彤 《大数据》 2024年第4期89-105,共17页
排序算法是计算机科学领域的一个基础算法,是大量应用的算法核心。在大数据时代,随着数据量的极速增长,并行排序算法受到广泛关注。现有的并行排序算法普遍存在通信开销过大、负载不均衡等问题,导致算法难以大规模扩展。针对以上问题,... 排序算法是计算机科学领域的一个基础算法,是大量应用的算法核心。在大数据时代,随着数据量的极速增长,并行排序算法受到广泛关注。现有的并行排序算法普遍存在通信开销过大、负载不均衡等问题,导致算法难以大规模扩展。针对以上问题,提出一种大规模可扩展的正则采样并行排序(scalable parallel sorting by regular sampling,ScaPSRS)算法,摒弃传统正则采样并行排序(parallel sorting by regular sampling,PSRS)算法中由一个进程负责采样的做法,转而让所有进程参与正则采样,选出p-1个分隔元素,将整个数据集划分成p个不相交的子集,然后实施并行排序,避免了单一进程的采样瓶颈。此外,ScaPSRS采用一种新的迭代更新策略选择p-1个分隔元素,保证划分的p个子集尽可能大小相同,从而确保p个进程对各自的子集进行本地排序时的负载均衡。在天河二号超级计算机上进行的大量实验表明,ScaPSRS算法能够成功地扩展到32000个内核,性能比PSRS算法和Hofmann等人提出的分区算法分别提升了3.7倍和11.7倍。 展开更多
关键词 并行排序 正则采样 负载均衡 大数据
下载PDF
基于高倍过采样与加窗插值FFT的电力谐波分析
11
作者 张鸿博 熊军华 蔡晓峰 《电力系统保护与控制》 EI CSCD 北大核心 2024年第5期105-115,共11页
为提高谐波分析精度,分析了信号加窗引起的信噪比损失以及AD转换产生的量化误差,阐述了过采样技术提高信噪比的原理。在此基础上,提出了基于高倍过采样和加窗插值快速傅里叶变换(fast Fourier transform, FFT)的谐波分析方法。该方法充... 为提高谐波分析精度,分析了信号加窗引起的信噪比损失以及AD转换产生的量化误差,阐述了过采样技术提高信噪比的原理。在此基础上,提出了基于高倍过采样和加窗插值快速傅里叶变换(fast Fourier transform, FFT)的谐波分析方法。该方法充分利用AD转换器的潜力,以尽量高的采样速率进行AD采样,同时通过均值滤波避免高倍过采样引起的采样数据量激增问题。详细研究了所提谐波分析方法对信号中谐波分量幅值和相位的影响,并给出了简洁实用的谐波幅值和相位校正方法。仿真表明,所提方法可在不增加系统成本的前提下改善加窗插值FFT的抗噪声能力,提高谐波分析精度。 展开更多
关键词 插值FFT 窗函数 谐波分析 量化误差 采样 校正
下载PDF
计及采样扰动抑制的电压源逆变器三矢量无模型预测电流控制方法
12
作者 胡存刚 尹政 +3 位作者 芮涛 陆格野 曹文平 唐曦 《中国电机工程学报》 EI CSCD 北大核心 2024年第6期2408-2417,I0027,共11页
针对传统电压源逆变器无模型预测电流控制(model-free predictive current control,MFPCC)方法存在电流纹波大、电流梯度更新停滞以及预测性能易受采样扰动影响的问题。该文提出一种计及采样扰动的三矢量MFPCC方法。在一个控制周期应用... 针对传统电压源逆变器无模型预测电流控制(model-free predictive current control,MFPCC)方法存在电流纹波大、电流梯度更新停滞以及预测性能易受采样扰动影响的问题。该文提出一种计及采样扰动的三矢量MFPCC方法。在一个控制周期应用3个基本矢量,并根据价值函数计算矢量作用时间,降低了输出电流纹波;其次,通过建立不同矢量作用下的电流梯度方程组,实现电流梯度数据的实时更新,消除了停滞现象;再次,分析采样扰动对MFPCC的影响,采用扩张状态观测器估计采样扰动以补偿预测电流控制,抑制其对输出电流的影响。最后,通过仿真和实验,对所提方法的有效性进行了验证。 展开更多
关键词 电压源逆变器 无模型预测电流控制 三矢量 电流梯度更新 采样扰动
下载PDF
基于批数据过采样的中医临床记录四诊描述抽取方法
13
作者 王亚强 李凯伦 +1 位作者 舒红平 蒋永光 《中文信息学报》 CSCD 北大核心 2024年第2期121-131,共11页
中医临床记录四诊描述抽取对中医临床辨证论治的提质增效具有重要的应用价值,然而该任务尚有待探索,类别分布不均衡是该任务面临的关键挑战之一。该文围绕中医临床记录四诊描述抽取任务展开研究,首先构建了中医临床四诊描述抽取语料库;... 中医临床记录四诊描述抽取对中医临床辨证论治的提质增效具有重要的应用价值,然而该任务尚有待探索,类别分布不均衡是该任务面临的关键挑战之一。该文围绕中医临床记录四诊描述抽取任务展开研究,首先构建了中医临床四诊描述抽取语料库;然后基于无标注的中医临床记录微调通用预训练语言模型实现该模型的领域适应;最后利用小规模标注数据,采用批数据过采样算法,完成中医临床记录四诊描述抽取模型的训练。实验结果表明,该文提出的抽取方法的总体性能均优于对比方法,并且与对比方法的最优结果相比,该文方法将少见类别的抽取性能F1值平均提升了2.13%。 展开更多
关键词 中医临床记录 四诊描述抽取 类别分布不均衡 批数据过采样
下载PDF
图采样泛化行人重识别算法
14
作者 闵锋 毛一新 +3 位作者 况永刚 彭伟明 郝琳琳 吴波 《计算机工程与应用》 CSCD 北大核心 2024年第14期219-227,共9页
最近的研究表明,度量学习中的深度特征匹配方法,结合大规模、多样化的训练数据,可以显著增强人员再识别的泛化能力。然而,许多现有的方法会产生大量的内存和计算成本,如分类参数或类记忆学习等。为解决上述问题,提出了一种新的基于相关... 最近的研究表明,度量学习中的深度特征匹配方法,结合大规模、多样化的训练数据,可以显著增强人员再识别的泛化能力。然而,许多现有的方法会产生大量的内存和计算成本,如分类参数或类记忆学习等。为解决上述问题,提出了一种新的基于相关性图采样(correlation graph sampler,CGS)的泛化行人重识别算法,CGS的基本思想是在训练开始时使用局部敏感哈希函数(locality-sensitive Hashing,LSH)和特征度量为所有类构造最近邻关系图。这确保了每一小批训练样本由随机选择的基类和与基类具有相似性的近邻类组成,以提供信息量大且具有挑战性的学习示例,提高行人重识别模型的判别性学习能力。CGS的采样原理会受主干网提取的特征质量影响,因此CGS采样能力会随着主干网的训练而增强,具有可学习性。通过在大规模数据集(包括CUHK03、Market-1501和MSMT17)上交叉评估该方法,广泛的实验结果证实了该方法的有效性,并展示了其在行人重识别应用中的潜力。 展开更多
关键词 行人重识别 度量学习 相关性图采样 局部敏感哈希函数
下载PDF
不平衡数据集的DC-SMOTE过采样方法
15
作者 冀常鹏 尚佳奇 代巍 《智能系统学报》 CSCD 北大核心 2024年第3期525-533,共9页
针对不平衡数据集在分类任务中表现不佳的问题,提出基于局部密度与集中度的过采样算法。针对数据集中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与集中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决... 针对不平衡数据集在分类任务中表现不佳的问题,提出基于局部密度与集中度的过采样算法。针对数据集中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与集中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决类内不平衡问题。根据集中度的不同,区分出少数类样本的边界,有针对性地合成第二类新样本,达到强化边界的作用;同时,通过自适应生成新样本,有效解决大部分过采样算法没有明确过采样量或者盲目追求样本平衡度相等的问题。最后,在公开的12个不平衡数据集上进行了实验,实验结果表明,本算法在低不平衡数据集与高不平衡数据集上的应用均拥有良好的表现。 展开更多
关键词 不平衡数据集 采样 高斯核函数 局部引力 高不平衡数据 合成少数类过采样 不平衡度 分类
下载PDF
基于改进NSGA-Ⅱ的纤维缠绕落纱点轨迹采样特征权重优化
16
作者 田会方 仇振兴 吴迎峰 《复合材料科学与工程》 CAS 北大核心 2024年第1期54-59,共6页
针对基于空间特征曲线特征函数的纤维缠绕落纱点轨迹采样算法无法自动选择特征权重的问题,建立以特征权重为变量,以得到采样点线性插值生成曲线与原曲线的MAE,RMSE为目标函数的双目标优化模型。提出基于改进NSGA-Ⅱ算法的双目标优化求... 针对基于空间特征曲线特征函数的纤维缠绕落纱点轨迹采样算法无法自动选择特征权重的问题,建立以特征权重为变量,以得到采样点线性插值生成曲线与原曲线的MAE,RMSE为目标函数的双目标优化模型。提出基于改进NSGA-Ⅱ算法的双目标优化求解方法以优化特征权重。实例验证表明,与传统NSGA-Ⅱ算法相比,改进NSGA-Ⅱ算法求得Pareto解集的MAE,RMSE平均下降了0.002和0.105,算法选取特征权重的MAE,RMSE比特征权重为(0.1,0.3)的MAE,RMSE分别降低了约12.9%和8.5%,比特征权重为(0.9,0.1)的MAE,RMSE分别降低了约20.6%和11.4%,有效地提高了落纱点轨迹采样的精度。 展开更多
关键词 落纱点轨迹采样 空间曲线特征函数 NSGA-Ⅱ算法 复合材料
下载PDF
基于电压-电流采样轨迹的混合直流输电线路纵联保护方法
17
作者 戴志辉 石旭 《电网技术》 EI CSCD 北大核心 2024年第5期2179-2188,I0108,I0109-I0112,共15页
为提高混合直流输电系统线路保护的抗干扰能力和适用范围,提出一种基于电压-电流采样轨迹的直流输电线路保护方案。首先,从理论上分析了直流线路故障时测量电压与测量电流之间的关系,揭示了区内/外故障时的电压-电流线性度差异。然后,... 为提高混合直流输电系统线路保护的抗干扰能力和适用范围,提出一种基于电压-电流采样轨迹的直流输电线路保护方案。首先,从理论上分析了直流线路故障时测量电压与测量电流之间的关系,揭示了区内/外故障时的电压-电流线性度差异。然后,以区外故障时电压-电流所服从的线性模型作为假设模型,将实测数据得到的采样轨迹与假设模型对应的直线进行比对,引入拟合优度指标作为特征量来量化并放大实测数据与假设模型的差异,并进一步给出直流输电线路保护方案。最后,在PSCAD/EMTDC中建模并仿真分析了多种因素对所提保护方案的影响,结果表明所提保护方案能够可靠、快速地识别直流输电线路故障,在高阻和强噪声的场景下仍可适用,且无需提取特征频带,无需双端数据严格同步,对于保护装置的采样率要求较低,易实现工程应用。 展开更多
关键词 混合直流输电 纵联保护 采样轨迹 线性拟合
下载PDF
基于欠采样和多层集成学习的恶意网页识别
18
作者 王法玉 于晓文 陈洪涛 《计算机工程与设计》 北大核心 2024年第3期669-675,共7页
现实中恶意网页与良性网页比重严重失衡,传统的机器学习分类模型不能很好的应用,为此提出一种基于欠采样和多层集成学习的恶意网页检测模型。通过欠采样达到局部数据平衡;通过第一层基于权重和阈值的集成学习确保模型的准确度;通过第二... 现实中恶意网页与良性网页比重严重失衡,传统的机器学习分类模型不能很好的应用,为此提出一种基于欠采样和多层集成学习的恶意网页检测模型。通过欠采样达到局部数据平衡;通过第一层基于权重和阈值的集成学习确保模型的准确度;通过第二层基于投票的集成学习保证全局信息的完整性。实验结果表明,所提模型在不平衡数据集上的恶意网页识别性能优于传统机器学习模型。 展开更多
关键词 恶意网页识别 不平衡数据 多层分类器 采样 机器学习 集成学习 检测效果
下载PDF
基于动态邻域采样的社交推荐模型
19
作者 蔡晓东 周青松 叶青 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第2期32-41,共10页
基于图神经网络的社交推荐模型在提升推荐系统性能方面有不错的表现。但现有方法都忽略了被查询的目标用户和项目节点与其邻居节点间可能存在特征不匹配的问题,导致噪声的引入而降低了模型性能。为了解决该问题,文中提出一种社交推荐模... 基于图神经网络的社交推荐模型在提升推荐系统性能方面有不错的表现。但现有方法都忽略了被查询的目标用户和项目节点与其邻居节点间可能存在特征不匹配的问题,导致噪声的引入而降低了模型性能。为了解决该问题,文中提出一种社交推荐模型DNSSR。首先构建一个包含用户和项目多元关系的关系图谱,图节点间信息关联更丰富;然后利用动态邻域采样机制获得与目标查询对的特征更一致的邻居节点,减少了噪声信息;另外,为了进一步提高模型预测性能,设计了一种增强型图神经网络对采样后得到的关系子图进行建模,它可以区分不同邻居节点的重要性并选择更可靠的信息源,获得更鲁棒的用户和项目嵌入向量用于评分预测。实验结果表明:相比其他先进模型,该模型预测误差明显降低,证明了文中所提各项方法的有效性;尤其是动态邻域采样机制,若将其弃用,DNSSR在Ciao数据集上的RMSE(均方根误差)和MAE(平均绝对误差)指标将分别上升6.05%和7.31%,在Epinions数据集上则分别上升3.49%和5.41%,充分验证了其能有效降低噪声干扰、提高社交推荐模型的性能。 展开更多
关键词 社交推荐 评分预测 图神经网络 动态邻域采样
下载PDF
结合聚类边界采样的主动学习
20
作者 胡峰 李路正 +1 位作者 代劲 刘群 《智能系统学报》 CSCD 北大核心 2024年第2期482-492,共11页
主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的... 主动学习是一种机器学习方法,需要选择最有价值的样本进行标注。目前,主动学习在应用时面临着一些挑战,其依赖分类器的先验假设,这容易导致分类器性能意外下降,同时需要一定规模的样本作为启动条件。聚类可以降低问题规模,是主动学习的一种有效手段。为此,结合密度聚类边界采样,开展主动学习方法的研究。针对容易产生分类错误的聚类边界区域,通过计算样本密度,提出一种密度峰值聚类边界点采样方法;在此基础上,给出密度熵的定义,并利用密度熵对聚类边界区域进行启发式搜索,提出一种基于聚类边界采样的主动学习方法。试验结果表明,与文献中的5种主动学习算法相比,该算法能够以更少标记量获得同等甚至更高的分类性能,是一种有效的主动学习算法;在标记不足,无标签样本总量20%的情况下,算法在Accuracy、F-score等指标上取得较好的结果。 展开更多
关键词 主动学习 机器学习 聚类边界 密度峰值聚类 几何采样 信息熵 版本空间 主动聚类
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部