期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于构造性神经网络与全局密度信息的不平衡数据欠采样方法 被引量:1
1
作者 严远亭 马迎澳 +1 位作者 任艳平 张燕平 《计算机科学》 CSCD 北大核心 2023年第10期48-58,共11页
多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样... 多数类欠采样是当前数据层面解决不平衡数据学习的主流技术之一,近年来,研究者们提出了一系列的欠采样方法,但大多都将重点放在如何选择代表性的样本,从而降低信息损失。然而,如何在欠采样过程中保持多数类内部的结构信息,仍然是欠采样面临的主要挑战。针对该挑战,提出了一种基于构造性神经网络和全局分布密度的不平衡数据集欠采样方法。该方法首先基于构造性神经网络,设计了一种多数类局部模式的学习方法;然后基于多数类局部模式,设计了两种具有结构保持特性的样本选择策略;最后针对局部模式学习的随机性可能导致的采样结果非优的问题,进一步引入了bagging集成策略,提升了方法的性能。在59个数据集上与13种对比方法进行了对比实验,验证了所提方法在G-mean,AUC和F1-score这3个常用指标上的有效性。 展开更多
关键词 欠采样 不平衡数据 分布密度 构造性神经网络 集成学习
下载PDF
邻域信息修正的不完整数据多填充集成分类方法 被引量:1
2
作者 朱先远 严远亭 张燕平 《计算机工程与应用》 CSCD 北大核心 2023年第23期125-135,共11页
不完整数据集分类前需要对缺失值先填充。目前已有了一些经典的缺失值填充算法,如均值填充、K近邻填充等。它们各有优势,但这些算法对缺失值的估算易受到与缺失值相关性不大的其他数据干扰,影响缺失值填充效果,进而影响后续分类性能。... 不完整数据集分类前需要对缺失值先填充。目前已有了一些经典的缺失值填充算法,如均值填充、K近邻填充等。它们各有优势,但这些算法对缺失值的估算易受到与缺失值相关性不大的其他数据干扰,影响缺失值填充效果,进而影响后续分类性能。针对该问题,提出一种邻域信息修正不完整数据多填充集成分类方法。该方法通过嵌入修正填充模块来优化填充过程,利用纯度和邻域半径筛选出待修正填充的近邻数据样本,并根据这些近邻数据样本对缺失值进行修正填充,进一步提升填充精度。同时,融合了多种经典填充算法优势,利用多填充的数据多样性,通过引入集成学习提升分类精确度。实验结果表明,该方法对基准数据集上的缺失值填充效果、数据分类精确度都优于对比方法,同时在真实不完整数据集上也表现出更好的分类精确度。 展开更多
关键词 不完整数据分类 修正填充 邻域信息 集成学习
下载PDF
邻域感知的不平衡数据集过采样方法 被引量:4
3
作者 严远亭 戴涛 +2 位作者 张以文 赵姝 张燕平 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1360-1370,共11页
不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效... 不平衡数据学习是机器学习中一个研究热点,近年来得到广泛的关注.以SMOTE为代表的过采样方法是不平衡数据学习的主流方法之一,近年来涌现出大量的基于SMOTE的改进过采样方法.但是,当前对过采样的研究中,如何利用样本分布信息,实现高效的过采样,仍然是一个具有挑战的问题.本文提出一种有监督的样本空间分布学习方法,用以学习少数类样本的局部邻域信息,并以局部邻域信息约束过采样过程中样本的合成,以降低线性插值可能带来的噪声以及样本重叠等不利因素,从而提高过采样的效率.在典型不平衡数据集上的实验表明,利用少数类样本邻域信息为约束,能有效提升过采样的效率. 展开更多
关键词 不平衡学习 过采样 SMOTE 邻域信息 噪声样本
下载PDF
构造性覆盖算法的SMOTE过采样方法 被引量:8
4
作者 严远亭 朱原玮 +2 位作者 吴增宝 张以文 张燕平 《计算机科学与探索》 CSCD 北大核心 2020年第6期975-984,共10页
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数... 如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点。合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一。近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能。然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题。此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视。针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE。CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法。在12个典型的不平衡数据集上验证CMOTE算法的性能。实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力。 展开更多
关键词 不平衡数据 过采样技术 合成少数类过采样技术(SMOTE) 构造性覆盖算法(CCA)
下载PDF
构造性覆盖下不完整数据修正填充方法 被引量:4
5
作者 严远亭 吴亚亚 +1 位作者 赵姝 张燕平 《智能系统学报》 CSCD 北大核心 2019年第6期1225-1232,共8页
不完整数据处理是数据挖掘、机器学习等领域中的重要问题,缺失值填充是处理不完整数据的主流方法。当前已有的缺失值填充方法大多运用统计学和机器学习领域的相关技术来分析原始数据中的剩余信息,从而得到较为合理的值来替代缺失部分。... 不完整数据处理是数据挖掘、机器学习等领域中的重要问题,缺失值填充是处理不完整数据的主流方法。当前已有的缺失值填充方法大多运用统计学和机器学习领域的相关技术来分析原始数据中的剩余信息,从而得到较为合理的值来替代缺失部分。缺失值填充大致可以分为单一填充和多重填充,这些填充方法在不同的场景下有着各自的优势。但是,很少有方法能进一步考虑样本空间分布中的邻域信息,并以此对缺失值的填充结果进行修正。鉴于此,本文提出了一种可广泛应用于诸多现有填充方法的框架用以提升现有方法的填充效果,该框架由预填充、空间邻域信息挖掘和修正填充三部分构成。本文对7种填充方法在8个UCI数据集上进行了实验,实验结果验证了本文所提框架的有效性和鲁棒性。 展开更多
关键词 不完整数据 缺失值填充 邻域信息 数据挖掘 机器学习 填充方法 单一填充 多重填充
下载PDF
高年级本科生人工智能课程教学实践与探究 被引量:13
6
作者 严远亭 张以文 +1 位作者 陈洁 张燕平 《计算机教育》 2018年第7期78-81,共4页
针对人工智能课程的特点,分析当前高年级本科生人工智能教学中存在的问题,提出从实践能力培养、科研能力培养、教学内容优化和考核方式优化4个方面对人工智能进行教学改革,并就如何构建多元化、长周期的能力培养模式进行探讨。
关键词 人工智能 高年级本科生 教学改革
下载PDF
TRABPT:一种移动P2P网络可信路由选择算法 被引量:1
7
作者 严远亭 王杨 +2 位作者 赵鹏程 南敏 许勇 《计算机应用研究》 CSCD 北大核心 2010年第9期3458-3461,共4页
针对移动P2P网络中源节点与目标节点之间如何从多条可选路径中选择可信路由的问题,基于前景理论(PT)提出了一种新的移动P2P网络可信路由选择算法TRABPT(trusted mobile P2P network routing algorithmbased on prospect theory)。利... 针对移动P2P网络中源节点与目标节点之间如何从多条可选路径中选择可信路由的问题,基于前景理论(PT)提出了一种新的移动P2P网络可信路由选择算法TRABPT(trusted mobile P2P network routing algorithmbased on prospect theory)。利用PT中的权重函数对路由过程中下一跳节点进行选择,提高了路由选择的灵活度和可信度。理论分析和仿真实验表明,本算法与DSR和Flooding算法相比在任务完成效率、平均查找时间及抵制恶意节点等方面有一定程度的改进。 展开更多
关键词 前景理论 移动P2P网络 可信路由
下载PDF
新工科背景下人工智能人才培养体系探究 被引量:3
8
作者 严远亭 张以文 +1 位作者 陈洁 张燕平 《巢湖学院学报》 2019年第3期119-125,共7页
当前我国正处于推进社会经济转型的关键时期,具有创新精神和创新能力的创新型人才是推动社会经济转型的核心支撑力,以人工智能为代表的先进技术在新经济中正发挥着越来越重要的作用。以培养创新型人才为目标的新工科建设已成为我国工程... 当前我国正处于推进社会经济转型的关键时期,具有创新精神和创新能力的创新型人才是推动社会经济转型的核心支撑力,以人工智能为代表的先进技术在新经济中正发挥着越来越重要的作用。以培养创新型人才为目标的新工科建设已成为我国工程教育界的普遍共识。教育部在高等学校人工智能创新行动计划中明确提出推进新工科建设,完善人工智能领域人才培养体系。在此背景下,在分析人工智能专业特点、借鉴国外知名高校经验的基础上,从人工智能人才的柔性培养方案制定、人工智能人才培养的课程体系构建和本-硕-博人才培养路径设计等三个方面探讨了新工科建设背景下人工智能人才培养体系的建设思路。 展开更多
关键词 新工科 人工智能 培养体系
下载PDF
TCLM-P2P:面向P2P社区的任务协作逻辑模型 被引量:7
9
作者 王杨 王汝传 +2 位作者 严远亭 韩志杰 赵保华 《计算机研究与发展》 EI CSCD 北大核心 2012年第2期270-277,共8页
P2P网络中广泛存在的"free riding"现象使其在任务协作领域的应用受到了极大制约.为了实现P2P网络环境下的有效任务协作,提出了一种具有激励机制的任务协作逻辑模型.基于Agent理论,首先给出了对等体、半对等体、P2P社区等概念... P2P网络中广泛存在的"free riding"现象使其在任务协作领域的应用受到了极大制约.为了实现P2P网络环境下的有效任务协作,提出了一种具有激励机制的任务协作逻辑模型.基于Agent理论,首先给出了对等体、半对等体、P2P社区等概念;然后在合同网的框架下提出了面向P2P网络社区的任务协作逻辑模型TCLM-P2P(task collaborative logic model oriented to P2Pcommunity).相对于传统的任务协作模型,在合理的前提假设条件下,模型给出了模型公理和协作规则.该模型通过基于虚拟积分的协作算法实现了具有激励机制的P2P网络中的任务分配与协作.原型系统的实现及仿真实验结果表明TCLM-P2P模型具有可行性和有效性:不仅能够激励自利节点主动参与到任务分配与协作中;同时也能在一定程度上抑制节点的free riding行为,从而保障了P2P系统的有序工作. 展开更多
关键词 对等网络 智能代理 虚拟积分 激励 合同网
下载PDF
资源共享P2P网络的进化博弈激励模型 被引量:10
10
作者 王杨 王汝传 +1 位作者 徐小龙 严远亭 《计算机工程》 CAS CSCD 北大核心 2011年第11期19-21,共3页
根据进化博弈的观点,提出一种资源共享型P2P网络博弈激励模型。对P2P网络进行描述,并对节点的行为进行量化分析,建立节点资源访问的概率模型,给出共享型P2P网络中的个体模拟动态方程。在随机博弈收益矩阵的基础上,通过调整相关参数引导... 根据进化博弈的观点,提出一种资源共享型P2P网络博弈激励模型。对P2P网络进行描述,并对节点的行为进行量化分析,建立节点资源访问的概率模型,给出共享型P2P网络中的个体模拟动态方程。在随机博弈收益矩阵的基础上,通过调整相关参数引导P2P网络向动态平衡的状态演化。仿真实验结果验证了该模型的可行性和灵活性。 展开更多
关键词 P2P网络 进化博弈 激励机制 网络模型
下载PDF
基于覆盖随机游走算法的服务质量预测 被引量:5
11
作者 张以文 汪开斌 +3 位作者 严远亭 陈洁 何强 李炜 《计算机学报》 EI CSCD 北大核心 2018年第12期2756-2768,共13页
随着互联网上Web服务的日益增多,面对大量功能相同的候选服务,用户希望能够选择质量最优的候选服务.然而,用户通常并不知道所有候选服务的服务质量(Quality of Service,QoS).因此,基于Web服务的历史记录预测QoS值得到了广泛关注.传统的... 随着互联网上Web服务的日益增多,面对大量功能相同的候选服务,用户希望能够选择质量最优的候选服务.然而,用户通常并不知道所有候选服务的服务质量(Quality of Service,QoS).因此,基于Web服务的历史记录预测QoS值得到了广泛关注.传统的基于协同过滤(CF)的预测方法可能会遭遇数据稀疏、用户信任等问题,导致该方法在预测精度方面表现一般.为解决上述问题,该文提出一种基于覆盖随机游走算法的服务质量预测方法.该方法首先基于用户服务历史QoS记录,使用改进的覆盖算法对用户进行聚类,选取与每个用户聚类次数的Top-k个用户为该用户的信任用户,连接所有用户与其信任用户构建用户信任网;其次,基于用户信任网提出一种随机游走预测方法,在随机游走的过程中,不仅考虑目标服务的QoS信息,同时考虑相似服务的QoS信息,以确保QoS预测的准确性;最后,每次随机游走获得一个QoS值,为使预测更加准确,作者进行多次随机游走,汇总所有QoS值进行预测.为验证文中方法的有效性,作者在真实的Web服务数据集进行了大量实验,其中包括来自339个用户的5825个真实世界Web服务的1 974 675个Web服务调用.实验结果表明文中方法在预测精度上明显优于现有方法,同时可以很好地解决推荐系统的数据稀疏和用户信任问题. 展开更多
关键词 服务质量 质量预测 随机游走 覆盖算法 协同过滤
下载PDF
高师院校非师范计算机专业人才培养新途径 被引量:6
12
作者 王杨 许勇 +2 位作者 赵传信 严远亭 季一木 《计算机教育》 2010年第8期4-10,共7页
为适应社会发展的需要,我国现有的高师院校普遍设立了非师范计算机专业,但从毕业生实际就业状况来看,高师院校非师范计算机专业的人才培养方面存在一些不足,主要包括工程实践能力薄弱、行业应用背景知识不足、课程设置不合理以及缺乏团... 为适应社会发展的需要,我国现有的高师院校普遍设立了非师范计算机专业,但从毕业生实际就业状况来看,高师院校非师范计算机专业的人才培养方面存在一些不足,主要包括工程实践能力薄弱、行业应用背景知识不足、课程设置不合理以及缺乏团队协作意识等。针对上述问题,本文以安徽师范大学非师范专业本科生教育为实例,提出了动态Min-Max策略的课程设置体系、工程嵌入的教学理念、项目驱动的教学实践方法以及本硕博一体化的团队素质培养风范等面向高师院校非师范计算机人才培养的新举措。 展开更多
关键词 高师院校 最小-最大策略 工程嵌入 项目驱动 团队精神
下载PDF
一种局部和全局用户影响力相结合的社交推荐算法 被引量:3
13
作者 张燕平 张顺 +1 位作者 钱付兰 严远亭 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第4期858-865,共8页
传统的协同过滤推荐系统认为用户之间的行为相互独立,忽视了用户之间的影响关系.而用户的历史行为数据不同、社交网络关系不同,其相互之间存在的影响力不同.为了分析用户的社交影响力在推荐中所起到的作用,通过历史行为数据和社交网络... 传统的协同过滤推荐系统认为用户之间的行为相互独立,忽视了用户之间的影响关系.而用户的历史行为数据不同、社交网络关系不同,其相互之间存在的影响力不同.为了分析用户的社交影响力在推荐中所起到的作用,通过历史行为数据和社交网络结构分析用户的局部影响力和全局影响力,分别提出基于局部影响力和基于全局影响力的模型以及两种影响力综合的模型.通过在真实的数据集上的实验表明,与以往方法相比,本文提出的基于影响力的三种模型在推荐精度上有一定提升,且在稀疏的数据集上基于全局影响力的模型和综合模型提升效果比更明显. 展开更多
关键词 推荐系统 社交网络 矩阵分解 影响力
下载PDF
基于子模函数构建优化商空间链 被引量:2
14
作者 张燕平 张铃 +2 位作者 赵姝 陈喜 严远亭 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第6期1084-1089,共6页
通过商空间链,可得到特定目标求解的逼近方法,由此可完成处理复杂信息,发现隐含知识,揭示事物和事件的内在规律的任务.但随着数据环境的变化,商逼近近似求解开始遇到挑战,由此引发的关键问题就是怎样构建满足求解精度的商空间链,逼近过... 通过商空间链,可得到特定目标求解的逼近方法,由此可完成处理复杂信息,发现隐含知识,揭示事物和事件的内在规律的任务.但随着数据环境的变化,商逼近近似求解开始遇到挑战,由此引发的关键问题就是怎样构建满足求解精度的商空间链,逼近过程中误差界是多少.结合子模函数优化理论来构建商空间链,并对商逼近过程的逼近精度问题展开研究,证明了商空间可保持目标函数的子模性,可利用简单的贪心策略构建最优商空间链,逼近过程中最大误差界≤[1-(1-1/e)-1]. 展开更多
关键词 商空间链 子模函数 误差界 贪心策略
下载PDF
基于P2P技术的云计算教育服务平台设计与实现 被引量:11
15
作者 王杨 严远亭 《计算机教育》 2010年第16期147-150,共4页
近年来,云计算已经成为网络服务领域中的研究热点。为了将云计算的理念服务于当前高等教育,提出设计一种基于P2P技术的云计算教育服务平台。首先介绍P2P技术和云计算的概念,然后提出一种云计算教育服务平台的设计框架,最后结合高等学校... 近年来,云计算已经成为网络服务领域中的研究热点。为了将云计算的理念服务于当前高等教育,提出设计一种基于P2P技术的云计算教育服务平台。首先介绍P2P技术和云计算的概念,然后提出一种云计算教育服务平台的设计框架,最后结合高等学校计算机专业课程的教学实践阐述如何实现一个在线测试的云计算教育服务平台。 展开更多
关键词 云计算 P2P 教育服务平台
下载PDF
应用Max-Min策略的物联网社区构建方法 被引量:1
16
作者 王杨 张林静 严远亭 《计算机工程与应用》 CSCD 2012年第16期244-248,共5页
针对如何在面向终端用户的服务网络中实现高效构建代价最小、效用最大的物联网社区的问题,结合物联网的特征,借助TheSet-covering理论,提出了一种基于Max-Min的物联网社区构建方法。对问题进行了相关描述,给出了物联网社区的构建方法。... 针对如何在面向终端用户的服务网络中实现高效构建代价最小、效用最大的物联网社区的问题,结合物联网的特征,借助TheSet-covering理论,提出了一种基于Max-Min的物联网社区构建方法。对问题进行了相关描述,给出了物联网社区的构建方法。理论分析和仿真实验表明,该社区构建方法与CONGA算法相比,具有代价小、效率高的优点。 展开更多
关键词 物联网 服务社区 Max-Min策略 TheSet-covering理论
下载PDF
EMOP2PVC:面向P2P网络的虚拟社区演化模型
17
作者 王杨 朱先远 +3 位作者 严远亭 南敏 赵鹏程 许勇 《计算机工程与应用》 CSCD 北大核心 2011年第28期93-96,共4页
近年来,P2P虚拟社区成为目前网络研究的热点之一。根据逻辑斯蒂克原理,从复杂系统理论的角度提出了P2P网络虚拟社区竞争与协作演化趋势进化过程的定量模型,讨论了P2P网络虚拟社区演化非平衡性、非线性和随机"涨落"等演化特性... 近年来,P2P虚拟社区成为目前网络研究的热点之一。根据逻辑斯蒂克原理,从复杂系统理论的角度提出了P2P网络虚拟社区竞争与协作演化趋势进化过程的定量模型,讨论了P2P网络虚拟社区演化非平衡性、非线性和随机"涨落"等演化特性和作用机理,并给出P2P网络虚拟社区演化模型(EMOP2PVC)。理论分析和仿真实验均表明所提出的模型具有较好的合理性和可行性。 展开更多
关键词 自组织 演化 点对点(P2P)网络
下载PDF
任务粒化的质量约束感知服务组合 被引量:4
18
作者 张以文 崔光明 +2 位作者 严远亭 赵姝 张燕平 《计算机研究与发展》 EI CSCD 北大核心 2018年第6期1345-1355,共11页
随着服务计算的发展,越来越多的资源以服务的形式发布与使用,服务提供商间的竞争日趋激烈,合作共赢成为必然趋势,但考虑质量约束关系服务组合优化问题复杂性大大增强.为解决这一问题,在充分考虑候选服务间质量约束的同时,对服务组合业... 随着服务计算的发展,越来越多的资源以服务的形式发布与使用,服务提供商间的竞争日趋激烈,合作共赢成为必然趋势,但考虑质量约束关系服务组合优化问题复杂性大大增强.为解决这一问题,在充分考虑候选服务间质量约束的同时,对服务组合业务流程进行任务粒化,提出基于任务粒化的质量约束感知服务组合优化方法(Tg-QcA).首先,通过理论分析,验证每种QoS聚合方式均具有子模态性质以及多属性服务组合问题的效用函数仍具有子模态性质,保证了基于任务粒化优化方法的完备性;其次,通过质量约束建模,利用任务间的隶属度进行任务粒化划分,对原问题进行分解,有效降低了问题求解规模;最后,大量的仿真模拟实验结果表明:所提模型与算法具有很好的可行性、高效性和稳定性. 展开更多
关键词 服务组合 任务粒化 质量约束 子模 服务质量
下载PDF
融合后验概率和密度的不平衡数据欠采样方法 被引量:1
19
作者 任艳平 郑重 +2 位作者 江一飞 严远亭 张燕平 《计算机工程与应用》 CSCD 北大核心 2022年第23期268-277,共10页
欠采样是当前解决类不平衡问题的主流方法之一。现有研究表明,高效地处理类别重叠能够有效提升过采样方法的性能。然而,目前对欠采样的研究大多认为由于样本选择策略不当而导致的关键样本丢失是影响欠采样方法性能的主要原因,为此,研究... 欠采样是当前解决类不平衡问题的主流方法之一。现有研究表明,高效地处理类别重叠能够有效提升过采样方法的性能。然而,目前对欠采样的研究大多认为由于样本选择策略不当而导致的关键样本丢失是影响欠采样方法性能的主要原因,为此,研究者从不同的角度提出了一系列针对性的方法,但鲜有对欠采样中类别重叠的研究。提出一种融合贝叶斯后验概率和分布密度的欠采样方法(BPDDUS)实现重叠区域样本的检测和清洗,并通过样本的分布信息对清洗后的样本进行欠采样。具体来说,该方法通过贝叶斯后验概率对多数类样本中潜在的噪声和重叠样本进行清洗以增强分类决策边界的清晰度。对清洗后的多数类样本,引入全局分布密度和信息熵来度量样本对不平衡数据分类学习的重要程度并对其分配相应的采样权重。按样本权重欠采样并构建集成分类系统,以提升模型的泛化能力。在43个KEEL数据库数据集上进行的数值实验验证了所提的BPDDUS方法的有效性。 展开更多
关键词 不平衡数据 欠采样 贝叶斯后验概率 全局分布密度 集成分类 信息熵
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部