期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
基于聚类的连续型数据缺失值充填方法 被引量:12
1
作者 李国和 杨绍伟 +1 位作者 吴卫江 郑艺峰 《计算机工程》 CAS CSCD 北大核心 2019年第9期32-39,共8页
在大数据应用中,多数建模方法是在完备数据集基础上进行的,但在数据采集过程或存储过程中容易出现数据缺失的现象,导致无法建模。为此,提出一种基于聚类的递归充填方法。使用同类簇的均值对不完备数据进行预填充,形成初始完备数据集,针... 在大数据应用中,多数建模方法是在完备数据集基础上进行的,但在数据采集过程或存储过程中容易出现数据缺失的现象,导致无法建模。为此,提出一种基于聚类的递归充填方法。使用同类簇的均值对不完备数据进行预填充,形成初始完备数据集,针对得到的完整数据进行聚类,并运用同类簇的均值修正初始充填值。根据充填效果误差判定充填稳定性,并进行多次递归聚类修正充填值,直到前后两次充填较为稳定或迭代次数超过阈值时停止迭代。实验结果表明,与均值充填、K最近邻充填、聚类充填及粗糙集不完备数据分析等方法相比,该方法能够进行更为精准的充填,使得最终充填更加接近真实数据。 展开更多
关键词 缺失值 预充填 聚类 递归充填 平方误差
下载PDF
基于密度和半监督学习的数据修复与聚类 被引量:1
2
作者 张倩倩 李国和 郑艺峰 《计算机工程与设计》 北大核心 2020年第3期676-681,共6页
针对现有数据修复算法需要数据集的完整性依赖等函数、不适用于简单数据集、不能充分利用背景知识等问题,提出一种基于密度和半监督学习的修复和聚类算法。遵循数据修复的最小改变原则,利用样本集自身的密度信息和背景知识形成临时聚类... 针对现有数据修复算法需要数据集的完整性依赖等函数、不适用于简单数据集、不能充分利用背景知识等问题,提出一种基于密度和半监督学习的修复和聚类算法。遵循数据修复的最小改变原则,利用样本集自身的密度信息和背景知识形成临时聚类簇;利用成对约束将临时聚类簇进行分割或者合并,形成最终聚类簇,在聚类的同时完成不精确数据的修复。实验结果表明,该算法适用于具有简单模式的样本集,是对现有基于完整性约束数据修复算法的扩展,提高了数据修复正确率和聚类精度。 展开更多
关键词 数据质量 数据清理 数据修复 成对约束 密度聚类
下载PDF
粒计算思维下的BP神经网络在金融趋势预测中的应用 被引量:9
3
作者 沈泽君 杨文元 《小型微型计算机系统》 CSCD 北大核心 2019年第3期527-532,共6页
BP(Back Propagation)神经网络在金融趋势预测上得到了广泛的应用,其通过反向传播误差来调整模型的权重与偏值,能够较强的适应金融的走向趋势.但是由于金融趋势的周期性变化多端,不同周期下对预测值的影响不一,传统的BP神经网络在金融... BP(Back Propagation)神经网络在金融趋势预测上得到了广泛的应用,其通过反向传播误差来调整模型的权重与偏值,能够较强的适应金融的走向趋势.但是由于金融趋势的周期性变化多端,不同周期下对预测值的影响不一,传统的BP神经网络在金融趋势预测上存在一定的局限性.本文充分考虑金融趋势周期粒度这一特性,提出了基于粒计算思维的BP神经网络(Back Propagation on Granular Computing,BPGC). BPGC算法首先对数据集进行不同粒度划分、构造粒度矩阵,然后根据粒度矩阵进行BP训练得出各粒度下的权值,最后对各粒度的预测结果进行加权平均,得出预测结果.在浦发银行股票收盘价数据集上进行实验,与传统的BP神经网络进行比对,实验结果验证了BPGC算法的有效性. 展开更多
关键词 粒计算 BP神经网络 粒度矩阵 金融趋势预测
下载PDF
基于最大决策边界的高维类不平衡数据在线流特征选择 被引量:8
4
作者 林耀进 陈祥焰 +1 位作者 白盛兴 王晨曦 《模式识别与人工智能》 EI CSCD 北大核心 2020年第9期820-829,共10页
数据的特征空间常随时间动态变化,而训练样本的数量固定不变,数据的特征空间在呈现超高维特点的同时通常伴随决策空间的类别不平衡问题.对此,文中提出基于最大决策边界的高维类不平衡数据在线流特征选择算法.借助邻域粗糙集模型,在充分... 数据的特征空间常随时间动态变化,而训练样本的数量固定不变,数据的特征空间在呈现超高维特点的同时通常伴随决策空间的类别不平衡问题.对此,文中提出基于最大决策边界的高维类不平衡数据在线流特征选择算法.借助邻域粗糙集模型,在充分考虑边界样本影响的基础上,定义自适应邻域关系,设计基于最大决策边界的粗糙依赖度计算公式.同时,提出三种在线特征子集评估指标,用于选择在大类和小类之间具有强区分能力的特征.在11个高维类不平衡数据集上的实验表明,在相同的实验环境及特征数量下,文中算法综合性能较优. 展开更多
关键词 在线特征选择 高维类不平衡数据 自适应邻域 邻域粗糙集
下载PDF
基于邻域粗糙集的高维类不平衡数据在线流特征选择 被引量:17
5
作者 陈祥焰 林耀进 王晨曦 《模式识别与人工智能》 EI CSCD 北大核心 2019年第8期726-735,共10页
在许多实际应用中,数据经常呈现高维不平衡特征,特征还根据需求在不同时间段动态生成.基于此种情况,文中提出基于邻域粗糙集的高维类不平衡数据的在线流特征选择算法.算法设计基于小类重要度的粗糙依赖度计算公式,同时,提出在线相关性... 在许多实际应用中,数据经常呈现高维不平衡特征,特征还根据需求在不同时间段动态生成.基于此种情况,文中提出基于邻域粗糙集的高维类不平衡数据的在线流特征选择算法.算法设计基于小类重要度的粗糙依赖度计算公式,同时,提出在线相关性分析、在线冗余度分析、在线重要度分析三种策略,用于选择在大类和小类之间具有高可分离性的特征.在7个高维类不平衡数据集上的实验表明,文中算法可以有效选择一个较好的特征子集,性能较优. 展开更多
关键词 在线特征选择 高维不平衡数据 邻域粗糙集 粗糙依赖度
下载PDF
物联网环境下移动高维异常数据自动挖掘仿真 被引量:10
6
作者 杨敬民 张文杰 《计算机仿真》 北大核心 2018年第1期441-444,共4页
物联网中的数据具有数据类型复杂、异构性强等特点,为了提升物联网的服务质量,在物联网环境下,需要进行移动高维异常数据自动挖掘方法的研究。但是采用当前方法进行异常数据自动挖掘时,无法提取异常数据的主成分特征,存在数据自动挖掘... 物联网中的数据具有数据类型复杂、异构性强等特点,为了提升物联网的服务质量,在物联网环境下,需要进行移动高维异常数据自动挖掘方法的研究。但是采用当前方法进行异常数据自动挖掘时,无法提取异常数据的主成分特征,存在数据自动挖掘误差大的问题。为此,在物联网络环境下,提出一种基于改进主成分分析的移动高维异常数据自动挖掘方法。该方法先融合于主成分分析方法输入数据样本并进行标准化处理,计算标准化数据矩阵的协方差矩阵,提取其矩阵的特征向量,对各个数据特征样本空间进行坐标变换,给出不同类型数据的投影数据,计算数据主成分的累积方差贡献率,获取异常数据聚焦的多层空间模糊聚类中心,结合所属异常数据类别关联训练集,获得信息增益,分类异常数据属性集,实现物联网移动高维异常数据的自动挖掘。实验结果表明,所提方法数据挖掘精度较高,有效地提升了物联网的服务质量。 展开更多
关键词 物联网环境 高维异常数据 挖掘
下载PDF
利用一致性分析的高维类别不平衡数据特征选择 被引量:4
7
作者 曾海亮 林耀进 +1 位作者 王晨曦 陈祥焰 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1946-1951,共6页
在高维小样本分类学习任务中,数据存在着高维性及类别不平衡问题.基于此,构建利用一致性分析的高维类别不平衡数据特征选择模型.首先通过定义融合类别信息来定义样本在特征空间的一致性,其次设计基于特征重要度的前向特征选择算法,最后... 在高维小样本分类学习任务中,数据存在着高维性及类别不平衡问题.基于此,构建利用一致性分析的高维类别不平衡数据特征选择模型.首先通过定义融合类别信息来定义样本在特征空间的一致性,其次设计基于特征重要度的前向特征选择算法,最后选取十二个数据集与七个算法进行对比分析,实验结果表明,该算法能显著提高小类预测精度. 展开更多
关键词 一致性分析 高维小样本 类别不平衡 特征选择
下载PDF
利用特征扰动的高维小样本数据子空间学习 被引量:2
8
作者 曾海亮 林耀进 +1 位作者 唐莉 王晨曦 《江苏科技大学学报(自然科学版)》 CAS 2020年第1期62-68,110,共8页
在基因微阵列、文本数据分析、图像识别等领域,数据存在着高维性、高噪声、类别不平衡等问题,给深入准确挖掘高维小样本数据中所蕴含的有用知识和特征选择带来了极大困难,对高维小样本数据的分类学习性能带来了消极影响.为了获得具有高... 在基因微阵列、文本数据分析、图像识别等领域,数据存在着高维性、高噪声、类别不平衡等问题,给深入准确挖掘高维小样本数据中所蕴含的有用知识和特征选择带来了极大困难,对高维小样本数据的分类学习性能带来了消极影响.为了获得具有高效分类性能的特征,利用特征扰动策略,定义了基准属性及基准属性空间,构建了利用具有差异性的多个特征子空间.在此基础上,构建了利用特征扰动策略的高维小样本数据的特征选择算法.在8个数据集上与其他7个特征选择算法进行实验结果对比,表明了所提算法的有效性. 展开更多
关键词 特征扰动 高维小样本 子空间 邻域粗糙集
下载PDF
小样本类不平衡数据的一致性分析流特征选择 被引量:1
9
作者 林培榕 曾海亮 +2 位作者 王晨曦 卢舜 林耀进 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2252-2258,共7页
在小样本分类学习任务中,数据存在着类别不平衡问题以及数据特征空间的动态演化性.基于此,构建小样本类不平衡数据的一致性分析流特征选择模型.首先,利用均值定义同类样本的类中心,然后通过样本在特征与标记的信息定义类中心的近邻;其次... 在小样本分类学习任务中,数据存在着类别不平衡问题以及数据特征空间的动态演化性.基于此,构建小样本类不平衡数据的一致性分析流特征选择模型.首先,利用均值定义同类样本的类中心,然后通过样本在特征与标记的信息定义类中心的近邻;其次,通过融合类别信息来定义类中心在特征空间的一致性;再次,设计流特征环境下的在线特征选择算法;最后,选取七个数据集与七个算法进行对比分析,实验结果表明,该算法能显著提高小类预测精度. 展开更多
关键词 高维小样本 类别不平衡 一致性分析 流特征选择
下载PDF
基于邻域粒化的多数据源高投票决策规则的挖掘 被引量:1
10
作者 陈辉皇 林耀进 +1 位作者 林国平 唐莉 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第6期1063-1071,共9页
多数据源高投票决策规则挖掘是指从多数据源中挖掘存在大部分数据源且具有重要意义的决策规则,此类规则在银行理财产品营销、市场营销、疾病诊断等领域中具有指导性作用.利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆... 多数据源高投票决策规则挖掘是指从多数据源中挖掘存在大部分数据源且具有重要意义的决策规则,此类规则在银行理财产品营销、市场营销、疾病诊断等领域中具有指导性作用.利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆盖度、投票数等多种决策规则的度量指标,用以挖掘满足这些度量指标的高投票决策规则.实验结果验证了所提算法挖掘多源决策信息系统中的高投票决策规则挖掘的有效性. 展开更多
关键词 邻域粒化 多数据源 高投票决策规则 分类间隔
下载PDF
数据库云平台UUID方法的新算法 被引量:3
11
作者 刘王飞 《闽南师范大学学报(自然科学版)》 2022年第2期44-47,共4页
针对传统的分布式系统UUID(universally unique IDentifier)算法的不足,提出一种新的具有规律性、结构性、利于索引的UUID方法;并设计一个基于微服务架构的数据库云平台,运用新的UUID算法生成任务ID.实验表明,新的UUID算法在数据库云平... 针对传统的分布式系统UUID(universally unique IDentifier)算法的不足,提出一种新的具有规律性、结构性、利于索引的UUID方法;并设计一个基于微服务架构的数据库云平台,运用新的UUID算法生成任务ID.实验表明,新的UUID算法在数据库云平台大量任务索引与管理中具有明显的优势. 展开更多
关键词 UUID算法 MD5算法 毫秒数 自增数
下载PDF
问题驱动法融入线上线下混合教学的实践探究——以《数据结构》课程为例 被引量:1
12
作者 何秋红 林耀进 《漳州职业技术学院学报》 2021年第4期51-59,共9页
现代新媒体技术在教育教学实践中的广泛应用,线上线下混合教学已成为一种新的教学模式,线上教学有其显著的优势,能够跨越时空限制,有效弥补线下教学的不足,但线上线下混合教学实践过程中,出现一些亟待解决的问题,如两者融合度欠缺、情... 现代新媒体技术在教育教学实践中的广泛应用,线上线下混合教学已成为一种新的教学模式,线上教学有其显著的优势,能够跨越时空限制,有效弥补线下教学的不足,但线上线下混合教学实践过程中,出现一些亟待解决的问题,如两者融合度欠缺、情境创设乏力、提问答疑效率偏低、师生互动不充分等。问题驱动法是体现学生中心地位、围绕问题寻求解决方案的一种教学方法,强调问题意识、注重学生主体,课前根据教学知识点设计问题;课中以问题解决为抓手,提高学生参与度、激发学生求知欲;课后设计练习,构建“课前准备—课中实施—课后反思”三阶段模型,有效解决了线上线下混合教学中的问题,提升教学实效。 展开更多
关键词 问题驱动教学法 线上线下混合教学《 数据结构》
下载PDF
基于密度峰值的标签传播算法
13
作者 吴卫江 王星豪 +2 位作者 潘雪玲 郑艺峰 郑猋 《计算机与数字工程》 2024年第1期81-86,共6页
随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区... 随着智能技术应用的推广,高质量社区的检测已成为社会网络研究的热点之一。由于具有线性时间复杂度,且无需预定义目标函数和社团数,标签传播算法(LPA)已得到广泛关注。然而,在标签传播过程中,LPA具有不确定性和随机性,进而影响检测社区结果的准确性和稳定性。为此,提出一种基于密度峰值的标签传播社区检测方法(DPC-RWL)。首先,采用密度峰值聚类算法查找出社区的核心节点集合,计算节点与核心节点集之间的权重,选取最大值为该节点赋予权值。最后,使用基于标签传播算法的归属度函数进行传播。真实网络和LFR人工基准网络的对比实验表明,所提算法能准确高效地识别出社区结构。 展开更多
关键词 密度峰值聚类 标签传播 节点权重 社交网络
下载PDF
一种特殊三维六度环面网络的彩虹连通性
14
作者 钟玮 吴荣生 《龙岩学院学报》 2024年第5期15-18,23,共5页
三维以及更高维环面是二维环面的自然扩展,适合构建规模更大、更为复杂的互连网络结构。给出一般图的彩虹连通数是一件困难事情,所以研究一个图的彩虹连通数的上界成为了人们感兴趣的问题。给出了三维六度环面网络H_(n×n×n)(n... 三维以及更高维环面是二维环面的自然扩展,适合构建规模更大、更为复杂的互连网络结构。给出一般图的彩虹连通数是一件困难事情,所以研究一个图的彩虹连通数的上界成为了人们感兴趣的问题。给出了三维六度环面网络H_(n×n×n)(n=4t)的彩虹连通数的上界,对于该网络的研究具有一定的意义。 展开更多
关键词 三维六度环面网络 彩虹连通 彩虹路 彩虹连通数
下载PDF
基于特征交互的层次分类在线流特征选择
15
作者 孔令蔚 蔡林晟 +1 位作者 林少杰 林耀进 《南京师范大学学报(工程技术版)》 CAS 2024年第2期34-42,共9页
在开放动态环境下的分类学习任务中,数据特征空间具有动态性,标记空间存在层次化结构.现有的层次分类在线流特征选择算法可以选择较优的特征子集,但这些算法忽略了特征之间存在的交互作用.基于此,提出了一种基于特征交互的层次分类在线... 在开放动态环境下的分类学习任务中,数据特征空间具有动态性,标记空间存在层次化结构.现有的层次分类在线流特征选择算法可以选择较优的特征子集,但这些算法忽略了特征之间存在的交互作用.基于此,提出了一种基于特征交互的层次分类在线流特征选择算法.首先,设计了一种基于层次邻域依赖度去判断特征交互的计算方法;其次,针对层次化结构数据,根据层次结构中不同节点间的兄弟关系定义邻域粗糙集模型;最后,设计了具有在线重要性分析、在线冗余性分析以及在线交互性分析的层次分类在线流框架,用于选择强相关和存在交互作用的特征子集.在6个层次数据集上的实验验证了所提算法具有较优的综合性能. 展开更多
关键词 在线流特征选择 层次分类 特征交互 兄弟策略 邻域粗糙集
下载PDF
基于限制性随机游走局部谱近似社区发现算法 被引量:3
16
作者 吴卫江 桑睿彤 郑艺峰 《计算机工程与设计》 北大核心 2021年第9期2472-2477,共6页
针对大型网络中社区发现优化方法的效率问题,提出一种局部社区发现方法(LRW-LSA),从少量种子节点中识别本地社区的所有潜在社区成员。采用限制性随机游走进行采样处理,从种子节点出发得到一个相对较小的子图;利用种子的归一化指示向量... 针对大型网络中社区发现优化方法的效率问题,提出一种局部社区发现方法(LRW-LSA),从少量种子节点中识别本地社区的所有潜在社区成员。采用限制性随机游走进行采样处理,从种子节点出发得到一个相对较小的子图;利用种子的归一化指示向量对子图进行Lanczos迭代,得到相关节点与目标社区的隶属概率用以恢复出目标社区。在不同领域的真实数据集和合成数据集上进行实验,结果表明,LRW-LSA优于现有的社区发现方法。 展开更多
关键词 局部社区发现 限制性随机游走 Lanczos迭代 种子节点 目标社区
下载PDF
由粗到细的分层特征选择 被引量:5
17
作者 刘浩阳 林耀进 +3 位作者 刘景华 吴镒潾 毛煜 李绍滋 《电子学报》 EI CAS CSCD 北大核心 2022年第11期2778-2789,共12页
利用数据类别间层次结构关系进行分类学习任务广泛存在于疾病诊断、图像标注等领域.然而,数据特征空间的高维性,使得分层分类学习面临着时间复杂度高和存储负担大等问题.另外,现有研究工作都假设训练集标记粒度是充分细化,与实际分层分... 利用数据类别间层次结构关系进行分类学习任务广泛存在于疾病诊断、图像标注等领域.然而,数据特征空间的高维性,使得分层分类学习面临着时间复杂度高和存储负担大等问题.另外,现有研究工作都假设训练集标记粒度是充分细化,与实际分层分类学习中划分细粒度标记代价高,类别标记间存在语义歧义性等矛盾.为解决上述问题,提出一种由粗到细的分层特征选择算法.该算法考虑类内一致性和兄弟节点间的差异性以选择有代表性特征,同时在特征选择的过程中实现预测训练样本未知的细粒度标记.在7个基准数据集上的实验结果表明,所提算法的分类性能优于一些先进的对比算法,且能处理标记粒度不够细化的情况. 展开更多
关键词 特征选择 分层分类 标记层次结构 标记粒度 递归正则化 稀疏优化 全局最优解
下载PDF
基于证据理论的覆盖决策信息系统的属性约简 被引量:8
18
作者 张燕兰 李长清 《模式识别与人工智能》 EI CSCD 北大核心 2018年第9期797-808,共12页
覆盖决策信息系统的属性约简是粗糙集理论中的重要研究内容之一.文中讨论决策为覆盖的覆盖决策信息系统的属性约简,针对覆盖决策信息系统的一类约简,利用证据理论中的信任函数和似然函数给出约简的等价刻画.根据决策类的似然函数值定义... 覆盖决策信息系统的属性约简是粗糙集理论中的重要研究内容之一.文中讨论决策为覆盖的覆盖决策信息系统的属性约简,针对覆盖决策信息系统的一类约简,利用证据理论中的信任函数和似然函数给出约简的等价刻画.根据决策类的似然函数值定义覆盖的重要度和相对重要度,给出求解约简的算法,并以实例说明算法的有效性. 展开更多
关键词 覆盖决策信息系统 属性约简 证据理论 覆盖粗糙集
下载PDF
关联分类及其改进算法综述 被引量:6
19
作者 李家辉 周忠眉 《科技通报》 2018年第8期140-144,共5页
关联分类算法是分类中一个重要的方法,但是基于支持度—置信度框架的传统关联分类算法会产生很多质量不高的规则。为了提高传统关联分类算法的准确率,以提出大量改进算法,综述关联分类及其改进算法。首先介绍关联分类算法及其改进算法... 关联分类算法是分类中一个重要的方法,但是基于支持度—置信度框架的传统关联分类算法会产生很多质量不高的规则。为了提高传统关联分类算法的准确率,以提出大量改进算法,综述关联分类及其改进算法。首先介绍关联分类算法及其改进算法所涉及的基本概念,其次就关联分类算法的三个步骤规则生成、规则度量与剪枝、未知实例预测综述关联分类及其改进算法。最后对关联分类及其改进算法进行总结与展望。 展开更多
关键词 关联规则 分类 精度 数据挖掘
下载PDF
信息熵约束下的视频目标分割 被引量:1
20
作者 丁飞飞 杨文元 《计算机应用》 CSCD 北大核心 2018年第10期2782-2787,共6页
大部分基于图论的视频分割方法往往先通过分析运动和外观信息获得先验显著性区域,然后用最小化能量模型来进一步分割,这些方法常常忽略对外观信息精细化分析,建立的目标模型对复杂场景的鲁棒性不佳。根据信息熵能够度量样本纯度,信息熵... 大部分基于图论的视频分割方法往往先通过分析运动和外观信息获得先验显著性区域,然后用最小化能量模型来进一步分割,这些方法常常忽略对外观信息精细化分析,建立的目标模型对复杂场景的鲁棒性不佳。根据信息熵能够度量样本纯度,信息熵最小化和能量模型最小化具有一致的目标,提出一种信息熵约束下的视频目标分割方法。首先在经典光流法基础上结合点在多边形内部原理获得第一阶段的分割结果;然后以超像素为基本分割单元,获得均匀的运动和表现;最后在能量函数中引入信息熵约束项,构建前景背景像素标记的优化问题,通过最小化能量函数得到更精确的分割结果。在公开数据集上的实验结果表明目标模型中引入信息熵约束项能够有效提高视频目标分割的鲁棒性。 展开更多
关键词 光流 信息熵 超像素 视频分割 能量函数
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部