期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
分布式数据挖掘中的最优K相异性取样技术
被引量:
5
1
作者
胡文瑜
孙志挥
张柏礼
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第3期385-389,共5页
为了弥补基于集中式处理的分布式数据挖掘方法的不足,有效地实施分布式数据挖掘(DDM)任务,需要一种能从分布式数据源中获取多样化代表性取样集的技术.提出了一种新的适用于分布式数据挖掘环境的数据取样算法(OptiSim-DDM方法),算法核心...
为了弥补基于集中式处理的分布式数据挖掘方法的不足,有效地实施分布式数据挖掘(DDM)任务,需要一种能从分布式数据源中获取多样化代表性取样集的技术.提出了一种新的适用于分布式数据挖掘环境的数据取样算法(OptiSim-DDM方法),算法核心是基于最优K相异性进行数据选择,采用移动Agent技术和扩展的最优K相异性数据多样化代表性子集选择方法,能在各分布式数据场地中轮转选择出全局数据集的多样化代表性取样集.该方法通过降低所挖掘的数据集的数据规模来降低数据挖掘算法的时空复杂度,降低网络通讯代价,提高数据挖掘的执行效率,适合于各场地数据是互相关联和互相依赖的分布式数据挖掘任务.实验结果证实该方法是可行、有效的.
展开更多
关键词
分布式数据挖掘
最优k相异性选择算法
AGENT
下载PDF
职称材料
基于相异性选择的密度聚类算法研究
被引量:
2
2
作者
胡文瑜
孙志挥
周晓云
《小型微型计算机系统》
CSCD
北大核心
2006年第9期1601-1604,共4页
在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算法(EOptiSim),由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用OptiSim或EOptiSim多样化代表性子集选择...
在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算法(EOptiSim),由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用OptiSim或EOptiSim多样化代表性子集选择技术,在显著降低I/O耗费和内存需求的同时,不仅能够有效地聚类单一的大规模空间数据库,而且还能聚类大规模组合数据库或分布式数据库.实验结果表明本文的算法是可行、有效的.
展开更多
关键词
聚类分析
多样化代表性子集
选择
相
异性
选择
算法
密度聚类
算法
下载PDF
职称材料
自调优自适应遗传算法的WKNN特征选择方法
被引量:
7
3
作者
陈倩茹
李雅丽
+2 位作者
许科全
刘铱龙
王淑琴
《计算机工程与应用》
CSCD
北大核心
2021年第20期164-171,共8页
针对大多已有基于K近邻和遗传算法的特征选择方法中没有考虑各个特征的重要度不同,并且容易出现过早收敛,特别是局部最优解问题,提出了一种基于自调优自适应遗传算法的WKNN特征选择方法。该方法使用WKNN算法预测样本的类别,为每个特征...
针对大多已有基于K近邻和遗传算法的特征选择方法中没有考虑各个特征的重要度不同,并且容易出现过早收敛,特别是局部最优解问题,提出了一种基于自调优自适应遗传算法的WKNN特征选择方法。该方法使用WKNN算法预测样本的类别,为每个特征分配一个权重来衡量特征的分类能力,然后采用自调优自适应遗传算法,对变异率、种群规模和收敛阈值进行参数调整,在迭代进化过程中搜索最优特征权重向量。为了评价该方法的有效性,与已有7种特征选择方法在5个标准数据集上进行了比较。实验结果表明,该方法是有效的,且具有较高的分类性能。
展开更多
关键词
特征
选择
加权
k
近邻
自调
优
自适应遗传
算法
参数调
优
实数编码
下载PDF
职称材料
一种基于K2结构学习算法的石漠化数据特征选择方法
被引量:
2
4
作者
李水明
舒宁
+1 位作者
陶建斌
张银桥
《桂林工学院学报》
北大核心
2009年第4期548-554,共7页
在石漠化信息的分类和提取过程中,冗余特征的存在影响分类器的性能,同时增加计算的复杂度。提出一种基于K2结构学习算法的石漠化数据特征选择方法,该方法通过B IC评分方法得到贝叶斯网络的结构,从中获得类节点的马尔可夫覆盖,继而进行...
在石漠化信息的分类和提取过程中,冗余特征的存在影响分类器的性能,同时增加计算的复杂度。提出一种基于K2结构学习算法的石漠化数据特征选择方法,该方法通过B IC评分方法得到贝叶斯网络的结构,从中获得类节点的马尔可夫覆盖,继而进行特征选择。同时借用不同评分函数的等价性来确定结构学习时所需的样本数,并且给出了样本数的参考。实验表明,该方法由于结合了样本的分类信息,获得的特征子集是最优的,显著提高了分类精度,降低了计算复杂度。
展开更多
关键词
k
2结构学习
算法
特征
选择
最优
特征子集
分类
石漠化信息
下载PDF
职称材料
基于障碍物群的k全局相异最优有序路径查询
被引量:
1
5
作者
孙冬璞
郝忠孝
《计算机工程》
CAS
CSCD
北大核心
2011年第5期80-82,共3页
提出障碍k全局相异最优有序路径的查询问题,利用可视图的思想给出近似查询算法,通过作用集与障碍角度点的引入有效地减少构造可视图障碍对象的数量,分析查询点和数据点构成的线段与可视图的顶点和弧的关系,减少内部障碍路径的计算次数,...
提出障碍k全局相异最优有序路径的查询问题,利用可视图的思想给出近似查询算法,通过作用集与障碍角度点的引入有效地减少构造可视图障碍对象的数量,分析查询点和数据点构成的线段与可视图的顶点和弧的关系,减少内部障碍路径的计算次数,实现算法的全面优化。实验结果表明,该算法具有较好的性能。
展开更多
关键词
障碍
k
全局
相
异
最优
有序路径
作用集
障碍角度点
可视图
近似
算法
下载PDF
职称材料
课程推荐预测模型优化方案及数据离散化算法
6
作者
张戈
《计算机系统应用》
2020年第4期248-253,共6页
本研究基于k-NN算法建立了课程推荐预测模型.由于原始样本数据的局部不均衡和数据叠交性,预测模型在不进行任何参数调整和数据优化的情况下,模型预测评分并不理想.针对上述问题,本研究设计了一套预测模型参数优化方案和样本数据优化方案...
本研究基于k-NN算法建立了课程推荐预测模型.由于原始样本数据的局部不均衡和数据叠交性,预测模型在不进行任何参数调整和数据优化的情况下,模型预测评分并不理想.针对上述问题,本研究设计了一套预测模型参数优化方案和样本数据优化方案,包括最优k值选择算法设计、距离公式优化、数据离散化算法设计.本研究提出的"数据离散化算法"驱使kd树的分类空间排序按照我们期望的特征向量的权重排序,该算法对提升模型预测评分起到了积极作用.上述优化方案和算法设计使课程推荐预测模型的评分从0.67提升到0.85,预测结果的准确度提高了27个百分点,学生对课程推荐的满意度得到显著提升.
展开更多
关键词
k
-NN
算法
最优
k
值
选择
距离公式
优
化
数据离散化
算法
预测模型评分
下载PDF
职称材料
一种基于划分的混合数据聚类算法
被引量:
5
7
作者
常茜茜
张月琴
《计算机应用与软件》
CSCD
北大核心
2014年第6期154-157,共4页
在实际应用领域,常常存在同时包含数值型和分类型特征的混合数据。然而,已有的大多数聚类算法只能处理数值型或分类型单一类型数据,因此,提出一个基于划分的混合数据聚类算法。首先给出K-Prototypes算法中分类型数据类中心的多Modes表...
在实际应用领域,常常存在同时包含数值型和分类型特征的混合数据。然而,已有的大多数聚类算法只能处理数值型或分类型单一类型数据,因此,提出一个基于划分的混合数据聚类算法。首先给出K-Prototypes算法中分类型数据类中心的多Modes表示方式,进而将传统的欧式距离扩展到混合数据,使之能够在相同框架下更加精确地反映对象与类之间的相异性,在此基础上提出一个用于处理混合数据的划分式聚类算法。最后,在UCI数据集上的实验结果表明,与K-Prototypes算法相比,所提出的算法能够有效提高聚类质量。
展开更多
关键词
k
—Prototypes
算法
混合数据
划分聚类
相
异性
度量
下载PDF
职称材料
位置不变的右截断Hill型估计量
被引量:
1
8
作者
陶宝
《西南大学学报(自然科学版)》
CAS
CSCD
北大核心
2009年第3期14-17,共4页
当极值指标大于0时,提出了一种位置不变的右截断Hill型估计量,证明了该估计量的弱相合性,给出了其渐近展式,并对k的最优选择进行了讨论.
关键词
右截断
弱
相
合性
渐近展式
k
的
最优
选择
下载PDF
职称材料
题名
分布式数据挖掘中的最优K相异性取样技术
被引量:
5
1
作者
胡文瑜
孙志挥
张柏礼
机构
东南大学计算机科学与工程学院
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第3期385-389,共5页
基金
国家自然科学基金资助项目(70371015)
教育部高等学校博士点科研基金资助项目(20040286009)
福建省教育厅科技资助项目(JB06142)
文摘
为了弥补基于集中式处理的分布式数据挖掘方法的不足,有效地实施分布式数据挖掘(DDM)任务,需要一种能从分布式数据源中获取多样化代表性取样集的技术.提出了一种新的适用于分布式数据挖掘环境的数据取样算法(OptiSim-DDM方法),算法核心是基于最优K相异性进行数据选择,采用移动Agent技术和扩展的最优K相异性数据多样化代表性子集选择方法,能在各分布式数据场地中轮转选择出全局数据集的多样化代表性取样集.该方法通过降低所挖掘的数据集的数据规模来降低数据挖掘算法的时空复杂度,降低网络通讯代价,提高数据挖掘的执行效率,适合于各场地数据是互相关联和互相依赖的分布式数据挖掘任务.实验结果证实该方法是可行、有效的.
关键词
分布式数据挖掘
最优k相异性选择算法
AGENT
Keywords
distributed data mining(DDM)
optimizable
k
-dissimilarity selection method
Agent
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于相异性选择的密度聚类算法研究
被引量:
2
2
作者
胡文瑜
孙志挥
周晓云
机构
东南大学计算机科学与工程系
出处
《小型微型计算机系统》
CSCD
北大核心
2006年第9期1601-1604,共4页
基金
国家自然科学基金项目(70371015)资助
教育部高等学校博士点科研基金项目(20040286009)资助
福建省教育厅科技项目(JA05307)资助
文摘
在最优K相异性算法(OptiSim)的基础上,提出一种扩展的最优K相异性算法(EOptiSim),由于EOptiSim在处理组合数据库和分布式数据库方面能弥补基本的OptiSim方法的不足,所以通过在DBSCAN算法之前应用OptiSim或EOptiSim多样化代表性子集选择技术,在显著降低I/O耗费和内存需求的同时,不仅能够有效地聚类单一的大规模空间数据库,而且还能聚类大规模组合数据库或分布式数据库.实验结果表明本文的算法是可行、有效的.
关键词
聚类分析
多样化代表性子集
选择
相
异性
选择
算法
密度聚类
算法
Keywords
clustering analysis
diverse representative subset selection
dissimilarity selection algorithm
density-based clustering algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
自调优自适应遗传算法的WKNN特征选择方法
被引量:
7
3
作者
陈倩茹
李雅丽
许科全
刘铱龙
王淑琴
机构
天津师范大学计算机与信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2021年第20期164-171,共8页
基金
国家自然科学基金(61070089,61703306)
天津市应用基础与前沿技术研究计划项目(15JCYBJC4600,19JCZDJC35100)。
文摘
针对大多已有基于K近邻和遗传算法的特征选择方法中没有考虑各个特征的重要度不同,并且容易出现过早收敛,特别是局部最优解问题,提出了一种基于自调优自适应遗传算法的WKNN特征选择方法。该方法使用WKNN算法预测样本的类别,为每个特征分配一个权重来衡量特征的分类能力,然后采用自调优自适应遗传算法,对变异率、种群规模和收敛阈值进行参数调整,在迭代进化过程中搜索最优特征权重向量。为了评价该方法的有效性,与已有7种特征选择方法在5个标准数据集上进行了比较。实验结果表明,该方法是有效的,且具有较高的分类性能。
关键词
特征
选择
加权
k
近邻
自调
优
自适应遗传
算法
参数调
优
实数编码
Keywords
feature selection
weighted
k
-nearest neighbor
self-tuning adaptive genetic algorithm
parameter tuning
real coding
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种基于K2结构学习算法的石漠化数据特征选择方法
被引量:
2
4
作者
李水明
舒宁
陶建斌
张银桥
机构
武汉大学遥感信息工程学院
广西地质矿产勘查开发局
广西壮族自治区遥感中心
出处
《桂林工学院学报》
北大核心
2009年第4期548-554,共7页
基金
国家重点基础研究发展计划(973计划)资助项目(2006CB701303)
文摘
在石漠化信息的分类和提取过程中,冗余特征的存在影响分类器的性能,同时增加计算的复杂度。提出一种基于K2结构学习算法的石漠化数据特征选择方法,该方法通过B IC评分方法得到贝叶斯网络的结构,从中获得类节点的马尔可夫覆盖,继而进行特征选择。同时借用不同评分函数的等价性来确定结构学习时所需的样本数,并且给出了样本数的参考。实验表明,该方法由于结合了样本的分类信息,获得的特征子集是最优的,显著提高了分类精度,降低了计算复杂度。
关键词
k
2结构学习
算法
特征
选择
最优
特征子集
分类
石漠化信息
Keywords
k
2 structure learning algorithm
feature selection
optimal feature subset
classification
roc
k
desertification information
分类号
TP751 [自动化与计算机技术—检测技术与自动化装置]
P642.25 [天文地球—工程地质学]
下载PDF
职称材料
题名
基于障碍物群的k全局相异最优有序路径查询
被引量:
1
5
作者
孙冬璞
郝忠孝
机构
哈尔滨理工大学计算机科学与技术学院
哈尔滨工业大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第5期80-82,共3页
基金
黑龙江省自然科学基金资助项目(F200601)
文摘
提出障碍k全局相异最优有序路径的查询问题,利用可视图的思想给出近似查询算法,通过作用集与障碍角度点的引入有效地减少构造可视图障碍对象的数量,分析查询点和数据点构成的线段与可视图的顶点和弧的关系,减少内部障碍路径的计算次数,实现算法的全面优化。实验结果表明,该算法具有较好的性能。
关键词
障碍
k
全局
相
异
最优
有序路径
作用集
障碍角度点
可视图
近似
算法
Keywords
k
Obstructed Globally Different Optimal Sequenced Route(
k
OGDOSR)
effect set
obstructed angle point
visibility graph
approximate algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
课程推荐预测模型优化方案及数据离散化算法
6
作者
张戈
机构
中国社会科学院大学计算机教研部
出处
《计算机系统应用》
2020年第4期248-253,共6页
基金
2020年中国社会科学院大学校级科研项目。
文摘
本研究基于k-NN算法建立了课程推荐预测模型.由于原始样本数据的局部不均衡和数据叠交性,预测模型在不进行任何参数调整和数据优化的情况下,模型预测评分并不理想.针对上述问题,本研究设计了一套预测模型参数优化方案和样本数据优化方案,包括最优k值选择算法设计、距离公式优化、数据离散化算法设计.本研究提出的"数据离散化算法"驱使kd树的分类空间排序按照我们期望的特征向量的权重排序,该算法对提升模型预测评分起到了积极作用.上述优化方案和算法设计使课程推荐预测模型的评分从0.67提升到0.85,预测结果的准确度提高了27个百分点,学生对课程推荐的满意度得到显著提升.
关键词
k
-NN
算法
最优
k
值
选择
距离公式
优
化
数据离散化
算法
预测模型评分
Keywords
k
-NN algorithm
selection of optimal
k
value
distance formula optimization
data discretization algorithm
prediction model score
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于划分的混合数据聚类算法
被引量:
5
7
作者
常茜茜
张月琴
机构
太原理工大学计算机科学与技术学院
出处
《计算机应用与软件》
CSCD
北大核心
2014年第6期154-157,共4页
基金
山西省自然科学基金项目(2012011014-2)
文摘
在实际应用领域,常常存在同时包含数值型和分类型特征的混合数据。然而,已有的大多数聚类算法只能处理数值型或分类型单一类型数据,因此,提出一个基于划分的混合数据聚类算法。首先给出K-Prototypes算法中分类型数据类中心的多Modes表示方式,进而将传统的欧式距离扩展到混合数据,使之能够在相同框架下更加精确地反映对象与类之间的相异性,在此基础上提出一个用于处理混合数据的划分式聚类算法。最后,在UCI数据集上的实验结果表明,与K-Prototypes算法相比,所提出的算法能够有效提高聚类质量。
关键词
k
—Prototypes
算法
混合数据
划分聚类
相
异性
度量
Keywords
k
-Prototypes algorithm Mixed data Partitioned clustering Dissimilarity measure
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
位置不变的右截断Hill型估计量
被引量:
1
8
作者
陶宝
机构
重庆工商大学数学与统计学院
出处
《西南大学学报(自然科学版)》
CAS
CSCD
北大核心
2009年第3期14-17,共4页
基金
重庆市教委科学技术研究资助项目(030705)
文摘
当极值指标大于0时,提出了一种位置不变的右截断Hill型估计量,证明了该估计量的弱相合性,给出了其渐近展式,并对k的最优选择进行了讨论.
关键词
右截断
弱
相
合性
渐近展式
k
的
最优
选择
Keywords
right censoring
wea
k
convergence
asymptotic representation
optimal choice of
k
分类号
O211.4 [理学—概率论与数理统计]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
分布式数据挖掘中的最优K相异性取样技术
胡文瑜
孙志挥
张柏礼
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008
5
下载PDF
职称材料
2
基于相异性选择的密度聚类算法研究
胡文瑜
孙志挥
周晓云
《小型微型计算机系统》
CSCD
北大核心
2006
2
下载PDF
职称材料
3
自调优自适应遗传算法的WKNN特征选择方法
陈倩茹
李雅丽
许科全
刘铱龙
王淑琴
《计算机工程与应用》
CSCD
北大核心
2021
7
下载PDF
职称材料
4
一种基于K2结构学习算法的石漠化数据特征选择方法
李水明
舒宁
陶建斌
张银桥
《桂林工学院学报》
北大核心
2009
2
下载PDF
职称材料
5
基于障碍物群的k全局相异最优有序路径查询
孙冬璞
郝忠孝
《计算机工程》
CAS
CSCD
北大核心
2011
1
下载PDF
职称材料
6
课程推荐预测模型优化方案及数据离散化算法
张戈
《计算机系统应用》
2020
0
下载PDF
职称材料
7
一种基于划分的混合数据聚类算法
常茜茜
张月琴
《计算机应用与软件》
CSCD
北大核心
2014
5
下载PDF
职称材料
8
位置不变的右截断Hill型估计量
陶宝
《西南大学学报(自然科学版)》
CAS
CSCD
北大核心
2009
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部