期刊文献+
共找到129篇文章
< 1 2 7 >
每页显示 20 50 100
考虑属性相关度的大数据随机游走抽样仿真
1
作者 谢超群 游文辉 《计算机仿真》 2024年第9期429-432,519,共5页
大数据通常是非随机的,且大数据量下可能存在抽样偏倚的问题,部分群体可能被过采样或欠采样,从而导致结果准确性较低。为此,提出基于属性相关度的大数据随机游走抽样算法。获取大数据邻域关系矩阵,根据排序思想得到大数据单属性邻域关... 大数据通常是非随机的,且大数据量下可能存在抽样偏倚的问题,部分群体可能被过采样或欠采样,从而导致结果准确性较低。为此,提出基于属性相关度的大数据随机游走抽样算法。获取大数据邻域关系矩阵,根据排序思想得到大数据单属性邻域关系矩阵。计算不同大数据属性的邻域关系矩阵,计算数据属性的相关度,得到大数据属性约简结果。采用区间密度相似性调整区间,建立可变网格空间,将网格空间和密度偏差抽样算法有效结合,完成大数据随机游走抽样。仿真实验分析表明,所提算法可以大幅度提升样本质量,且能耗明显更低一些,最高仅为280Wh,获取更加精准的大数据随机游走抽样结果。 展开更多
关键词 属性相关 大数据 随机游走 抽样
下载PDF
基于属性相关性分析的贝叶斯分类模型 被引量:11
2
作者 章舜仲 王树梅 +1 位作者 黄河燕 陈肇雄 《情报学报》 CSSCI 北大核心 2007年第2期271-274,共4页
朴素贝叶斯分类器是一种简单而有效的概率分类方法,然而其属性独立性假设在现实世界中多数不能成立。为改进其分类性能,近几年已有大量研究致力于构建能反映属性之间依赖关系的模型。本文提出一种向量相关性度量方法,特征向量属于类... 朴素贝叶斯分类器是一种简单而有效的概率分类方法,然而其属性独立性假设在现实世界中多数不能成立。为改进其分类性能,近几年已有大量研究致力于构建能反映属性之间依赖关系的模型。本文提出一种向量相关性度量方法,特征向量属于类的的概率由向量相关度及其属性概率计算。向量相关度可通过本文给出的一个公式进行估计。实验结果表明,使用这种方法构建的分类模型其分类性能明显优于朴素贝叶斯,和其他同类算法相比也有一定提高。 展开更多
关键词 分类模型 贝叶斯定理 属性相关 向量相关
下载PDF
基于属性相关性的属性约简新方法 被引量:18
3
作者 张静 王建民 何华灿 《计算机工程与应用》 CSCD 北大核心 2005年第28期55-57,共3页
文章给出了一个基于粗糙集理论的属性相关性的新定义,并在此基础上给出了基于属性相关性的属性约简新方法。本算法不但能过滤掉属性集合中的无关属性,而且能有效地找到属性集合中的冗余属性,从而得到满意的属性约简。对UCI机器学习数据... 文章给出了一个基于粗糙集理论的属性相关性的新定义,并在此基础上给出了基于属性相关性的属性约简新方法。本算法不但能过滤掉属性集合中的无关属性,而且能有效地找到属性集合中的冗余属性,从而得到满意的属性约简。对UCI机器学习数据集的测试结果也验证了算法的有效性。 展开更多
关键词 粗糙集 属性约简 冗余属性 属性相关
下载PDF
基于属性相关度的Web数据库大小估算方法 被引量:30
4
作者 凌妍妍 孟小峰 刘伟 《软件学报》 EI CSCD 北大核心 2008年第2期224-236,共13页
提出了一种基于词频统计的方法以估算Web数据库的规模.通过分析Web数据库查询接口中属性之间的相关度来获取某个属性上的一组随机样本;并对该属性分别提交由前k位高频词形成的试探查询以估算Web数据库中记录的总数.通过在几个真实的Web... 提出了一种基于词频统计的方法以估算Web数据库的规模.通过分析Web数据库查询接口中属性之间的相关度来获取某个属性上的一组随机样本;并对该属性分别提交由前k位高频词形成的试探查询以估算Web数据库中记录的总数.通过在几个真实的Web数据库上进行实验验证,说明该方法可以准确地估算出Web数据库的大小. 展开更多
关键词 词频 Web数据库大小估计 属性相关
下载PDF
一种基于属性相关的C4.5决策树改进算法 被引量:13
5
作者 魏浩 丁要军 《中北大学学报(自然科学版)》 CAS 北大核心 2014年第4期402-406,共5页
针对在C4.5决策树构造过程中,测试属性选择未考虑属性之间影响的缺点,提出了一种改进的C4.5决策算法.该算法使用一个属性与其他属性的平均信息熵表示这个属性与其他属性的冗余度,然后在选择测试属性的过程中,加入测试属性与其他属性的... 针对在C4.5决策树构造过程中,测试属性选择未考虑属性之间影响的缺点,提出了一种改进的C4.5决策算法.该算法使用一个属性与其他属性的平均信息熵表示这个属性与其他属性的冗余度,然后在选择测试属性的过程中,加入测试属性与其他属性的冗余度,通过信息增益、分裂熵和冗余度三个因素的评价,选择信息增益率高而与其他属性冗余度低的测试属性.实验结果表明,在选定的实验数据集上,改进后的C4.5决策树算法平均分类正确率提高. 展开更多
关键词 C4 5决策树 属性相关 信息熵 信息增益率 冗余度
下载PDF
基于属性相关性划分的多敏感属性隐私保护方法 被引量:5
6
作者 谢静 张健沛 +1 位作者 杨静 张冰 《电子学报》 EI CAS CSCD 北大核心 2014年第9期1718-1723,共6页
近年来,基于l-多样性的多维敏感属性的隐私保护研究日趋增多,然而大部分多敏感属性隐私保护方法都是基于有损分解的思想,破坏了数据间的关系,降低了数据效用.为此,提出了一种面向多敏感属性的隐私模型,首先给出一种l-maximum原则用以满... 近年来,基于l-多样性的多维敏感属性的隐私保护研究日趋增多,然而大部分多敏感属性隐私保护方法都是基于有损分解的思想,破坏了数据间的关系,降低了数据效用.为此,提出了一种面向多敏感属性的隐私模型,首先给出一种l-maximum原则用以满足多敏感属性l-多样性要求;其次,为了保护属性间的相关性,根据属性间的依赖度对属性进行划分;最后设计并实现了MSA l-maximum(Multiple Sensitive Attributes l-maximum)算法.实验结果表明,提出的模型在保护隐私不泄露的同时,减少了元组的隐匿率,并且保护了数据间的关系. 展开更多
关键词 隐私保护 多敏感属性 l-多样性 属性相关 划分
下载PDF
基于属性相关的朴素贝叶斯分类算法 被引量:6
7
作者 魏浩 丁要军 《河南科学》 2014年第1期42-46,共5页
朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集... 朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类.实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升. 展开更多
关键词 朴素贝叶斯 属性相关 信息熵 信息增益
下载PDF
基于属性相关性的无线传感网络缺失值估计方法 被引量:4
8
作者 许可 雷建军 《计算机应用》 CSCD 北大核心 2015年第12期3341-3343,3347,共4页
针对无线传感器网络(WSN)中感知数据易缺失问题,提出了一种基于感知数据属性相关性的缺失值估计方法。该方法采用多元线性回归模型,对属性相关的感知数据的缺失值进行估计;同时,为提高算法估计的鲁棒性,提出了基于感知数据属性的数据交... 针对无线传感器网络(WSN)中感知数据易缺失问题,提出了一种基于感知数据属性相关性的缺失值估计方法。该方法采用多元线性回归模型,对属性相关的感知数据的缺失值进行估计;同时,为提高算法估计的鲁棒性,提出了基于感知数据属性的数据交织传送策略。仿真结果表明,所提出的估计方法能有效估计无线传感器网络中的缺失值,相比基于时空相关性的线性插值模型(LM)算法和传统的最近邻插值(NNI)算法具有更高的精度和稳定性。 展开更多
关键词 无线传感器网络 属性相关 缺失值 数据交织 鲁棒性
下载PDF
基于Zipf分布与属性相关性的选择性估计 被引量:5
9
作者 姜芳艽 《计算机科学》 CSCD 北大核心 2010年第11期184-189,共6页
在DeepWeb数据集成中,集成查询接口和很多Web数据库查询接口用合取谓词表达查询,但是也有相当一部分Web数据库的查询接口用互斥谓词表达查询,这意味着查询转换时每次只能选择一个谓词。因此,准确、高效地估计每个互斥查询的选择性是优... 在DeepWeb数据集成中,集成查询接口和很多Web数据库查询接口用合取谓词表达查询,但是也有相当一部分Web数据库的查询接口用互斥谓词表达查询,这意味着查询转换时每次只能选择一个谓词。因此,准确、高效地估计每个互斥查询的选择性是优化查询转换的关键。提出了基于Zipf分布与属性相关性的选择性估计方法。通过属性之间的相关性从Web数据库上获取该属性近似随机的属性级样本,在此基础上计算属性值的Zipf分布方程,进而推断该无限值属性的任意值的选择性。实验表明,该方法可以准确、高效地估计各互斥查询的选择性。 展开更多
关键词 ZIPF分布 属性相关 选择性估计
下载PDF
基于属性相关分析的离群数据并行挖掘算法 被引量:2
10
作者 王磊 张继福 《太原科技大学学报》 2011年第5期364-369,共6页
针对高维海量数据集中的局部离群数据,利用并行计算和属性相关性分析思想,给出了一种离群数据并行挖掘算法。该算法首先由主节点分配属性相关分析任务,各个子节点并行查找数据集中的冗余属性,将其冗余属性传回主节点,并由主节点删除;其... 针对高维海量数据集中的局部离群数据,利用并行计算和属性相关性分析思想,给出了一种离群数据并行挖掘算法。该算法首先由主节点分配属性相关分析任务,各个子节点并行查找数据集中的冗余属性,将其冗余属性传回主节点,并由主节点删除;其次,主节点分配搜索任务,各子节点采用微粒群算法,并行搜索局部离群子空间;再次,由主节点对局部离群子空间合并计算后,确定全局离群数据;最后,在MPICH2-1.0.3的并行计算环境下,采用恒星光谱数据作为数据集,实验结果验证了算法的正确性和有效性。 展开更多
关键词 数据挖掘 并行计算 局部离群数据 属性相关分析 冗余属性
下载PDF
二进制粒属性相关判定与应用
11
作者 王红霞 陈俊杰 王志伟 《微电子学与计算机》 CSCD 北大核心 2012年第2期65-69,共5页
采用二进制粒表示信息系统中的离散化属性值,即对属性进行二进制粒化,定义了基于二进制信息粒的匹配、合取及析取算子,描述了二进制粒属性相关的定义,提出了基于二进制粒的属性相关性判定矩阵的算法,算法通过判定信息系统中属性的相关性... 采用二进制粒表示信息系统中的离散化属性值,即对属性进行二进制粒化,定义了基于二进制信息粒的匹配、合取及析取算子,描述了二进制粒属性相关的定义,提出了基于二进制粒的属性相关性判定矩阵的算法,算法通过判定信息系统中属性的相关性,为属性约简及关联规则的求解提供一种新方法.如果相关属性同为条件属性,则可进行约简,选择其一;如果有决策属性,则可生成强关联规则;该算法在气象数据的仿真实验中验证了其实用性. 展开更多
关键词 二进制 粒度 算子 匹配矩阵 属性相关 气象数据
下载PDF
基于属性相关表的关系模式全部候选关键字求法
12
作者 郝忠孝 刘国华 刘长林 《计算机研究与发展》 EI CSCD 北大核心 1994年第6期6-13,共8页
本文提出了属性相关表这样一种新的概念,定义了相应的运算并研究了它的有关性质及定理。在此基础上提出了用属性相关表求关系模式全部主属性的等级,并给出了用主属性来组合关系模式全部候选关键字的算法。上述算法的时间复杂度均为O... 本文提出了属性相关表这样一种新的概念,定义了相应的运算并研究了它的有关性质及定理。在此基础上提出了用属性相关表求关系模式全部主属性的等级,并给出了用主属性来组合关系模式全部候选关键字的算法。上述算法的时间复杂度均为O(n2)。 展开更多
关键词 关系模式 属性相关 候选关键字
下载PDF
基于属性相关分析中的信息增益计算——五年制高职与三年制高职教育的比较 被引量:1
13
作者 刘亚琦 《科技创新导报》 2008年第27期212-212,214,共2页
讨论了数据挖掘中有关属性分析的基本思想,运用信息增益分析方法定量分析了五年制高职与三年制高职学生不同属性分类时的信息增益,为两种教育方式的比较提供依据。
关键词 五年制高职 三年制高职 数据挖掘 属性相关分析 信息增益分析方法
下载PDF
一种基于属性相关性度量的朴素贝叶斯分类模型 被引量:5
14
作者 王峻 《安庆师范学院学报(自然科学版)》 2007年第2期14-16,共3页
本文通过分析属性相关性的度量和属性约简,提出一种基于属性相关性度量的朴素贝叶斯分类模型EANBC。实验结果表明,与朴素贝叶斯分类模型相比,EANBC分类模型具有较高的分类正确率。
关键词 朴素贝叶斯 分类 属性相关 属性约简
下载PDF
基于属性相关性分析的高校学生成绩分析应用研究 被引量:4
15
作者 金诗谱 《西安文理学院学报(自然科学版)》 2018年第1期30-33,共4页
在高校教育领域,有很多宝贵的数据.通过对这些数据进行有效的挖掘,将结果反馈到课程,将会极大地提高课程质量.使用属性相关性分析技术,创新地提出VA-C5.0挖掘方法,通过对学生课程中所涉及的主客观数据进行数据挖掘、模型构建、模型验证... 在高校教育领域,有很多宝贵的数据.通过对这些数据进行有效的挖掘,将结果反馈到课程,将会极大地提高课程质量.使用属性相关性分析技术,创新地提出VA-C5.0挖掘方法,通过对学生课程中所涉及的主客观数据进行数据挖掘、模型构建、模型验证,得到生成树和相应规则集,再与传统挖掘方法相对比,验证其在精确度和时间效率上的优越性. 展开更多
关键词 数据挖掘 决策树 属性相关性分析 高校成绩分析
下载PDF
基于属性相关度的Web数据库大小估算方法
16
作者 雷琳 《计算机光盘软件与应用》 2014年第18期130-131,共2页
互联网技术的普及应用使得网络经济成为国民经济中新兴经济增长点,同时现有Web数据库中超过75%的Web数据库存储了结构优化信息。因此,WEB数据库逐渐成为时下人们获取结构优化信息的重要途径。为了能够提高WEB数据库利用效率,本文针对We... 互联网技术的普及应用使得网络经济成为国民经济中新兴经济增长点,同时现有Web数据库中超过75%的Web数据库存储了结构优化信息。因此,WEB数据库逐渐成为时下人们获取结构优化信息的重要途径。为了能够提高WEB数据库利用效率,本文针对Web数据库结构优化信息特点,采用基于属性相关度的方法来对数据库大小进行估算,以明确该数据库中记录信息总数,更好地服务于社会。 展开更多
关键词 属性相关 WEB数据库 估算方法 结构优化信息 互联网技术
下载PDF
一种属性相关性的加权贝叶斯分类算法研究 被引量:3
17
作者 郑默 刘琼荪 《微型机与应用》 2011年第7期96-98,共3页
根据RoughSet属性重要度理论,构建了基于互信息的属性子集重要度,提出属性相关性的加权朴素贝叶斯分类算法,该算法同时放宽了朴素贝叶斯算法属性独立性、属性重要性相同的假设。通过在UCI部分数据集上进行仿真实验,与基于属性相关性分... 根据RoughSet属性重要度理论,构建了基于互信息的属性子集重要度,提出属性相关性的加权朴素贝叶斯分类算法,该算法同时放宽了朴素贝叶斯算法属性独立性、属性重要性相同的假设。通过在UCI部分数据集上进行仿真实验,与基于属性相关性分析的贝叶斯(CB)和加权朴素贝叶斯(WNB)两种算法做比较,证明了该算法的有效性。 展开更多
关键词 朴素贝叶斯 属性重要度 属性相关 分类
下载PDF
一种新的基于属性相关性的数据流特征选择算法的研究 被引量:1
18
作者 陈万松 赵雷 《计算机应用与软件》 CSCD 北大核心 2012年第2期254-257,共4页
高维数据流包含大量的无关信息和冗余信息,这些信息可能极大地降低学习算法的性能。利用属性相关性可以有效地去除数据流中的不相关属性和冗余属性,提高学习算法的效率。分析现有的属性相关性计算方法在应用中的局限性,提出基于曲线拟... 高维数据流包含大量的无关信息和冗余信息,这些信息可能极大地降低学习算法的性能。利用属性相关性可以有效地去除数据流中的不相关属性和冗余属性,提高学习算法的效率。分析现有的属性相关性计算方法在应用中的局限性,提出基于曲线拟合的属性相关性特征选择算法FSCFFR(Feature Selection based on Curve-Fitting Feature Relevance)。理论分析和实验表明,FSCFFR在特征选择过程中具有较高的实时性和有效性。 展开更多
关键词 数据流 特征选择 属性相关
下载PDF
无指导学习环境下基于属性相关性分析和聚类算法的属性选择问题研究 被引量:2
19
作者 朱佳贤 《管理学报》 2005年第S2期162-165,共4页
属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,... 属性选择可以有效地降低特征维度,去除不相关属性,提高模型准确率以及增加模型的可解释程度。但是,无指导学习环境下的属性选择往往无法取得像有指导学习环境下那样令人满意的结果。先对无指导学习环境下的属性选择研究的现状进行阐述,然后介绍一种新方法———无指导学习环境下基于属性相关性分析和聚类算法的属性选择方法,并且通过实验来验证其有效性和实用性。 展开更多
关键词 属性选择 无指导学习 属性相关性分析 聚类分析
下载PDF
基于属性相关分析的大学生体质检测比较研究
20
作者 罗小翠 刘亚琦 张仲祥 《陇东学院学报》 2013年第5期106-109,共4页
根据数据挖掘中有关属性分析的基本思想,对照《国家学生体质健康标准》运用信息增益分析方法定量分析了三年制高职学生不同性别的年龄、体重、肺活量、坐位体前屈、台阶试验、立定跳远等不同属性的增益,客观评价了甘肃工业职业技术学院... 根据数据挖掘中有关属性分析的基本思想,对照《国家学生体质健康标准》运用信息增益分析方法定量分析了三年制高职学生不同性别的年龄、体重、肺活量、坐位体前屈、台阶试验、立定跳远等不同属性的增益,客观评价了甘肃工业职业技术学院体育教育的开展情况。 展开更多
关键词 《国家学生体质健康标准》 三年制高职 属性相关分析 信息增益分析方法
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部