期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
Model-Free Feature Screening via Maximal Information Coefficient (MIC) for Ultrahigh-Dimensional Multiclass Classification
1
作者 Tingting Chen Guangming Deng 《Open Journal of Statistics》 2023年第6期917-940,共24页
It is common for datasets to contain both categorical and continuous variables. However, many feature screening methods designed for high-dimensional classification assume that the variables are continuous. This limit... It is common for datasets to contain both categorical and continuous variables. However, many feature screening methods designed for high-dimensional classification assume that the variables are continuous. This limits the applicability of existing methods in handling this complex scenario. To address this issue, we propose a model-free feature screening approach for ultra-high-dimensional multi-classification that can handle both categorical and continuous variables. Our proposed feature screening method utilizes the Maximal Information Coefficient to assess the predictive power of the variables. By satisfying certain regularity conditions, we have proven that our screening procedure possesses the sure screening property and ranking consistency properties. To validate the effectiveness of our approach, we conduct simulation studies and provide real data analysis examples to demonstrate its performance in finite samples. In summary, our proposed method offers a solution for effectively screening features in ultra-high-dimensional datasets with a mixture of categorical and continuous covariates. 展开更多
关键词 Ultrahigh-Dimensional Feature Screening MODEL-FREE maximal information coefficient (mic) Multiclass Classification
下载PDF
基于MIC与BiGRU的水电机组振动趋势预测 被引量:13
2
作者 毕扬 郑波 +3 位作者 张亚武 朱溪 江亚兰 李超顺 《水利学报》 EI CSCD 北大核心 2021年第5期612-621,632,共11页
为提高水电机组振动趋势预测的准确率,本研究提出了一种基于最大信息系数(MIC)与双边门控循环神经网络(BiGRU)的水电机组振动趋势预测模型。首先,预处理阶段采用小波系数阈值去噪(WTD)方法对历史振动信号数据进行降噪处理以消除强背景... 为提高水电机组振动趋势预测的准确率,本研究提出了一种基于最大信息系数(MIC)与双边门控循环神经网络(BiGRU)的水电机组振动趋势预测模型。首先,预处理阶段采用小波系数阈值去噪(WTD)方法对历史振动信号数据进行降噪处理以消除强背景噪声的干扰,并将振动信号划分为多个训练样本以改善算法的鲁棒性;其次考虑水力、电气与机械不平衡力因素的影响,基于MIC对与振动信号关联性强的状态参数进行特征选择作为模型的参考输入;再采用BiGRU网络建立振动信号预测模型,进行超前多步的振动信号趋势预测;最后利用训练好的模型对在线获取的振动数据进行实时预测。为评估模型的预测性能,本研究采集某抽水蓄能水电站的振动监测数据进行多组对比实验,验证了所提方法具有较好的预测能力和泛化能力,适用于水电机组振动的趋势预测。 展开更多
关键词 最大信息系数法 BiGRU 小波阈值去噪 信号处理 特征选择 趋势预测
下载PDF
基于最大信息系数和深度残差图卷积的工业过程故障诊断方法 被引量:2
3
作者 任佳 孙思宇 鲍克 《高校化学工程学报》 EI CAS CSCD 北大核心 2023年第1期111-119,共9页
针对工业数据非线性、时变性、时空特征耦合的特点,提出一种基于最大信息系数和残差图卷积网络的工业过程故障诊断算法(MIC-RGCN)。引入最大信息系数(MIC)挖掘变量之间的相关关系,将高维变量之间的相关信息转换为空间距离信息,构建相关... 针对工业数据非线性、时变性、时空特征耦合的特点,提出一种基于最大信息系数和残差图卷积网络的工业过程故障诊断算法(MIC-RGCN)。引入最大信息系数(MIC)挖掘变量之间的相关关系,将高维变量之间的相关信息转换为空间距离信息,构建相关性矩阵作为图卷积层的邻接矩阵输入;构建改进的深度残差图卷积网络(GCN)模型对数据的时空特征进行深度融合提取并精准分类。在田纳西-伊斯曼过程和三相流过程数据集上将该算法与4种典型机器学习和深度学习算法进行对比测试。实验结果表明,该算法有效地提升了故障诊断的准确率。 展开更多
关键词 故障诊断 最大信息系数 图卷积网络 田纳西-伊斯曼过程 三相流过程
下载PDF
基于时间模式注意力机制的GRU短期负荷预测 被引量:3
4
作者 乔石 王磊 +2 位作者 张鹏超 闫群民 余帆 《电力系统及其自动化学报》 CSCD 北大核心 2023年第10期49-58,共10页
针对新能源时代负荷数据随机性更强及负荷预测误差较大的问题,提出一种基于时间模式注意力机制的门控循环单元神经网络短期负荷预测方法。首先,采用自适应白噪声的完整经验模态分解对负荷数据进行处理,得到若干个频率范围不同的本征模... 针对新能源时代负荷数据随机性更强及负荷预测误差较大的问题,提出一种基于时间模式注意力机制的门控循环单元神经网络短期负荷预测方法。首先,采用自适应白噪声的完整经验模态分解对负荷数据进行处理,得到若干个频率范围不同的本征模函数。其次,通过最大互信息系数进行相关性分析筛选特征,优化输入数据的特征维度。然后,构建基于时间模式注意力机制的门控循环单元神经网络预测模型进行负荷预测,采用自回归算法优化线性特征提取能力,得到预测结果。最后,通过实例分析证明了所提模型有助于负荷预测精度的提升。 展开更多
关键词 短期负荷预测 最大互信息系数 自适应白噪声的完整经验模态分解 TPA-GRU神经网络
下载PDF
基于不同特征选择方法和随机森林法的滑坡易发性评价--以湖南中西部地区为例 被引量:3
5
作者 段中满 贾亮亮 +2 位作者 蒋明光 雷耀波 陈雅娜 《华南地震》 2023年第2期115-124,共10页
湘中、湘西地区是湖南省滑坡地质灾害最为频发的地区,同时该区旅游资源和自然资源丰富,是滑坡管理的重点区域。为研究湘中、湘西地区滑坡易发性评价模型的适用性,以湖南中西部地区为例,在初步选取的15个滑坡致灾因子的基础上,采用最大... 湘中、湘西地区是湖南省滑坡地质灾害最为频发的地区,同时该区旅游资源和自然资源丰富,是滑坡管理的重点区域。为研究湘中、湘西地区滑坡易发性评价模型的适用性,以湖南中西部地区为例,在初步选取的15个滑坡致灾因子的基础上,采用最大互信息系数、递归特征选择、基于随机森林的基尼不纯度指标和平均精确度指标等方法开展滑坡致灾因子优化,分析剔除了平面曲率和剖面曲率两个不重要因子,最终提取了13个重要因子,利用随机森林模型开展了研究区易发性评价,并采用最近两年滑坡数据开展验证。结果表明:不同特征选择方法优化后的滑坡因子结合随机森林模型所得的模型结果与实际情况吻合性较好,中、较高和高易发区滑坡占比77.58%,验证结果为79.58%,该模型对湘中、湘西地区地质灾害易发性评价模型选取提供了参考与借鉴。 展开更多
关键词 滑坡 最大互信息系数 递归特征选择 随机森林
下载PDF
The Theoretical and Experimental Analysis of the Maximal Information Coefficient Approximate Algorithm 被引量:3
6
作者 Fubo SHAO Hui LIU 《Journal of Systems Science and Information》 CSCD 2021年第1期95-104,共10页
In the era of big data,correlation analysis is significant because it can quickly detect the correlation between factors.And then,it has been received much attention.Due to the good properties of generality and equita... In the era of big data,correlation analysis is significant because it can quickly detect the correlation between factors.And then,it has been received much attention.Due to the good properties of generality and equitability of the maximal information coefficient(MIC),MIC is a hotspot in the research of correlation analysis.However,if the original approximate algorithm of MIC is directly applied into mining correlations in big data,the computation time is very long.Then the theoretical time complexity of the original approximate algorithm is analyzed in depth and the time complexity is n2.4 when parameters are default.And the experiments show that the large number of candidate partitions of random relationships results in long computation time.The analysis is a good preparation for the next step work of designing new fast algorithms. 展开更多
关键词 statistical correlation the maximal information coefficient approximate algorithm mutual information dynamic programming algorithm
原文传递
检测多元相关关系的最大信息熵方法 被引量:4
7
作者 张亚红 李玉鑑 张婷 《电子与信息学报》 EI CSCD 北大核心 2015年第1期123-129,共7页
目前提出的用于检测变量间相关关系的方法,如最大信息系数(Maximal Information Coefficient,MIC),多应用于成对变量,却很少用于三元变量或更高元变量间的相关性检测。基于此,该文提出能够检测多元变量间相关关系的新方法最大信息熵(Max... 目前提出的用于检测变量间相关关系的方法,如最大信息系数(Maximal Information Coefficient,MIC),多应用于成对变量,却很少用于三元变量或更高元变量间的相关性检测。基于此,该文提出能够检测多元变量间相关关系的新方法最大信息熵(Maximal Information Entropy,MIE)。对于k元变量,首先基于任意两变量间的MIC值构造最大信息矩阵,然后根据最大信息矩阵计算最大信息熵来度量变量间的相关度。仿真实验结果表明MIE能够检测三元变量间的1维流形依赖关系,真实数据集上的实验验证了MIE的实用性。 展开更多
关键词 数据挖掘 多元相关 最大信息系数 最大信息熵
下载PDF
基于MRMR的光伏出力匹配方法研究及预测应用 被引量:2
8
作者 杨茂 王凯旋 《可再生能源》 CAS CSCD 北大核心 2021年第10期1314-1319,共6页
针对光伏出力匹配系统存在的气象因子选取不合理、有效信息提取不够精细化等问题,文章提出一种基于MRMR的光伏出力匹配方法。该方法采用皮尔逊相关系数对数据库进行缩减,减少冗余数据空间;然后,通过互信息理论剔除耦合气象因素,挖掘待... 针对光伏出力匹配系统存在的气象因子选取不合理、有效信息提取不够精细化等问题,文章提出一种基于MRMR的光伏出力匹配方法。该方法采用皮尔逊相关系数对数据库进行缩减,减少冗余数据空间;然后,通过互信息理论剔除耦合气象因素,挖掘待匹配日气象因素与短波辐射之间的联系,进一步提高光伏出力匹配标准;最后,将提取出的待匹配日特征通过马氏距离进行光伏出力匹配。文章利用基于MRMR的光伏出力匹配方法,在4种天气类型条件下,对新疆某光伏发电站的光伏出力进行匹配。分析结果表明了该匹配方法的正确性和有效性。 展开更多
关键词 光伏出力匹配 MRMR 皮尔逊相关系数 互信息 马氏距离
下载PDF
基于最大信息系数的多变量间相关关系度量方法研究 被引量:3
9
作者 张朝霞 吴杰 《太原师范学院学报(自然科学版)》 2022年第1期34-40,共7页
相关性分析因其能快速发现数据间潜在的关系而变得越来越重要了.在现实生活中,人们经常要分析多变量间的相关性大小.鉴于此,提出一种能够度量多变量间相关关系的度量方法——多变量间的最大互信息系数(Multi-variable Maximal Mutual In... 相关性分析因其能快速发现数据间潜在的关系而变得越来越重要了.在现实生活中,人们经常要分析多变量间的相关性大小.鉴于此,提出一种能够度量多变量间相关关系的度量方法——多变量间的最大互信息系数(Multi-variable Maximal Mutual Information Coefficient, Mv_MMIC),该方法能够探测多变量间广泛的相关关系,这里的广泛相关关系包括线性和非线性的函数型关系,甚至所有的函数型关系.首先利用最大互信息系数MIC (Mutual Information Coefficient)构建最大互信息系数矩阵,然后基于矩阵的特征分解原理,利用最大互信息系数矩阵的特征值构建出度量多变量间相关关系的度量方法,把度量两个随机变量间的相关关系的方法MIC巧妙地从两纬度的度量准则推广到度量多变量间的相关性的多维度度量准则中,最后通过实验证明:多变量间的最大互信息系数Mv_MMIC保留了MIC的通用性和公平性的优点,具有一定的理论研究和实际应用价值. 展开更多
关键词 多变量相关 非线性相关 最大信息系数 多变量间的最大互信息系数
下载PDF
基于最大信息系数的贝叶斯网络结构学习算法 被引量:4
10
作者 魏中强 徐宏喆 +1 位作者 李文 桂小林 《计算机应用研究》 CSCD 北大核心 2014年第11期3261-3265,共5页
为了得到正确的节点次序,构造接近最优的贝叶斯网络结构,利用最大信息系数与条件独立性测试相结合的方法,提出了一种新的贝叶斯网络结构学习算法(MICVO)。该算法利用最大信息系数衡量变量之间的依赖关系,生成初始的无向图,引入惩罚因子... 为了得到正确的节点次序,构造接近最优的贝叶斯网络结构,利用最大信息系数与条件独立性测试相结合的方法,提出了一种新的贝叶斯网络结构学习算法(MICVO)。该算法利用最大信息系数衡量变量之间的依赖关系,生成初始的无向图,引入惩罚因子δ减少图中冗余边的数量,并将这个无向图分解成多个子结构,确定图中边的方向,最后生成正确的节点次序作为K2算法的输入学习网络结构。在两个基准网络Asia和Alarm中进行实验验证,结果表明基于最大信息系数的贝叶斯网络结构学习算法可以得到接近最优的节点次序,学习到的网络结构与数据的拟合程度更好,分类准确性更高。 展开更多
关键词 贝叶斯网络 结构学习 节点次序 最大信息系数 条件独立性测试
下载PDF
基于最大信息系数的贝叶斯网络结构学习算法 被引量:4
11
作者 曾千千 曾安 +2 位作者 潘丹 杨海东 邓杰航 《计算机工程》 CAS CSCD 北大核心 2017年第8期225-230,共6页
在引入最大信息系数的基础上,提出一种改进的贝叶斯网络结构学习算法。在给定数据集的条件下,基于最大信息系数对变量间的关联度进行检测,根据筛选因子和关联度构造贝叶斯网络的初始化结构,并结合贪婪算法对初始网络结构进行局部优化,... 在引入最大信息系数的基础上,提出一种改进的贝叶斯网络结构学习算法。在给定数据集的条件下,基于最大信息系数对变量间的关联度进行检测,根据筛选因子和关联度构造贝叶斯网络的初始化结构,并结合贪婪算法对初始网络结构进行局部优化,将局部最优解进行整合形成全局最优解,生成最终的网络结构。在Asia和Car基准网络上的实验结果表明,与基于传统贪婪算法、随机K2算法的贝叶斯网络结构学习算法相比,该算法可以学习到与基准网络更相近的贝叶斯网络结构,并且具有较高的正确边均值和分类准确率。 展开更多
关键词 贝叶斯网络 结构学习 最大信息系数 关联度 贪婪算法
下载PDF
基于最大信息系数相关性分析和改进多层级门控LSTM的短期电价预测方法 被引量:48
12
作者 赵雅雪 王旭 +2 位作者 蒋传文 张津珲 周子青 《中国电机工程学报》 EI CSCD 北大核心 2021年第1期135-146,共12页
为准确预测电力市场中的短期电价,将最大信息系数(maximal information coefficient,MIC)相关性分析与改进多层级门控长短期记忆网络(multi-hierachy gated long shortterm memory,MHG-LSTM)相结合,提出一种新型短期电价预测方法。该方... 为准确预测电力市场中的短期电价,将最大信息系数(maximal information coefficient,MIC)相关性分析与改进多层级门控长短期记忆网络(multi-hierachy gated long shortterm memory,MHG-LSTM)相结合,提出一种新型短期电价预测方法。该方法首先对备选序列与预测电价序列做MIC相关性分析,在此基础上筛选备选序列并经小波变换合成神经网络输入序列,有效增加了输入中与预测电价相关的信息密度;其次,对传统LSTM进行创新性改进,提出用两级遗忘门和输入门替换传统的一级门控机构的MHG-LSTM模型,提高了神经网络选择和提取高频电价序列特征的能力。在PJM市场日前电价数据集上对所提方法进行仿真实验,实验结果表明,该方法的预测误差仅为4.506%,相比已有预测方法有效提升了短期电价的预测精度,且具有很强的普适性,可应用于电力市场短期电价预测,为市场参与者和监管机构提供有力决策依据。 展开更多
关键词 最大信息系数 相关性分析 长短期记忆(LSTM)神经网络 改进多层级门控LSTM 短期电价预测
下载PDF
统计相关性分析方法研究进展 被引量:74
13
作者 樊嵘 孟大志 徐大舜 《数学建模及其应用》 2014年第1期1-12,共12页
系统综述了自19世纪开始至今常用的统计相关性的方法,例如Pearson和Spearman相关系数,CorGc和CovGc相关性及距离相关性方法。重点介绍了2011年提出的MIC方法以及由此引发的毁誉参半的大量评述,旨在揭示这一热点领域的研究面貌。该领域... 系统综述了自19世纪开始至今常用的统计相关性的方法,例如Pearson和Spearman相关系数,CorGc和CovGc相关性及距离相关性方法。重点介绍了2011年提出的MIC方法以及由此引发的毁誉参半的大量评述,旨在揭示这一热点领域的研究面貌。该领域不仅受到统计学家的关注,而且受到了分析大样本和异质数据的应用研究领域的学者们的追捧,例如基因组生物学家和网络信息研究者。这些研究者期望在众多已有方法的理解和剖析中更恰当地付诸应用,并提出新的应用问题来推动新的分析方法的创造。 展开更多
关键词 相关分析 Pearson相关系数 Spearman相关系数 Kendall相关系数 互信息 距离相关 最大信息系数
下载PDF
基于非时间属性关联的数据逼真生成算法
14
作者 张锐 肖如良 +2 位作者 倪友聪 杜欣 蔡声镇 《计算机系统应用》 2018年第2期30-36,共7页
提出基于非时间属性关联的数据逼真生成算法.该算法可以解决数据生成器研发中非时间属性关联构建的困难问题,在大数据测评领域中对仿真数据生成有重要应用价值.首先,从数据集中提取关键的两个非时间属性,对它们分别做两重频数统计.然后... 提出基于非时间属性关联的数据逼真生成算法.该算法可以解决数据生成器研发中非时间属性关联构建的困难问题,在大数据测评领域中对仿真数据生成有重要应用价值.首先,从数据集中提取关键的两个非时间属性,对它们分别做两重频数统计.然后,根据两次统计结果计算最大信息系数值来评估相关性,用拉伸指数分布进行拟合,构建出关联模型.最后,通过模型参数构建约束,在此约束的二维矩阵中生成数据.实验结果表明,该算法能够有效地模拟真实数据集的数据特征. 展开更多
关键词 数据逼真生成 关联 最大信息系数 拉伸指数分布 属性关联
下载PDF
最大互信息系数的并行计算方法研究 被引量:4
15
作者 朱道恒 李志强 《科学技术与工程》 北大核心 2021年第34期14625-14633,共9页
针对最大互信息系数(maximal information coefficient,MIC)近似算法在大规模数据场景下的计算时间复杂度高,计算时间增长快的问题,提出一种最大互信息系数并行计算(parallel computing maximal information coefficient,PCMIC)方法。... 针对最大互信息系数(maximal information coefficient,MIC)近似算法在大规模数据场景下的计算时间复杂度高,计算时间增长快的问题,提出一种最大互信息系数并行计算(parallel computing maximal information coefficient,PCMIC)方法。分别在Spark和Spark-MPI(message passing interface)计算框架中,在不同的数据规模和不同的噪声水平下,利用PCMIC算法对14种典型的相关关系做并行计算。另外在不同节点数的情况下,选择两种具有代表性的相关关系来测试PCMIC算法在两种计算框架中的性能。结果表明:PCMIC算法在两种框架下的运算效果与原始MIC近似算法相比,同样具有普适性和均匀性,而且具有良好的可扩展性;随着数据规模和节点数的增加,PCMIC算法在两种框架中运算的时间增长明显比MIC近似算法慢,而且在Spark-MPI框架下的并行加速比和效率略优于Spark;Spark能够支持MPI任务的调度,为研究不同并行计算框架之间的融合奠定了一定的理论和应用基础。 展开更多
关键词 最大互信息系数 并行计算 最大互信息系数并行计算(PCmic) SPARK 消息传递接口(MPI)
下载PDF
基于最大信息系数的猪肉价格波动关联性分析
16
作者 刘赵发 郑金萍 刘汉明 《赣南师范大学学报》 2020年第6期62-64,共3页
中国是世界生猪生产大国,同时也是猪肉消费大国,中国人民主要的肉食来源之一就是猪肉.猪肉价格的波动会严重影响生猪生产与消费,分析猪肉价格与其他肉类价格之间的关联性具有重要意义.现有研究存在数据周期短或需要人为假定数学模型的不... 中国是世界生猪生产大国,同时也是猪肉消费大国,中国人民主要的肉食来源之一就是猪肉.猪肉价格的波动会严重影响生猪生产与消费,分析猪肉价格与其他肉类价格之间的关联性具有重要意义.现有研究存在数据周期短或需要人为假定数学模型的不足.本文以2009-2019年猪肉价格月度长周期数据为研究对象,采用模型无关的最大信息系数进行数据挖掘,分析猪肉价格与牛肉、羊肉和鸡肉之间的关联性.结果表明,猪肉价格与羊肉价格的关联最为紧密,与牛肉以及鸡肉价格的关联性相当. 展开更多
关键词 最大信息系数 猪肉价格波动 关联性 数据挖掘
下载PDF
影响烟草青枯病发生的关键气象因子分析 被引量:7
17
作者 陈代明 江其朋 +4 位作者 张世渠 廖帮红 龚杰 谭茜 秦平伟 《植物医生》 2020年第1期39-44,共6页
烟草是我国重要的经济作物,但随着土壤连作年限的增加,烟草青枯病的发生日益严重,成为制约烟草行业持续健康发展的主要因子.针对烟草青枯病发生与高温高湿的环境条件高度吻合这一现象,本文基于对田间烟草青枯病病情指数以及病害期间气... 烟草是我国重要的经济作物,但随着土壤连作年限的增加,烟草青枯病的发生日益严重,成为制约烟草行业持续健康发展的主要因子.针对烟草青枯病发生与高温高湿的环境条件高度吻合这一现象,本文基于对田间烟草青枯病病情指数以及病害期间气象因子的动态监测,引入最大信息系数和皮尔逊相关性系数评估方法,探究了影响烟草青枯病发生的关键气象因子.结果表明,空气湿度是烟草青枯病发生的必要因子,降雨过后,相对较高的空气温度是促进烟草青枯病发生发展的关键气象因子.当15 d平均湿度维持在87.74%以上、15 d最低温度维持在13.00℃以上、15 d平均温度维持在19.00℃以上时,田间烟草青枯病开始发生;当15 d最低温度升高(达到14.83℃以上)时,田间烟草青枯病开始流行;但当日平均温度低于18℃时,病害发生发展速度有所减缓.该结果为今后田间烟草青枯病的预测预报以及病害的及时防控提供了理论支持,在生产上具有一定的价值和意义. 展开更多
关键词 空气温湿度 烟草青枯病 相关性分析 最大信息系数
下载PDF
基于非线性波动网络模型的股票市场关联特征研究
18
作者 李为波 郭雪 《湖北大学学报(自然科学版)》 CAS 2021年第2期192-199,共8页
股价波动是股票市场研究的重要内容,本研究基于信息理论和复杂网络理论提出股票市场的股价波动网络模型.首先对股价波动关联性进行度量,然后分析股价波动的聚集性,运用极大平面过滤图算法对股票之间关联性进行分层研究.以上证180指数金... 股价波动是股票市场研究的重要内容,本研究基于信息理论和复杂网络理论提出股票市场的股价波动网络模型.首先对股价波动关联性进行度量,然后分析股价波动的聚集性,运用极大平面过滤图算法对股票之间关联性进行分层研究.以上证180指数金融成分股票为样本,实证结果发现:与常用的线性相关系数相比,在非线性波动条件下,互信息和最大信息系数对关联系有更好的度量,在结果的精确性上,最大信息系数比互信息更具优势.在构建的股票网络中,仅有少数关键的股票节点,信息的传递通过这些节点以分层的方式传递到整个市场.在金融大数据背景下,非线性波动网络模型为挖掘市场风险特征提供新的方法. 展开更多
关键词 复杂网络 互信息 线性相关系数 最大信息系数 极大平面过滤图
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部