期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
Estimation on principal component of multi-collinearity Gauss-Markov model based on minimum description length
1
作者 SHI Yu-feng~(1, 2) (1. Shandong University of Technology, Zibo 255049, China 2. Key Laboratory of Geospace Environment and Geodesy, Ministry of Education, Wuhan University, Wuhan 430079, China) 《中国有色金属学会会刊:英文版》 CSCD 2005年第S1期153-155,共3页
Gauss-Markov model is frequently used in data analysis; the analysis and estimation of its parameters is always a hot issue. Based on the information theory and from the viewpoint of optimal information on description... Gauss-Markov model is frequently used in data analysis; the analysis and estimation of its parameters is always a hot issue. Based on the information theory and from the viewpoint of optimal information on description—minimum description length, this paper discusses a case: where there is multi-collinearity in the coefficient matrix, principal component estimation is used to estimate and select the original parameters, so as to reduce its multi-collinearity and improve its credibility. From the viewpoint of minimum description length, this paper discusses the approach of selecting principal components and uses this approach to solve a practical problem. 展开更多
关键词 minimum description length Gauss-Markov MODEL multi-collinearity principal COMPONENT ESTIMATION
下载PDF
Minimum Description Length Methods in Bayesian Model Selection: Some Applications
2
作者 Mohan Delampady 《Open Journal of Statistics》 2013年第2期103-117,共15页
Computations involved in Bayesian approach to practical model selection problems are usually very difficult. Computational simplifications are sometimes possible, but are not generally applicable. There is a large lit... Computations involved in Bayesian approach to practical model selection problems are usually very difficult. Computational simplifications are sometimes possible, but are not generally applicable. There is a large literature available on a methodology based on information theory called Minimum Description Length (MDL). It is described here how many of these techniques are either directly Bayesian in nature, or are very good objective approximations to Bayesian solutions. First, connections between the Bayesian approach and MDL are theoretically explored;thereafter a few illustrations are provided to describe how MDL can give useful computational simplifications. 展开更多
关键词 BAYESIAN Analysis Model Selection minimum description length HIERARCHICAL BAYES BAYESIAN COMPUTATIONS
下载PDF
基于最小描述长度原则的二阶段轨迹降维算法
3
作者 俞晓红 李炎炎 +2 位作者 龙伟 章乐 Angelyn R.Lao 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期95-103,共9页
针对现有轨迹简化方法不能统一不同长度轨迹样本维度的问题,本文提出了一种两次使用最小描述长度原则的轨迹简化算法,即基于最小描述长度原则的二阶段轨迹简化算法.第一阶段,基于最小描述长度原则的近似轨迹分割算法被使用,对原始单个... 针对现有轨迹简化方法不能统一不同长度轨迹样本维度的问题,本文提出了一种两次使用最小描述长度原则的轨迹简化算法,即基于最小描述长度原则的二阶段轨迹简化算法.第一阶段,基于最小描述长度原则的近似轨迹分割算法被使用,对原始单个轨迹样本进行第一次降维处理;第二阶段,再次使用最小描述长度原则迭代地删除原始轨迹上具备极少时空语义信息的位置坐标点,从而达到统一维度的目的.实验结果表明,该算法既能统一不同长度轨迹样本的维度,又能有效保留原始轨迹中的关键时空语义信息;并且当第一阶段降维算法对轨迹样本压缩程度适当的情况下,第二阶段算法仅会增加极少的时间成本. 展开更多
关键词 轨迹降维 最小描述长度原则 轨迹时空语义信息 轨迹简化
下载PDF
一种高效的属性图聚类方法 被引量:22
4
作者 吴烨 钟志农 +2 位作者 熊伟 陈荦 景宁 《计算机学报》 EI CSCD 北大核心 2013年第8期1704-1713,共10页
图是描述现实世界各类复杂系统的一种普适模型,且许多实际应用中的图是大规模的.图的聚类是理解、分析和可视化大规模图的关键技术之一.现实世界的图往往包含丰富的属性信息,如何综合结构和属性信息进行属性图的聚类是一个新的挑战.大... 图是描述现实世界各类复杂系统的一种普适模型,且许多实际应用中的图是大规模的.图的聚类是理解、分析和可视化大规模图的关键技术之一.现实世界的图往往包含丰富的属性信息,如何综合结构和属性信息进行属性图的聚类是一个新的挑战.大多数的现有方法或者将结构和属性转化为距离,基于传统方法进行聚类;或者只考虑某一方面聚类.文中结合信息论中最小长度原则,基于遗传算法,提出一种高效的属性图聚类方法GA-AGC.通过对属性图聚类问题建模,转化为最小描述长度原则问题;扩展标签传播方法作为遗传算法初始化方法,结合编码减小的局部变异方法,提出一种解决属性图聚类的遗传算法.文中方法无需设定聚类的数目,算法复杂度近似线性于结点和边的数目.真实数据集上的实验验证了算法的有效性和高效性. 展开更多
关键词 属性图 聚类 遗传算法 最小长度原则
下载PDF
基于最长公共子序列距离的主旨模式挖掘算法 被引量:5
5
作者 冯林 于孝航 +2 位作者 孙焘 沈骁 潘晓雯 《计算机工程》 CAS CSCD 北大核心 2008年第14期47-48,51,共3页
针对现有主旨模式挖掘算法易受噪声干扰的问题,提出一种基于最长公共子序列距离的挖掘算法。在搜索过程中,该算法采用基于子序列距离判别的策略进行了有效的剪枝,对于非等长的候选模式,使用最小描述长度原则求其相关权重,据此选择出现... 针对现有主旨模式挖掘算法易受噪声干扰的问题,提出一种基于最长公共子序列距离的挖掘算法。在搜索过程中,该算法采用基于子序列距离判别的策略进行了有效的剪枝,对于非等长的候选模式,使用最小描述长度原则求其相关权重,据此选择出现频率最高、最能体现原时间序列特征的主旨模式。实验结果表明,与朴素式搜索相比,该算法的速度至少提升60%。 展开更多
关键词 主旨模式 噪声干扰 聚类分析 最小描述长度原则
下载PDF
基于三分状态MDL方法度量我国股市泡沫 被引量:13
6
作者 周爱民 汪孟海 +1 位作者 李振东 董盛楠 《南开大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第2期92-98,共7页
通过改进的三分状态MDL(最小描述长度)方法,在马尔科夫模型下,对我国1991年4月3日~2008年9月23日的上证指数和深证成份指数的价格泡沫情况进行了分析,研究发现,略去考虑我国股市在建立初期的异常波动外,其泡沫主要集中于1996年3月~199... 通过改进的三分状态MDL(最小描述长度)方法,在马尔科夫模型下,对我国1991年4月3日~2008年9月23日的上证指数和深证成份指数的价格泡沫情况进行了分析,研究发现,略去考虑我国股市在建立初期的异常波动外,其泡沫主要集中于1996年3月~1997年5月,2000年以及2006年6月~2007年9月之间,且最后一个时段泡沫情况最为严重. 展开更多
关键词 MDL 股市泡沫 马尔科夫模型 相对差百分比
下载PDF
一种增量并行式动态图异常检测算法 被引量:8
7
作者 韩涛 兰雨晴 +1 位作者 肖利民 刘艳芳 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2018年第1期117-124,共8页
图结构异常检测可以发现金融欺诈行为、网络入侵和可疑的社交行为。针对当前检测图异常算法的计算复杂度高、不能处理大规模动态图的缺点,研究并提出了一种增量并行式的算法以便更有效地发现和检测大规模动态图中的异常。该算法使用时... 图结构异常检测可以发现金融欺诈行为、网络入侵和可疑的社交行为。针对当前检测图异常算法的计算复杂度高、不能处理大规模动态图的缺点,研究并提出了一种增量并行式的算法以便更有效地发现和检测大规模动态图中的异常。该算法使用时间滑动窗口对图进行划分,在初始化阶段选取N个子图,使用最小描述长度(MDL)原理并行检测正常模式和异常模式,并行迭代地检测其他子图中的正常结构和异常结构。在多个大规模图数据集上的实验结果表明,检测动态图结构异常准确率达到96%,召回率达到85%,运行时间减少了一个数量级。同时还讨论了滑动窗口大小和并行数量对算法运行时间的影响。 展开更多
关键词 异常检测 增量 并行 滑动窗口 最小描述长度(MDL)原理
下载PDF
基于搭配对的汉语形容词-名词聚类 被引量:11
8
作者 闻扬 苑春法 黄昌宁 《中文信息学报》 CSCD 北大核心 2000年第6期45-50,共6页
本文提出了一个双向分级聚类的算法同时对不同词性的词进行聚类。在聚类过程中 ,不同词性的词的聚类交替进行 ,相互影响。我们以最小描述长度的原理为基础构造了目标函数。为了减小数据稀疏的影响 ,又提出了修饰度的与修正距离的概念。... 本文提出了一个双向分级聚类的算法同时对不同词性的词进行聚类。在聚类过程中 ,不同词性的词的聚类交替进行 ,相互影响。我们以最小描述长度的原理为基础构造了目标函数。为了减小数据稀疏的影响 ,又提出了修饰度的与修正距离的概念。将此算法应用于汉语形容词 -名词的搭配对 ,对形容词与名词进行聚类 。 展开更多
关键词 双向分级聚类 搭配对 修饰度 最小描述长度 汉语
下载PDF
一种自动确定参数的sIB算法 被引量:5
9
作者 叶阳东 刘东 +1 位作者 贾利民 LI Gang 《计算机学报》 EI CSCD 北大核心 2007年第6期969-978,共10页
针对sIB算法的压缩变量参数的确定问题,采用最小描述长度原理,构建一种自动确定参数的AsIB算法.算法使用一种有效的编码方案对数据分析模型和相应的数据进行描述,将最小描述长度的模型作为选择标准,从而有效发现了数据蕴含的特征模式数... 针对sIB算法的压缩变量参数的确定问题,采用最小描述长度原理,构建一种自动确定参数的AsIB算法.算法使用一种有效的编码方案对数据分析模型和相应的数据进行描述,将最小描述长度的模型作为选择标准,从而有效发现了数据蕴含的特征模式数目.实验表明:AsIB算法所采用的编码方案有效,在不设定模式数目的情况下,能够正确发现数据集所蕴含的模式.该算法解决了现sIB算法对先验知识的依赖问题,将能拓展其在多维数据的自动降维分析和模式提取等方面的应用. 展开更多
关键词 IB理论 SIB算法 AsIB算法 最小描述长度原理 模型选择
下载PDF
一种基于MDL原理的信号分选新算法 被引量:5
10
作者 黄桂根 孟兵 李品 《数据采集与处理》 CSCD 北大核心 2015年第3期656-668,共13页
研究了一种基于脉内调制特征的雷达信号聚类分选算法,该聚类分选算法根据最小描述长度(Minimum description length,MDL)原理判定数据源中存在数据类的数量,以及任一向量应该归属于哪一类,从而确定电磁信号环境中雷达辐射源的数量,并完... 研究了一种基于脉内调制特征的雷达信号聚类分选算法,该聚类分选算法根据最小描述长度(Minimum description length,MDL)原理判定数据源中存在数据类的数量,以及任一向量应该归属于哪一类,从而确定电磁信号环境中雷达辐射源的数量,并完成脉冲信号的分选处理。该算法将截获系统前端对雷达脉冲信号的采集数据视为脉冲向量,在对雷达脉冲向量进行必要的预处理后,进行聚类分选处理。来自不同雷达的脉冲信号由于它们的脉内调制(有意或无意调制)特征不同,聚类处理后将会形成不同的脉冲向量类。该算法的优势在于无需进行信号脉内特征的定量分析、提取和描述等处理。计算机仿真验证了该算法的有效性。 展开更多
关键词 电子对抗 信号分选 最小描述长度准则 聚类
下载PDF
盲信号分离中信号源数目估计方法研究 被引量:6
11
作者 徐小红 高隽 范之国 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第1期1-4,共4页
研究盲信号分离中信号源数目未知情况下信号源数目的估计问题。证明了无观测噪声时,利用观察信号数据矩阵的零空间估计法确定信号源数目的方法,等价于通过计算观察信号数据矩阵的秩来确定信号源数目;阐述了在信号源盲分离中有观测噪声时... 研究盲信号分离中信号源数目未知情况下信号源数目的估计问题。证明了无观测噪声时,利用观察信号数据矩阵的零空间估计法确定信号源数目的方法,等价于通过计算观察信号数据矩阵的秩来确定信号源数目;阐述了在信号源盲分离中有观测噪声时,国内外信号源数目估计的主要方法:特征值分解、Akaike信息准则(AIC)、最小描述长度(MDL)及Minka Bayesian准则,通过理论分析与实验结果对这些方法进行比较,得出各方法的适用范围以及影响估计的主要参数,为信号源数目的正确获取提供参考。 展开更多
关键词 盲信号分离 信号源数目 特征值分解 AIC准则 MDL准则 Minka Bayesian准则
下载PDF
基于模型选择的模式波前重构算法研究 被引量:2
12
作者 谢文科 高穹 +2 位作者 马浩统 魏文俭 江文杰 《物理学报》 SCIE EI CAS CSCD 北大核心 2015年第14期145-150,共6页
基于Zernike模式的波前重构算法通常忽略实际波前像差构成的差异,而用一定数量的低阶Zernike模式进行波前重构,导致模式混淆或耦合等问题,进而影响波前重构的精度.根据信息论中的最小描述长度准则对重构模型的阶数进行了选择,在此基础... 基于Zernike模式的波前重构算法通常忽略实际波前像差构成的差异,而用一定数量的低阶Zernike模式进行波前重构,导致模式混淆或耦合等问题,进而影响波前重构的精度.根据信息论中的最小描述长度准则对重构模型的阶数进行了选择,在此基础上应用非线性优化算法计算重构系数,并最终实现波前重构;对不同信噪比条件下振幅均匀分布入射光束的波前进行了重构.结果表明:该算法不但能够实现相对于现有算法相对较高的波前重构精度,并且具有优良的噪声适应性,体现了模型选择在模式法波前重构算法中的意义. 展开更多
关键词 波前重构 模型选择 最小描述长度 非线性优化
下载PDF
基于OIVPM的特征值确定ARMA模型的结构 被引量:3
13
作者 肖创柏 罗晖 李衍达 《自动化学报》 EI CSCD 北大核心 1996年第1期68-73,共6页
基于最小描述长度(MDL)准则,提出了一种新的自回归滑动平均(ARMA)模型结构辨识方法.该方法将 ARMA模型的结构辨识分两步进行:首先利用超定辅助变量乘积矩(OIVPM)的最小特征值确定自回归(AR)部分的阶,然... 基于最小描述长度(MDL)准则,提出了一种新的自回归滑动平均(ARMA)模型结构辨识方法.该方法将 ARMA模型的结构辨识分两步进行:首先利用超定辅助变量乘积矩(OIVPM)的最小特征值确定自回归(AR)部分的阶,然后利用协方差矩阵的特征值估计滑动平均(MA)部分的阶.方法的可行性与有效性通过大量的数值仿真得到验证. 展开更多
关键词 ARMA模型 结构辨识 OIVPM 信号处理
下载PDF
基于功率谱包络动态分割的鲁棒语音端点检测 被引量:1
14
作者 许春冬 王晶 +3 位作者 战鸽 应冬文 李军锋 颜永红 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第11期1189-1193,共5页
在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语... 在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性. 展开更多
关键词 语音端点检测 动态分割 聚类 最小描述长度准则
下载PDF
基于边缘信息的区域合并SAR图像分割算法 被引量:6
15
作者 张泽均 水鹏朗 《系统工程与电子技术》 EI CSCD 北大核心 2014年第10期1948-1954,共7页
针对基于区域合并的合成孔径雷达图像分割中区域合并的顺序问题,提出一种利用边缘信息的区域合并技术。首先,利用改进的比例边缘检测算子获得初始过分割结果;然后,设计一个基于相邻区域的面积和边缘信息的区域合并优先级函数来引导区域... 针对基于区域合并的合成孔径雷达图像分割中区域合并的顺序问题,提出一种利用边缘信息的区域合并技术。首先,利用改进的比例边缘检测算子获得初始过分割结果;然后,设计一个基于相邻区域的面积和边缘信息的区域合并优先级函数来引导区域合并的进行,该方法提高了模型参数的估计精确,同时保留图像的强边缘;最后,将边缘信息区域合并技术用于求解基于多边形网格的最短描述长度准则SAR图像分割模型。实验表明,与同类方法相比,本文方法的边缘检测能力与定位精度均有提高。 展开更多
关键词 合成孔径雷达 图像分割 最短描述长度准则 边缘信息区域合并
下载PDF
基于最小描述长度的不完备数据处理 被引量:2
16
作者 李然 林和 李永礼 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第6期78-80,共3页
不完备数据是造成信息系统不确定的主要原因之一,对数据挖掘、知识发现等造成了困难.本文提出一种基于最小描述长度原则的不完备数据处理方法,实例证明这种方法是有效的.Rose工具的规则提取结果证明此方法在规则的集中性和支持度方面... 不完备数据是造成信息系统不确定的主要原因之一,对数据挖掘、知识发现等造成了困难.本文提出一种基于最小描述长度原则的不完备数据处理方法,实例证明这种方法是有效的.Rose工具的规则提取结果证明此方法在规则的集中性和支持度方面优于粗糙集辨识矩阵方法和Conditioned mean completer方法. 展开更多
关键词 最小描述长度 不完备数据 信息熵
下载PDF
基于统计方法和主动轮廓模型相结合的医学图像轮廓提取 被引量:1
17
作者 陈曾胜 周康源 +3 位作者 李传富 胡跃辉 黄丹 王庆临 《应用科学学报》 CAS CSCD 北大核心 2005年第1期41-44,共4页
采用最小描述长度作为目标函数实现点分布模型上轮廓点的自动选取,提出了一种结合统计方法与主动轮廓模型提取图像轮廓曲线的方法.对一系列图像训练得到该训练集的典型轮廓曲线,初始化新图像的主动轮廓模型曲线后,再用训练集得到的轮廓... 采用最小描述长度作为目标函数实现点分布模型上轮廓点的自动选取,提出了一种结合统计方法与主动轮廓模型提取图像轮廓曲线的方法.对一系列图像训练得到该训练集的典型轮廓曲线,初始化新图像的主动轮廓模型曲线后,再用训练集得到的轮廓线约束其变形,提取图像最佳的轮廓曲线.实验表明,与传统主动轮廓模型比较,该方法具有更好的轮廓提取效果. 展开更多
关键词 主动轮廓模型 轮廓提取 图像轮廓 初始化 轮廓线 医学图像 自动选取 相结合 描述 分布模型
下载PDF
一种模型选择优化准则及其在高光谱图像非监督分类中的应用 被引量:1
18
作者 吴昊 郁文贤 +1 位作者 匡纲要 李智勇 《电子学报》 EI CAS CSCD 北大核心 2003年第z1期2154-2157,共4页
选择合适的类别数是非监督分类中的一个关键问题 .针对采用高斯混合建模的高光谱图像非监督分类问题 ,该文提出了一种基于主成分分析 (PCA)的最小描述长度 (MDL)型模型选择准则 (文中简称为PMDL)来确定分类类别数 ,即根据PCA变换后保留... 选择合适的类别数是非监督分类中的一个关键问题 .针对采用高斯混合建模的高光谱图像非监督分类问题 ,该文提出了一种基于主成分分析 (PCA)的最小描述长度 (MDL)型模型选择准则 (文中简称为PMDL)来确定分类类别数 ,即根据PCA变换后保留的各主成分表达的数据方差不同而应具有不同的编码长度这一事实 ,在计算描述长度时对各维进行加权 .分类过程中 ,论文采用期望最大化 (ExpectationMaximization)算法在合并的策略下对PCA变换后的数据求解混合模型 ,并应用所提出的准则进行模型选择从而确定待分类的类别数 .仿真数据实验证实了新准则的有效性和优良的性能 。 展开更多
关键词 非监督分类 高斯混合模型 期望最大化算法 主成分分析 最小描述长度准则
下载PDF
复共线Gauss-Markov模型参数估计的最小描述长度方法 被引量:2
19
作者 史玉峰 靳奉祥 《青岛大学学报(工程技术版)》 CAS 2005年第1期20-23,共4页
Gauss-Markov模型是多元数据分析处理工作中常用的模型,其参数估计与筛选一直是研究的热点。当Gauss-Markov模型的设计矩阵存在复共线性时,常用主成分分析方法来筛选和估计其参数,消去它们之间的复共线性,提高估计准确度。基于最小描述... Gauss-Markov模型是多元数据分析处理工作中常用的模型,其参数估计与筛选一直是研究的热点。当Gauss-Markov模型的设计矩阵存在复共线性时,常用主成分分析方法来筛选和估计其参数,消去它们之间的复共线性,提高估计准确度。基于最小描述长度原理,提出了一种新的参数筛选估计方法。该方法应用最小描述长度原理选择主成分作为参数,其参数的可靠性较高;从信息的角度看,这种方法的信息损失最小。最后实例说明了该方法的有效性和可靠性。 展开更多
关键词 最小描述长度 多元数据分析 Gauss—Markov模型 参数估计 复共线性 信息损失
下载PDF
投资组合分析中的指标选择方法 被引量:1
20
作者 郝善勇 刘玉树 《计算机工程》 EI CAS CSCD 北大核心 2000年第12期56-58,共3页
文章介绍了金融投资决策中的指标选择方法,提出了一种基于粗集数据分析系统RSDA(Rough Set Data Analysis)的指标子集选择算法。该算法利用信息论的熵函数,根据MDL原理构造评价函数,在全部属性集合中寻找最优属性子集。
关键词 投资组合分析 指标选择 数据仓库 机器学习
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部