期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
采用密度比估计的多窗口变点检测方法
1
作者 张曼 崔文泉 《计算机工程与应用》 CSCD 北大核心 2023年第3期84-93,共10页
针对基于密度比估计的时间序列变点检测方法受时间窗窗宽限制,识别变点类型单一的问题,利用和发展动态多重过滤算法MFA(multiple filtering algorithm),提出一种多窗口变点检测方法 mDRCPD(multiple window density-ratio change point ... 针对基于密度比估计的时间序列变点检测方法受时间窗窗宽限制,识别变点类型单一的问题,利用和发展动态多重过滤算法MFA(multiple filtering algorithm),提出一种多窗口变点检测方法 mDRCPD(multiple window density-ratio change point detection)。将处理后的时间序列按多个时间窗进行适当划分,通过比较相邻时间窗数据的分布差异来识别变点,采用基于密度比估计的相对皮尔逊散度来度量不同时间窗数据分布的差异性;固定窗宽下寻找变点集,并按照MFA方法集成各变点集。模拟实验和实证分析表明,与基于密度比的单窗口变点检测方法相比,mDRCPD方法在多变点时间序列变点检测中绝对误差、召回率、F1得分等指标均有改善。将mDRCPD方法应用到COVID-19的传播进程分析中,通过对传播率的分段建模来刻画疫情的阶段性特点,评估国家政策在降低疫情传播速度上的效果。 展开更多
关键词 时间序列 变点检测 密度比估计 COVID-19 多窗口 多重过滤算法
下载PDF
高维数据情形下的一种基于随机投影的集成分类方法 被引量:4
2
作者 崔文泉 黄禹侨 《中国科学技术大学学报》 CAS CSCD 北大核心 2019年第12期974-984,共11页
针对高维数据的分类问题,提出一种基于随机投影的决策树集成学习方法(Projection Forest,简记PJForest).该方法以决策树为基分类器,利用一系列随机投影对数据进行降维,基于降维后的数据构建相应的一系列决策树,而后通过集成学习构造集... 针对高维数据的分类问题,提出一种基于随机投影的决策树集成学习方法(Projection Forest,简记PJForest).该方法以决策树为基分类器,利用一系列随机投影对数据进行降维,基于降维后的数据构建相应的一系列决策树,而后通过集成学习构造集成分类器.利用适当的随机投影对数据进行降维,能保持数据几何结构的信息;且通过随机投影对原始数据进行扰动,能丰富决策树的多样性,经过适当集成可有效克服噪音的影响,进而提升PJForest的泛化能力.证明了PJForest泛化误差的极限性质,得到泛化误差在一定意义下的收敛速度.还开展大量的模拟研究,并对实际数据进行了实证分析.模拟研究的结果表明,PJForest能有效地对包含大量噪音的高维数据进行分类,与已有的诸如随机森林、Xgboost这些方法相比,有更好的分类性能. 展开更多
关键词 决策树 多样性 高维 分类 集成学习 随机投影
下载PDF
一种生存数据非线性充分降维子空间估计的新方法 被引量:1
3
作者 崔文泉 吴成龙 《中国科学技术大学学报》 CAS CSCD 北大核心 2015年第9期709-716,共8页
给出了一种估计生存数据非线性充分降维子空间的新方法.利用再生核Hilbert空间性质以及双切片思想,建立广义特征谱分解问题与获得充分降维子空间的联系,以此估计生存时间和删失时间的联合非线性降维中心子空间.进一步结合SDR中心子空间... 给出了一种估计生存数据非线性充分降维子空间的新方法.利用再生核Hilbert空间性质以及双切片思想,建立广义特征谱分解问题与获得充分降维子空间的联系,以此估计生存时间和删失时间的联合非线性降维中心子空间.进一步结合SDR中心子空间的性质,通过联合SDR中心子空间来估计权重函数,在算法实现过程中,利用迭代思想,达到提高估计效率的目的.最后通过数值模拟来说明该方法的优良性. 展开更多
关键词 再生核HILBERT空间 充分降维 切片逆回归 生存数据
下载PDF
利用相关生存数据的信息提高Cox模型参数估计效率(英文) 被引量:1
4
作者 崔文泉 《应用概率统计》 CSCD 北大核心 2011年第6期614-632,共19页
Cox模型是生存分析中使用非常广泛的半参数回归模型,其回归参数的极大部分似然估计具有相合性、渐近正态性及有效性等优良性质.本文首次给出一种利用相关生存数据的信息提高Cox模型参数估计效率的方法,利用著名的WLW(1989,JASA)边际比... Cox模型是生存分析中使用非常广泛的半参数回归模型,其回归参数的极大部分似然估计具有相合性、渐近正态性及有效性等优良性质.本文首次给出一种利用相关生存数据的信息提高Cox模型参数估计效率的方法,利用著名的WLW(1989,JASA)边际比例风险模型及构造独特的回归参数估计方程对参数估计进行提高效率的研究.WLW模型在建模时对生存时间之间的相依结构不进行模型假定,所收集到的数据可以方便地用WLW模型进行刻画,然而直接由WLW方法进行参数估计无法达到提高估计效率的目的,本文在Yang(2000)和Cui(2004)的基础上,利用基于分割的方法,在一定的最优准则下对生存时间进行"分割重组"构造出优良的估计方程,求得的参数估计充分利用了相关信息,由所提取的辅助相依信息提高了参数估计的效率.模拟研究表明,在生存时间之间具有一定相依性的情形下,方法在提高估计效率方面有良好表现. 展开更多
关键词 COX模型 多元生存数据 边际比例风险 WLW模型 基于分割方法 估计效率
下载PDF
基于双编码器利用在线社交网络信息的股票价格预测 被引量:1
5
作者 崔文泉 王青芳 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第8期1093-1101,共9页
设计了双编码器-解码器模型,在模型的双编码器端分别对情绪变量和技术指标进行单独编码,以提高两类信息输入时编码器-解码器模型对股价的预测准确率.首先,对模型的编码和解码,基于门控循环单元(GRU)进行改进,通过去掉重置门,使用更新门... 设计了双编码器-解码器模型,在模型的双编码器端分别对情绪变量和技术指标进行单独编码,以提高两类信息输入时编码器-解码器模型对股价的预测准确率.首先,对模型的编码和解码,基于门控循环单元(GRU)进行改进,通过去掉重置门,使用更新门代替重置门的功能,将激活函数tanh替换为ReLU激活函数,以达到提高网络训练速度和模型精度的效果.其次,将市场情绪看作离散时间的随机过程,当固定时间时,市场情绪是服从某个概率分布的变量,对其概率分布进行估计,可得市场情绪关于积极、消极和中立的概率估计.进一步的,基于构建伪标签的情感分类器,建立情绪得分公式,并基于Bagging集成的方法对市场情绪的概率分布进行估计,作为投资者情绪变量的补充.另一方面,对多个超参数调整选优,设计正交试验,大大缩短了模型选参时间.实验结果表明,两输入的双编码器-解码器,不仅提升了编码器-解码器框架的股价预测效果,还通过引入投资者情绪,提高了模型的准确率和鲁棒性. 展开更多
关键词 在线社交网络 投资者情绪 双编码器-解码器 门控循环单元
下载PDF
数据量少情形下的一种回归预测模型的建立方法 被引量:1
6
作者 崔文泉 《预测》 CSSCI 1998年第1期54-57,共4页
本文讨论了数据量少情形下的建立回归预测模型的方法,并对文献[1]中的应用实例进行了处理。
关键词 回归预测模型 回归自变量 选择 SWEEP 运算
下载PDF
一种处理混合患病兄弟对IBD数据连锁分析的方法
7
作者 崔文泉 许晋 《中国科学技术大学学报》 CAS CSCD 北大核心 2009年第3期254-260,共7页
患病兄弟对(affected sib-pair,ASP)设计是连锁分析中的重要方法,得到了广泛的研究和应用.然而,实际问题中患病兄弟对中常常会混杂部分半兄弟对,而且由于个人隐私等原因,兄弟对关系的信息往往缺失,我们称这种数据为混合患病兄弟对(mixed... 患病兄弟对(affected sib-pair,ASP)设计是连锁分析中的重要方法,得到了广泛的研究和应用.然而,实际问题中患病兄弟对中常常会混杂部分半兄弟对,而且由于个人隐私等原因,兄弟对关系的信息往往缺失,我们称这种数据为混合患病兄弟对(mixed affected sib-pair,MASP).对混合患病兄弟对的IBD(identical by descent)数据给出了一种进行连锁分析的方法,构造了可识别的统计模型,证明了用于进行连锁分析的似然比检验统计量的渐近零分布服从自由度为3的卡方分布,同时给出了求解参数估计的EM算法.统计模拟表明,该方法在小样本情形下具有良好表现. 展开更多
关键词 连锁分析 可识别性 混合患病兄弟对 似然比检验 EM算法
下载PDF
一种基于RKHS及半参数理论的非线性充分降维方法
8
作者 崔文泉 刘波 《中国科学技术大学学报》 CAS CSCD 北大核心 2016年第11期898-906,共9页
提出了一种基于再生核Hilbert空间(reproducing kernel Hilbert space,RKHS)及半参数理论的非线性充分降维新方法——广义半参数核切片逆回归(generalized semiparametric kernel sliced inverse regression,generalized semi-KSIR或GSK... 提出了一种基于再生核Hilbert空间(reproducing kernel Hilbert space,RKHS)及半参数理论的非线性充分降维新方法——广义半参数核切片逆回归(generalized semiparametric kernel sliced inverse regression,generalized semi-KSIR或GSKSIR).该方法将经典的半参数方法拓展至感兴趣参数为无穷维的广义半参数方法,将半参数模型推广到不仅冗余参数为无穷维而且感兴趣参数也可为无穷维的广义半参数模型情形,推导出相应的广义冗余切平面之正交补空间,进而构造了降维方向的估计方程,并由RKHS理论及正则化方法完成相应目标函数的求解,求得具有优良性质的非线性充分降维子空间的估计,并且新方法不需要切片逆回归(SIR)与核切片逆回归(KSIR)等方法所要求的基本的线性设计条件(linear design condition,LDC),适用性较广.最后进行了统计模拟研究,显示了新方法在有限样本下具有良好表现. 展开更多
关键词 再生核 半参方法 冗余切平面 切片逆回归 非线性充分降维
下载PDF
对球面工件的一种新测量方法的最优设计研究
9
作者 崔文泉 李娟 《数理统计与管理》 CSSCI 北大核心 1999年第4期31-34,38,共5页
崔文泉、李娟.对球面工件的一种新测量方法的最优设计研究.本文针对一种新的适用于车间在线测量的球面工件测量方法———气动方式的多测头、多测点的方法进行了布点最优设计的研究,给出了布点设计的最优性条件、使被测球半径达到最... 崔文泉、李娟.对球面工件的一种新测量方法的最优设计研究.本文针对一种新的适用于车间在线测量的球面工件测量方法———气动方式的多测头、多测点的方法进行了布点最优设计的研究,给出了布点设计的最优性条件、使被测球半径达到最大精度的设计等。 展开更多
关键词 测量方法 最优设计 CMM方法 球面工件 在线测量
下载PDF
基于混合患病兄弟对IBD数据的连锁分析
10
作者 崔文泉 李凯 《高校应用数学学报(A辑)》 CSCD 北大核心 2011年第1期12-20,共9页
患病兄弟对(affected sib-pair,ASP)设计在遗传统计中有着广泛的应用,这种设计针对的是完全兄弟对(full-sib),而在实际问题中,被抽样的患病兄弟对中常会混有一定数目的半兄弟对(half-sib).论文对这种基于IBD信息的混有半兄弟对的ASP(称... 患病兄弟对(affected sib-pair,ASP)设计在遗传统计中有着广泛的应用,这种设计针对的是完全兄弟对(full-sib),而在实际问题中,被抽样的患病兄弟对中常会混有一定数目的半兄弟对(half-sib).论文对这种基于IBD信息的混有半兄弟对的ASP(称为mixed affected sib-pair,简记MASP)新数据类型进行连锁分析,特别是对似然比检验进行了详细的讨论.研究表明,仅有IBD信息的MASP数据,所得到的统计模型是不可识别的,且ASP设计中普遍采用的比例检验和均值检验不能使用.文中通过追加信息的手段解决了上述的不可识别性,随后对模型参数的估计给出了EM算法,证明了似然比检验的渐近零分布服从自由度为3的卡方分布.最后进行了统计模拟研究,模拟结果显示所给的检验方法在小样本情形下具有良好的表现. 展开更多
关键词 患病兄弟对 连锁分析 似然比检验 混合模型 可识别性
下载PDF
随机模拟在锁具互开问题研究中的应用
11
作者 崔文泉 李娟 《数理统计与管理》 CSSCI 北大核心 1998年第3期11-15,共5页
崔文泉,李娟.随机模拟在锁具互开问题研究中的应用.数理统计与管理,1998,17(3),11~15.本文针对1994年全国大学生数学模型竞赛B题中锁具随机装箱引起顾客抱怨的程度分析,提出一种计算机随机模拟的算法,算法... 崔文泉,李娟.随机模拟在锁具互开问题研究中的应用.数理统计与管理,1998,17(3),11~15.本文针对1994年全国大学生数学模型竞赛B题中锁具随机装箱引起顾客抱怨的程度分析,提出一种计算机随机模拟的算法,算法实现简单。 展开更多
关键词 计算机 随机模拟 锁具装箱问题 锁具互开问题
下载PDF
一种处理非均衡数据的非迭代核逻辑回归方法
12
作者 崔文泉 余德美 程浩洋 《中国科学技术大学学报》 CAS CSCD 北大核心 2019年第12期965-973,共9页
针对严重非均衡数据提出一种非迭代核逻辑回归的学习方法.该方法是对经典处理核逻辑回归的迭代加权最小二乘方法的一种改进,不仅减轻了由于迭代所造成的运算负担,而且在模型训练中利用了基准的类别占比信息,避免了使用诸如欠抽样、过抽... 针对严重非均衡数据提出一种非迭代核逻辑回归的学习方法.该方法是对经典处理核逻辑回归的迭代加权最小二乘方法的一种改进,不仅减轻了由于迭代所造成的运算负担,而且在模型训练中利用了基准的类别占比信息,避免了使用诸如欠抽样、过抽样、代价敏感学习等通常处理非均衡数据的方式所导致的问题,使得在数据规模大的非均衡数据情形下,可以方便快捷地对核逻辑回归进行建模,构造具有稳健性的修正最小二乘逻辑回归分类器.理论研究表明,所提方法具有一定的优良性质,模拟研究及实证分析显示其分类效果良好. 展开更多
关键词 核逻辑回归 非迭代方法 非均衡数据 迭代加权最小二乘 稳健
下载PDF
非均衡数据情形的一种协同正则化多视图半监督学习分类器
13
作者 崔文泉 陈伟 程浩洋 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第5期596-604,共9页
利用多视图学习、流形学习以及协同正则化的多重惩罚处理,对含有大量无标签的类别数据提出一种多视图半监督学习的分类器构造方法.该方法由递归提升的方式对数据进行逐次多视图半监督学习,通过适当的标签化、均衡化处理改进每次集成的... 利用多视图学习、流形学习以及协同正则化的多重惩罚处理,对含有大量无标签的类别数据提出一种多视图半监督学习的分类器构造方法.该方法由递归提升的方式对数据进行逐次多视图半监督学习,通过适当的标签化、均衡化处理改进每次集成的学习效率直到稳定.通过最小二乘和多分类SVM研究了新方法的性质,给出泛化误差的一个有意义上界,体现了新方法良好的泛化能力.模拟研究和实证分析显示,在有限样本情形下新方法具有良好的表现. 展开更多
关键词 半监督学习 多视图学习 协同正则化 非均衡数据 集成学习
下载PDF
删失回归模型中基于LAD的线性假设检验研究(英文)
14
作者 崔文泉 《中国科学技术大学学报》 CAS CSCD 北大核心 2004年第5期511-523,共13页
在ZhaoLC .Linearhypothesistestingincensoredregressionmodels基础上讨论了删失回归模型的线性假设检验问题 ,在局部备择假设成立时 ,给出了基于最小绝对偏差所构造的检验统计量的渐近分布 。
关键词 局部备择假设 线性假设检验 删失回归模型 渐近分布
下载PDF
不均衡数据情形的基于聚焦损失的CGAN的集成分类方法
15
作者 崔文泉 余厚莹 侯晓天 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第7期968-976,共9页
针对非均衡数据的情形,基于条件生成对抗网络(conditional generative adversarial networks,CGAN),利用梯度提升树研究了聚焦损失的CGAN的集成分类方法.该方法首先通过CGAN降低不均衡率,通过聚焦损失的权值均衡结合GBDT算法,适当增加... 针对非均衡数据的情形,基于条件生成对抗网络(conditional generative adversarial networks,CGAN),利用梯度提升树研究了聚焦损失的CGAN的集成分类方法.该方法首先通过CGAN降低不均衡率,通过聚焦损失的权值均衡结合GBDT算法,适当增加对少数类样本的关注度进而进一步提升分类器的分类性能.对方法的性质进行了研究,获得了若干理论成果.证明了:在一定条件下,由CGAN产生的经验条件分布收敛于相应总体的条件分布;聚集损失的CGAN方法其经验风险收敛到期望风险;该方法的估计量会收敛到使得期望风险最小化的函数.实验结果显示了聚焦损失的CGAN方法具有良好的表现. 展开更多
关键词 非均衡数据 条件生成对抗网络 聚焦损失 集成学习
下载PDF
一种基于核随机投影的集成分类方法
16
作者 崔文泉 张枫 徐建军 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第7期950-958,共9页
提出一种基于再生核随机投影的集成分类方法,该方法将原始数据投影到特征空间上,利用表示定理和核技巧转化为使用随机投影对Gram矩阵降维,然后利用集成学习方法构造集成分类器.利用随机的线性映射进行降维,再利用核技巧发展了核随机投... 提出一种基于再生核随机投影的集成分类方法,该方法将原始数据投影到特征空间上,利用表示定理和核技巧转化为使用随机投影对Gram矩阵降维,然后利用集成学习方法构造集成分类器.利用随机的线性映射进行降维,再利用核技巧发展了核随机投影方法.还证明了核随机投影的集成学习方法泛化误差的极限性质,得到了在一定条件下的关于泛化误差的收敛速度性质.模拟研究和实证分析的结果表明该方法相较于一些常用方法具有更好的表现. 展开更多
关键词 随机投影 核技巧 集成学习
下载PDF
求非线性最小二乘估计的一种算法
17
作者 崔文泉 《预测》 CSSCI 1997年第5期63-65,共3页
本文利用正交表给出一种求非线性LSE良参数初始值的算法—正交搜索法,进而与迭代法结合求解非线性LSE,通过求解非线性强度大模型的非线性LSE,说明新算法使用灵活。
关键词 非线性回归模型 最小二乘估计 正交搜索法
下载PDF
对D—最优设计DETMAX算法的数据存贮处理
18
作者 崔文泉 任胜天 《生产率系统》 1997年第2期65-67,共3页
关键词 D-最优设计 DETMAX算法 最优设计 数据处理
下载PDF
基于极径法球径测量的测量点布局设计 被引量:2
19
作者 赵前程 邓善熙 崔文泉 《计量学报》 CSCD 北大核心 2002年第1期21-25,共5页
本文给出基于极径法球径测量的加权最小二乘估计模型 ,并依据该模型进行球面上测量采样点布局的优化设计。最后 。
关键词 球径测量 加权最小二乘估计 极经法 测量点 布局设计 球形零件 数据处理模型
下载PDF
极径法球面测量的加权 最小二乘估计和布点设计 被引量:3
20
作者 赵前程 邓善熙 +1 位作者 王会生 崔文泉 《制造业自动化》 2000年第10期18-20,共3页
本文给出了基于极径法球面测量的加权最小二乘估计模型,并依据该模型进行测量采样点布局的优化设计。最后,对模型和布点设计进行了统计数据仿真测试。
关键词 球面测量 加权最小二乘估计 布点设计
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部