期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
结合自助抽样的动态数据流贝叶斯分类算法 被引量:3
1
作者 琚春华 殷贤君 许翀寰 《计算机工程与应用》 CSCD 北大核心 2011年第8期118-121,142,共5页
动态数据流具有数据量大、变化快、随机存取代价高、详细数据难以存储等特点,挖掘动态数据流对计算能力与存储能力要求非常高。针对动态数据流的以上特点,设计了一种基于自助抽样的动态数据流贝叶斯分类算法,算法运用滑动窗口模型对动... 动态数据流具有数据量大、变化快、随机存取代价高、详细数据难以存储等特点,挖掘动态数据流对计算能力与存储能力要求非常高。针对动态数据流的以上特点,设计了一种基于自助抽样的动态数据流贝叶斯分类算法,算法运用滑动窗口模型对动态数据流进行处理分析。该模型以每个窗口的数据为基本单位,对窗口内的数据进行处理分析;算法采用自助抽样技术对待分类数据中的属性进行裁剪和优化,解决了数据属性间的多重线性相关问题;算法结合贝叶斯算法的特点,采用动态增量存储树来解决动态样本数据流的存储问题,实现了无限动态数据流无信息失真的静态有限存储,解决了动态数据流挖掘最大的难题——数据存储;对优化的待分类数据使用all-贝叶斯分类器和k-贝叶斯分类器进行分类,结合数据流的特性对两个分类器进行实时更新。该算法有效克服了贝叶斯分类属性独立性的约束和传统贝叶斯只对静态数据分类的缺点,克服了动态数据流最大的难题——数据存储问题。通过实验测试证明,基于自助抽样的贝叶斯分类具有很高的时效性和精确性。 展开更多
关键词 数据流 自助抽样 贝叶斯分类 滑动窗口 增量存储树
下载PDF
我国沿海城市海洋经济效率的测度及其影响因素分析——基于两阶段双重自助抽样DEA方法 被引量:9
2
作者 朱新颜 刘健 刘伟 《海洋经济》 2019年第5期44-52,共9页
由于传统DEA方法在对决策单元的效率评价及效率影响因素的分析上存在缺陷,本文运用基于自助抽样的DEA方法,利用我国12个主要沿海城市的相关数据,对它们的海洋经济效率值进行了测算,同时分析了影响沿海城市海洋经济效率的因素。研究发现... 由于传统DEA方法在对决策单元的效率评价及效率影响因素的分析上存在缺陷,本文运用基于自助抽样的DEA方法,利用我国12个主要沿海城市的相关数据,对它们的海洋经济效率值进行了测算,同时分析了影响沿海城市海洋经济效率的因素。研究发现,经济愈发达的沿海城市其海洋经济效率未必更高,但海洋经济发展水平对沿海城市海洋经济效率具有正向影响。同时,外贸依存度高的沿海城市海洋经济效率实际更低,表明其海洋资源可能存在过度开发的问题。此外,加强沿海城市的环境保护力度、改善环境治理有助于海洋经济效率的提升。 展开更多
关键词 沿海城市 海洋经济效率 两阶段DEA 自助抽样
下载PDF
基于自助抽样法的结构方程模型在OSCE评价中的运用 被引量:1
3
作者 黄晓晴 姚晓旋 +4 位作者 陈如茵 张裕锋 郑淳锶 郑少燕 郭貔 《医学教育研究与实践》 2020年第2期358-361,共4页
目的定性描述客观结构化临床考试(Objective Structured Clinical Examination,OSCE)所测评的能力维度。方法以汕头大学医学院2012级考生毕业OSCE考试成绩为例,应用探索性因子分析、基于Bootstrap自助抽样法的验证性因子分析,构建结构... 目的定性描述客观结构化临床考试(Objective Structured Clinical Examination,OSCE)所测评的能力维度。方法以汕头大学医学院2012级考生毕业OSCE考试成绩为例,应用探索性因子分析、基于Bootstrap自助抽样法的验证性因子分析,构建结构方程并进行检验。结果建立“临床基础操作能力”“沟通与表达技巧”及“临床思维及应急能力”三因素模型且拟合结果较佳。结论汕头大学医学院毕业OSCE所测评的能力维度符合岗位胜任力要求;结构方程模型能较好展现OSCE在多维度能力评价上的优势,并对以岗位胜任力为核心的人才培养模式与评价体系的完善具有积极意义。 展开更多
关键词 客观结构化临床考试 结构方程模型 自助抽样 医学教育
下载PDF
基于自助法仿真的不确定度抽样反分析方法研究 被引量:2
4
作者 祖先锋 毛健人 蒋志文 《计算机应用与软件》 CSCD 2011年第6期215-217,256,共4页
针对测量链中激励源信号不确定度评定难的问题,借助于反分析思想和蒙特卡洛仿真分布传播原理,提出了不确定度分布抽样反分析法。通过Bootstrap自助法再抽样扩展样本容量,结合小样本容量的概率密度函数估计及其不确定度计算,由输出量仿... 针对测量链中激励源信号不确定度评定难的问题,借助于反分析思想和蒙特卡洛仿真分布传播原理,提出了不确定度分布抽样反分析法。通过Bootstrap自助法再抽样扩展样本容量,结合小样本容量的概率密度函数估计及其不确定度计算,由输出量仿真出输入量概率分布,实现了蒙特卡洛仿真分布传播的逆向过程,间接完成由测试信号到源信号的不确定度评定。实验与仿真结果表明,由反分析法所得不确定度参数与实际检定结果接近,从而验证了不确定度分布抽样反分析法的有效性和可行性。 展开更多
关键词 测量不确定度 反分析法 自助法再抽样 蒙特卡洛仿真
下载PDF
依据多种抽样技术对二类调查蓄积量精度控制及比较 被引量:1
5
作者 王博一 刘兆刚 +1 位作者 颜俊峰 彭湘玲 《东北林业大学学报》 CAS CSCD 北大核心 2022年第2期23-28,共6页
森林资源总蓄积量和平均每公顷蓄积量估计是森林资源二类调查的主要内容。为了准确反映森林资源二类小班调查的精度,通常采用不同抽样方式布设固定样地,样地数量要满足抽样控制精度要求,通过总体抽样调查方法获取的蓄积量与小班调查计... 森林资源总蓄积量和平均每公顷蓄积量估计是森林资源二类调查的主要内容。为了准确反映森林资源二类小班调查的精度,通常采用不同抽样方式布设固定样地,样地数量要满足抽样控制精度要求,通过总体抽样调查方法获取的蓄积量与小班调查计算的蓄积量进行比较以实现二类小班调查蓄积量精度控制。以东北林业大学帽儿山实验林场为研究区域,2016年帽儿山实验林场森林资源二类小班调查数据和布设在实验林场的256块固定样地数据,采用系统抽样、事后分层抽样和自助法抽样技术进行小班调查蓄积量总体精度控制,并比较几种不同抽样方法的精度和特点。结果表明:有林地小班总蓄积为3263235.87 m^(3),系统抽样估测有林地总蓄积为3991105.77 m^(3)。事后分层抽样按照龄组、林型、郁闭度估测有林地总蓄积分别为3899872.16、4036672.73、3988058.20 m^(3)。自助法抽样在N=20时有林地总蓄积估计值为3948893.46 m^(3)。结果均超出3倍标准误,初次小班调查不符合调查标准要求,应当重新调查小班,直到符合标准为止。在研究区范围内,事后分层抽样按龄组、林型、郁闭度划分理论精度分别为95.9%、94.7%、94.7%,系统抽样理论精度94.5%,两种方法抽样精度接近,对事后分层抽样而言,按龄组林型划分更合理,精度更高。自助法抽样自助样本为20时理论精度是86.5%,在抽样精度要求不高时,可以先抽样再调查,减少调查样地数,节省人力物力。 展开更多
关键词 二类调查 系统抽样 事后分层抽样 自助抽样 精度
下载PDF
近25a气候变化对江苏省粮食产量的影响 被引量:17
6
作者 潘敖大 曹颖 +1 位作者 陈海山 孙善磊 《大气科学学报》 CSCD 北大核心 2013年第2期217-228,共12页
利用1986—2010年江苏省63个气象站的常规气象数据和粮食单产统计资料,分析了苏北、苏中、苏南地区和江苏全省三种时间尺度的气候变化特征;基于自助抽样(bootstrap)和一元线性回归的方法,研究了各区和全省粮食产量对作物年(11月—次年10... 利用1986—2010年江苏省63个气象站的常规气象数据和粮食单产统计资料,分析了苏北、苏中、苏南地区和江苏全省三种时间尺度的气候变化特征;基于自助抽样(bootstrap)和一元线性回归的方法,研究了各区和全省粮食产量对作物年(11月—次年10月)、夏粮—秋粮生长季(11月—次年5月和6—10月)和月尺度气候要素的响应;并定量评价了过去25a气候变化对各区和全省粮食产量的影响以及各气候要素的贡献。结果表明:1)在作物年、夏粮—秋粮生长季以及月尺度上,三区和全省各气候要素均发生了不同程度的变化,且存在一定的时空差异。在不断发展的农业管理措施和技术以及气候的共同作用下,三区和全省粮食单产显著(p>0.01)增加,其中,全省增加趋势为66.89kg·hm-2·a-1。2)除苏南地区对作物年尺度上的气候变化响应不显著外,粮食产量对降水的不随时间变化的负响应关系(即随降水的增加而减小,减小而增加)均在不同时间尺度和地区得到了体现,说明降水对这些地区粮食生产的影响十分重要;其中,苏北、苏中和全省粮食产量随作物年降水的增加(减少)而减小(增加),平均速率分别为0.19%·(10mm)-1、0.09%·(10mm)-1和0.11%·(10mm)-1。3)三类模型结果均显示气候变化使得苏北、苏南和江苏粮食产量减小,但结果略有差异,其中,利用月气候要素建立的模型C的结果显示气候变化对粮食单产(总产)的影响最大,其均值分别为-6.51%·(10a)-1(-11.28×108kg·(10a)-1)、-3.27%·(10a)-1(-2.36×108kg·(10a)-1)和-1.34%·(10a)-1(-4.45×108kg·(10a)-1)。另外,为了系统而全面地评估气候变化对粮食产量的影响,考虑月尺度的气候变化的影响是十分必要的。 展开更多
关键词 气候变化 粮食产量 自助抽样方法 江苏省
下载PDF
基于Copula方法的干旱历时和烈度的联合概率分析 被引量:21
7
作者 许月萍 张庆庆 +1 位作者 楼章华 刘德地 《天津大学学报》 EI CAS CSCD 北大核心 2010年第10期928-932,共5页
采用自回归马尔可夫模型来延长干旱数据,以解决干旱数据短缺的问题,在此基础上获取长序列干旱数据;应用Copula方法模拟干旱历时和干旱烈度之间的相依关系,并用自助抽样法检验Copula函数的拟合效果;最后得出边际分布分别为皮尔逊Ⅲ型和... 采用自回归马尔可夫模型来延长干旱数据,以解决干旱数据短缺的问题,在此基础上获取长序列干旱数据;应用Copula方法模拟干旱历时和干旱烈度之间的相依关系,并用自助抽样法检验Copula函数的拟合效果;最后得出边际分布分别为皮尔逊Ⅲ型和伽马函数的两元联合分布,并计算干旱历时和干旱烈度的联合分布概率.模拟结果表明,Clayton Copula能较好地模拟两变量之间的相依关系.根据Copula联结函数来模拟水文干旱极限事件,可考虑水文干旱极限事件不同变量之间的相依性,方法简单合理,可成为水文干旱极限分析的一个有效工具. 展开更多
关键词 自助抽样 自回归马尔可夫模型 COPULA方法 干旱极限分析
下载PDF
抑郁在青少年核心自我评价与自杀意念间的中介作用:基于Bootstrap法和MCMC法的实证研究 被引量:14
8
作者 马泽威 全鹏 《心理科学》 CSSCI CSCD 北大核心 2015年第2期379-382,共4页
考察抑郁在青少年核心自我评价与自杀意念间的中介作用。对502名高中生进行量表测评。通过偏差校正的Bootstrap法和有先验信息的MCMC法求出中介效应值的95%置信区间分别为[-.030,-.011]和[-.024,-.014],提示抑郁的中介效应显著。效应量k... 考察抑郁在青少年核心自我评价与自杀意念间的中介作用。对502名高中生进行量表测评。通过偏差校正的Bootstrap法和有先验信息的MCMC法求出中介效应值的95%置信区间分别为[-.030,-.011]和[-.024,-.014],提示抑郁的中介效应显著。效应量k2、R2med分别为.124、.104,偏差校正的Bootstrap法抽样5000次后,构建的效应量的95%置信区间分别为[.070,.178]、[.063,.156],两种指标共同验证效应量为中等。研究结果说明抑郁在核心自我评价与自杀意念间起部分中介作用,效应量中等。 展开更多
关键词 抑郁 核心自我评价 自杀意念 自助抽样 马尔科夫链的蒙特卡洛法
下载PDF
空间溢出视角下环境规制对城市绿色生产率的影响——基于共同前沿稳健生产率的实证检验 被引量:7
9
作者 杨冕 徐江川 杨福霞 《统计研究》 CSSCI 北大核心 2022年第9期29-45,共17页
为统筹解决绿色生产率估算过程中存在的生产技术异质性、随机因素干扰以及潜在内生性等问题,本文将自助抽样法(Bootstrap)引入参数共同前沿分析框架,建立了一个准确评估绿色生产率的稳健方法,并依此考察2003—2016年我国城市层面绿色生... 为统筹解决绿色生产率估算过程中存在的生产技术异质性、随机因素干扰以及潜在内生性等问题,本文将自助抽样法(Bootstrap)引入参数共同前沿分析框架,建立了一个准确评估绿色生产率的稳健方法,并依此考察2003—2016年我国城市层面绿色生产率的时空演化特征。在此基础上,采用空间自滞后(SLX)模型,并通过引入空气流通系数这一工具变量解决模型设定的内生性问题,对环境规制与绿色生产率之间的空间因果关系进行了科学识别。结果显示,经自助抽样法修正后的稳健绿色生产率在样本期限内呈现逐年上升趋势,其年均增长率为6.21%,这一数值要高于修正前的测算结果;从地区层面来看,绝大部分城市的绿色生产率排名在经自助抽样法修正后都发生了一定程度的变动,尤其是处于中间名次的城市排名变动更为明显。其次,空间回归结果显示,环境规制增强在显著促进本地区绿色生产率提升的同时,也会对相邻城市的绿色生产率产生一定的抑制作用,这意味着环境规制除了在本地区产生“波特效应”之外,也引发了空间上的“污染避难所效应”;但从净效应来看,环境规制增强总体上能够促进城市绿色生产率的提升。 展开更多
关键词 环境规制 绿色生产率 共同前沿 自助抽样 空间溢出效应
下载PDF
基于回归问题的选择性集成算法 被引量:2
10
作者 陈凯 《计算机工程》 CAS CSCD 北大核心 2009年第21期17-19,共3页
提出一种应用于回归问题,以分类回归树为基学习器,并综合Boosting和Bagging算法的特点,利用变相似度聚类技术和贪婪算法来进行选择性集成学习的算法——SER-BagBoosting Trees算法。将其与几种常用的机器学习算法进行比较研究,得出该算... 提出一种应用于回归问题,以分类回归树为基学习器,并综合Boosting和Bagging算法的特点,利用变相似度聚类技术和贪婪算法来进行选择性集成学习的算法——SER-BagBoosting Trees算法。将其与几种常用的机器学习算法进行比较研究,得出该算法往往比其他集成学习算法具有更好的泛化性能和更高的运行效率。 展开更多
关键词 分类回归树 自助抽样 选择性集成
下载PDF
有序参数的一类AIC型信息准则(英文)
11
作者 陈冬 《南开大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第3期63-69,共7页
给出一种基于Akaike信息量准则(AIC)原理的参数估计方法.该方法给出了具有有序分布参数的正态分布的一种AIC偏差修正项的精确无偏估计量;且兼有自助抽样的功能得到了开发.
关键词 Akaike信息量准则(AIC) 自助抽样 参数估计
下载PDF
一种处理不平衡大数据的并行随机森林算法 被引量:8
12
作者 秦静 钱雪忠 +2 位作者 王卫涛 谢国伟 宋威 《微电子学与计算机》 CSCD 北大核心 2017年第4期22-27,共6页
基于MapReduce机制的并行随机森林算法MR_RF在处理不平衡大数据时,由于数据本身正类密度低且算法又以全局最优标准选择分割点,而导致正类有误分为负类的趋势,降低了分类效率.本文提出了一种改进的并行随机森林算法(SBWMR_RF),该算法利... 基于MapReduce机制的并行随机森林算法MR_RF在处理不平衡大数据时,由于数据本身正类密度低且算法又以全局最优标准选择分割点,而导致正类有误分为负类的趋势,降低了分类效率.本文提出了一种改进的并行随机森林算法(SBWMR_RF),该算法利用分层自助抽样方法增大对少数类的抽样数量,同时考虑正负类不同的误分代价,动态计算每个分区的代价敏感矩阵,将其引入到构建基分类器的关键步骤,弱化数据偏置的影响.实验证明SBWMR_RF算法提高了对不平衡大数据的分类准确率,没有出现过拟合现象,在极不平衡环境下优势明显. 展开更多
关键词 不平衡大数据 MAPREDUCE 随机森林 代价敏感 分层自助抽样
下载PDF
企业碳标签食品生产的决策行为研究 被引量:21
13
作者 吴林海 赵丹 +1 位作者 王晓莉 徐立青 《中国软科学》 CSSCI 北大核心 2011年第6期87-99,共13页
本文以食品生产企业为例,构建了生产企业碳标签食品生产的决策行为模型,应用Bootstrap自助抽样法下的结构方程模型研究了影响食品生产企业碳标签食品生产决策行为的主要因素。研究表明,企业规模特征、主观规范、过去行为等是主要影响因... 本文以食品生产企业为例,构建了生产企业碳标签食品生产的决策行为模型,应用Bootstrap自助抽样法下的结构方程模型研究了影响食品生产企业碳标签食品生产决策行为的主要因素。研究表明,企业规模特征、主观规范、过去行为等是主要影响因素,且企业规模特征与知觉行为控制、主观规范与知觉行为控制间具有明显的交互作用。 展开更多
关键词 碳标签食品 生产企业 决策行为 影响因素 结构方程模型 Bootstrap自助抽样
下载PDF
一种基于宏基因组模拟数据的生物标志物筛选方法 被引量:2
14
作者 王晓君 滕琳 《江苏农业科学》 北大核心 2016年第5期56-59,共4页
鉴于生物圈中微生物资源的巨大开发潜力以及测序技术不断发展,宏基因组学研究的不断深入,微生物群落已经被看作一个整体来进行分析并且已经得到广泛应用。然而由于微生物的多样性以及微生物菌群的复杂性,使得精确确定和定量宏基因组数... 鉴于生物圈中微生物资源的巨大开发潜力以及测序技术不断发展,宏基因组学研究的不断深入,微生物群落已经被看作一个整体来进行分析并且已经得到广泛应用。然而由于微生物的多样性以及微生物菌群的复杂性,使得精确确定和定量宏基因组数据中的分类单元成为宏基因组数据分析的难点。已有的宏基因组数据标记分析工具无法解决微生物群落预测结果重现的稳健性、准确性以及处理非冗余标记物方面遇到的问题。笔者提出了一个新的基于宏基因组自助抽样(metagenomic bootstrap)的生物标志物选择方法,它结合了mRMR(minimal redundancy maximal relevance)和自助抽样方法(bootstrapping),可以更加稳健、准确而有效地通过对宏基因组数据的挖掘实现非冗余标记物的筛选。基于模拟数据集,通过其与2种自上而下的方法(Metastats、LEf Se)以及自下而上的方法(Wilcoxon秩和检验)进行对比,表明本方法可以在较高准确率的基础上更加稳健地选择更多的非冗余生物标志物。 展开更多
关键词 宏基因组 生物标志物 mRMR 自助抽样
下载PDF
基于区间分析的WSNs定位算法 被引量:1
15
作者 方余丞 王洪诚 +2 位作者 崔胜利 何俊儒 朱骏 《传感器与微系统》 CSCD 2016年第4期141-143,147,共4页
为了降低接收信号强度指示(RSSI)的测量误差对节点定位精度的影响并提高算法的鲁棒性,提出一种新的基于区间分析的无线传感器网络(WSNs)定位算法。该算法在测距阶段运用自助抽样法消除RSSI的测量误差并构建测距的置信区间;在定位阶段,结... 为了降低接收信号强度指示(RSSI)的测量误差对节点定位精度的影响并提高算法的鲁棒性,提出一种新的基于区间分析的无线传感器网络(WSNs)定位算法。该算法在测距阶段运用自助抽样法消除RSSI的测量误差并构建测距的置信区间;在定位阶段,结合B-box定位法和集员辨识求出未知节点位置坐标的可行解集,通过网格扫描得到未知节点的估算位置。该算法通过仿真分析验证了可行性,并与传统的定位算法进行了误差比较,实验结果表明:该算法具有更高的定位精度且鲁棒性更好。 展开更多
关键词 无线传感器网络 定位算法 接收信号强度指示 自助抽样 置信区间 集员辨识
下载PDF
中国基尼系数警戒线的一个估计 被引量:69
16
作者 徐映梅 张学新 《统计研究》 CSSCI 北大核心 2011年第1期80-83,共4页
本文基于1978-2007年我国居民收入分配的分组数据测算了多个基尼系数,采用参数和非参数多种方法估计了基尼系数的分布服从渐近正态分布,最后基于大样本渐近特征给出了我国基尼系数警戒水平的估计值。
关键词 基尼系数 分布检验 重复抽样自助 警戒水平
下载PDF
基于特征变换的Tri-Training算法
17
作者 赵文亮 郭华平 范明 《计算机工程》 CAS CSCD 2014年第5期183-187,191,共6页
提出一种基于特征变换的Tri Training算法。通过特征变换将已标记实例集映射到新空间,得到有差异的训练集,从而构建准确又存在差异的基分类器,避免自助采样不能充分利用全部已标记实例集的问题。为充分利用数据类分布信息,设计基于Must ... 提出一种基于特征变换的Tri Training算法。通过特征变换将已标记实例集映射到新空间,得到有差异的训练集,从而构建准确又存在差异的基分类器,避免自助采样不能充分利用全部已标记实例集的问题。为充分利用数据类分布信息,设计基于Must link和Cannot link约束集合的特征变换方法(TMC),并将其用于基于特征变换的Tri Training算法中。在UCI数据集上的实验结果表明,在不同未标记率下,与经典的Co Training、Tri Trainng算法相比,基于特征变换的Tri Training算法可在多数数据集上得到更高的准确率。此外,与Tri LDA和Tri CP算法相比,基于TMC的Tri Training算法具有更好的泛化性能。 展开更多
关键词 特征变换 已标记实例集 差异 自助抽样 泛化能力
下载PDF
岩土试验数据统计不确定性的量化与分析 被引量:3
18
作者 赵腾龙 赵晓妍 《公路工程》 北大核心 2018年第4期283-286,共4页
文章介绍了自助抽样法的基本步骤并以工程实例说明了基于少量岩土数据所得平均值、方差的不准确性,并简单有效的量化上述的不确定性,这对相关岩土设计分析的可靠程度的评价上有很大帮助。
关键词 自助抽样 统计不确定性 岩土勘察 不确定性的量化
下载PDF
基于气相色谱-质谱的尿液代谢组学技术结合化学计量学用于戊二酸血症Ⅰ型早期检测研究
19
作者 肖雯 牛芊芊 +2 位作者 孙智勇 杨琴 吴本清 《分析测试学报》 CAS CSCD 北大核心 2022年第11期1577-1583,共7页
采用气相色谱-质谱联用技术结合化学计量学,针对高维小样本的疾病代谢组学图谱建立高性能的戊二酸血症Ⅰ型(GA-Ⅰ)早期检测模型。基于偏最小二乘判别分析(PLS-DA)的共线性处理和数据解释优势,自助抽样法(Bootstrap)通过数据扰动方式集... 采用气相色谱-质谱联用技术结合化学计量学,针对高维小样本的疾病代谢组学图谱建立高性能的戊二酸血症Ⅰ型(GA-Ⅰ)早期检测模型。基于偏最小二乘判别分析(PLS-DA)的共线性处理和数据解释优势,自助抽样法(Bootstrap)通过数据扰动方式集成多个模型的变量选择能力,挑选出能够持续被筛选的变量实现稳健特征筛选(BS-PLSDA)。对于GA-Ⅰ的尿液代谢组学图谱,在两种逐步增大训练集之间样本差异的比例划分(7:3和6:4)下,载荷(LW)、变量投影重要性(VIP)、显著性多元相关(sMC)3种信息向量对应的BS-PLSDA均优于其单独PLS-DA建模的特征变量筛选稳健性。在样本划分比例为7:3时,BS-VIP-PLSDA的Kuncheva指数高达0.807 5。筛选出的稳健特征变量与文献报道的诊断指标一致,不仅真正解释组别间的差异与GA-Ⅰ的代谢机理密切相关,且BS-LW-PLSDA、BS-VIP-PLSDA和BS-sMC-PLSDA展示了良好的预测性能,受试者工作特征曲线下面积均值分别为0.773 9、0.854 8和0.847 1,马修斯相关系数均值分别为0.671 9、0.783 8和0.801 3。与支持向量机递归特征消除法(SVM-RFE)相比,在采用相同的集成特征选择策略下,尽管非线性径向基核函数对应的BS-RBF-SVMRFE可获得高建模性能,但数据解释能力较低。该研究提出的BS-PLSDA可兼顾建模性能和模型解释能力,符合实际临床需求,对GA-Ⅰ早期检测、辅助诊断和疾病机理研究具有很好的指导意义。 展开更多
关键词 戊二酸血症Ⅰ型 早期检测 气相色谱-质谱 偏最小二乘判别分析 自助抽样 稳健特征筛选
下载PDF
土体性质互相关性的估计以及不确定性的量化分析
20
作者 赵晓妍 赵腾龙 《路基工程》 2019年第3期84-87,共4页
土体参数如土体黏聚力、内摩擦角之间存在互相关性,这一特性对岩土设计分析具有重要意义。互相关性可以用互相关系数表征。准确的计算这一系数需要较多试验数据,而实际工程中岩土的试验数据较少。这就导致所得互相关系数的不确定性较大... 土体参数如土体黏聚力、内摩擦角之间存在互相关性,这一特性对岩土设计分析具有重要意义。互相关性可以用互相关系数表征。准确的计算这一系数需要较多试验数据,而实际工程中岩土的试验数据较少。这就导致所得互相关系数的不确定性较大。为此,介绍了如何用自助抽样法去量化这一不确定性,并以工程实例说明。 展开更多
关键词 土体参数 互相关性 统计推断 自助抽样 不确定性的量化
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部