期刊文献+
共找到275篇文章
< 1 2 14 >
每页显示 20 50 100
基于重抽样加权的飞行器多源数据融合方法
1
作者 崔榕峰 王祥云 +2 位作者 刘哲 李鸿岩 郭承鹏 《航空科学技术》 2024年第7期111-119,共9页
风洞试验方法和计算流体力学(CFD)数值模拟方法在飞行器的初步研制阶段能够对于飞行器的气动性能提供精准分析,其对于飞行器的气动外形优化与设计起到了重要的作用。而风洞试验与CFD方法不可避免地存在试验与计算成本较高等问题。为实... 风洞试验方法和计算流体力学(CFD)数值模拟方法在飞行器的初步研制阶段能够对于飞行器的气动性能提供精准分析,其对于飞行器的气动外形优化与设计起到了重要的作用。而风洞试验与CFD方法不可避免地存在试验与计算成本较高等问题。为实现对于飞行器气动性能的低成本及高效分析,本文对风洞试验数据进行了机器学习方法的预测分析研究,提出了一种基于多模型结合方法的数据融合模式,其原理是通过重复抽样的方法多次获取精度略低的CFD数据与精度较高的风洞试验数据之间的映射关系,并通过基于均方误差的加权方法对于多映射关系进行结合从而输出最终的预测结果。结果表明,基于重抽样加权法的数据融合模式可以有效提升风洞试验数据预测的精准度与拟合度,辅助支撑风洞试验人员进行相关研究工作。 展开更多
关键词 数据融合 抽样加权法 风洞试验 CFD 机器学习
下载PDF
Bootstrap重抽样法在《临床实验室管理学》教学评价中的应用 被引量:2
2
作者 崔明 鞠少卿 +2 位作者 许丽丽 施秀英 景蓉蓉 《检验医学与临床》 CAS 2019年第10期1454-1456,共3页
该研究探讨了Bootstrap重抽样法在《临床实验室管理学》教学评价中的应用。采用MATLAB软件,运用Bootstrap重抽样法105次可获得可靠结果。6种题型中,简答题相对得分率最高,为82.87%;多项选择题相对得分率最低,为40.00%。所授的17个章节中... 该研究探讨了Bootstrap重抽样法在《临床实验室管理学》教学评价中的应用。采用MATLAB软件,运用Bootstrap重抽样法105次可获得可靠结果。6种题型中,简答题相对得分率最高,为82.87%;多项选择题相对得分率最低,为40.00%。所授的17个章节中,"床旁检测的质量管理"章节相对得分率最高,为97.00%;"检验前过程质量管理"章节相对得分率最低,为40.00%。Bootstrap法在不增加新样本的情况下,通过有放回的重抽样增加学生考试成绩数据,使已知样本更接近总体,可运用于《临床实验室管理学》的教学评价。 展开更多
关键词 临床实验室管理学 bootstrap抽样 教学评价
下载PDF
基于二重抽样的权数调整研究
3
作者 王小宁 《统计与决策》 北大核心 2023年第19期41-46,共6页
样本量的确定和分配是抽样设计中的一个重要内容,确定样本量不仅需要综合考虑费用与精度的关系,还需要考虑其所采用的抽样方式。文章采用二重抽样对调查产生的缺失数据进行集中处理,通过对这部分不完整的信息进行有效利用,能够在一定程... 样本量的确定和分配是抽样设计中的一个重要内容,确定样本量不仅需要综合考虑费用与精度的关系,还需要考虑其所采用的抽样方式。文章采用二重抽样对调查产生的缺失数据进行集中处理,通过对这部分不完整的信息进行有效利用,能够在一定程度上提高调查的精度,并比较了采用二重抽样和不采用二重抽样情况下估计量的标准差,论证了权数的调整方法的有效性,推导出了实际目标估计量的计算公式。在地级市(自治州)层面上,基于与城乡和年龄有关的辅助变量,提出采用迭代法和事后分层相结合的方法,对城乡和不同年龄段样本的权数进行调整,使样本结构与总体结构一致。 展开更多
关键词 分层抽样 抽样 样本量 权数调整
下载PDF
经验似然重抽样下回归模型的Bootstrap逼近(英文) 被引量:1
4
作者 石坚 《应用概率统计》 CSCD 北大核心 1997年第1期37-44,共8页
本文提出用经验似然重抽样来bootstrap逼近线性回归模型中的学生化最小二乘估计.我们证明了该方法具有一般s-2项Edgeworth展开,它是二阶相合的而且比经典的方法损失更小.
关键词 经验似然抽样 回归模型 bootstrap逼近
下载PDF
基于改进Ratio统计量的重尾AR(p)时间序列均值变点检验
5
作者 张思 刘叶 金浩 《统计与决策》 北大核心 2024年第2期52-57,共6页
文章提出两个改进的Ratio统计量来研究重尾AR(p)时间序列均值变点检验问题,在原假设下推导了统计量的渐近分布,且在备择假设下证明了其一致性。由于重尾指数未知且难以估计,因此结合Wild Bootstrap重抽样方法来确定渐近分布的临界值;在... 文章提出两个改进的Ratio统计量来研究重尾AR(p)时间序列均值变点检验问题,在原假设下推导了统计量的渐近分布,且在备择假设下证明了其一致性。由于重尾指数未知且难以估计,因此结合Wild Bootstrap重抽样方法来确定渐近分布的临界值;在均值变点存在的情形下,给出了变点位置的一致估计量。数值模拟结果表明:统计量的临界值均不受重尾指数和自回归系数的影响,其经验水平和经验势均取得满意的效果;尤其在原假设下,积分型Ratio统计量的经验水平表现出更好的稳健性,而在备择假设下,最值型Ratio统计量则具备更好的显著性。最后,基于一组股票数据,从实际应用角度进一步阐明所提方法的有效性和可行性。 展开更多
关键词 尾序列 Ratio统计量 均值变点 Wild bootstrap
下载PDF
基于M估计强混合重尾序列结构变点的鲁棒检验
6
作者 朱玲 金浩 乔宝明 《统计与决策》 北大核心 2024年第8期34-40,共7页
针对强混合重尾序列结构变点的检测问题,为避免因序列重尾性导致最小二乘估计产生偏差,文章提出了基于M估计的比值型检验统计量,用于检测重尾序列位置结构变点。在一般约束条件下证明了原假设下统计量的极限分布是布朗运动的泛函,并得... 针对强混合重尾序列结构变点的检测问题,为避免因序列重尾性导致最小二乘估计产生偏差,文章提出了基于M估计的比值型检验统计量,用于检测重尾序列位置结构变点。在一般约束条件下证明了原假设下统计量的极限分布是布朗运动的泛函,并得到备择假设下的一致性。针对因序列相依性导致的经验水平扭曲现象,采用Block Bootstrap抽样方法获得了更为准确的临界值,有效提高了检验功效。数值模拟结果显示,在Block Bootstrap抽样方法下基于M估计的比值型检验在强混合重尾序列结构变点检测中能较好地控制经验水平,经验势也较合理。最后,通过一组汇率数据验证了所提检验方法的可行性。 展开更多
关键词 结构变点 比值型检验 Block bootstrap M估计
下载PDF
Bootstrap样本大数据模型和分布式集成学习方法 被引量:1
7
作者 罗凯靖 张育铭 +1 位作者 何玉林 黄哲学 《大数据》 2024年第3期93-108,共16页
传统Bootstrap抽样和Bagging集成学习通常以串行方式实现,计算效率低,且存在样本不可重用、扩展性差等问题,不适合高效的大规模Bagging集成学习。从大数据分布式计算的思维入手,提出新的Bootstrap样本划分(BSP)大数据模型和分布式集成... 传统Bootstrap抽样和Bagging集成学习通常以串行方式实现,计算效率低,且存在样本不可重用、扩展性差等问题,不适合高效的大规模Bagging集成学习。从大数据分布式计算的思维入手,提出新的Bootstrap样本划分(BSP)大数据模型和分布式集成学习方法。BSP数据模型通过分布式生成算法将训练数据表达成分布式Bootstrap样本集的集合,存储成HDFS分布式数据文件,为后续的分布式集成学习提供数据支持。分布式集成学习方法从BSP数据模型中随机选取多个BSP数据块,读入集群各个节点的虚拟机,用串行算法对选取的数据块并行计算统计量或训练建模,再将所有的计算子结果回传至主节点中,生成最终的集成学习结果,此过程中可加入对子结果的质量选择以进一步提高预测效果。BSP数据模型的生成和分布式集成学习采用非Map-Reduce计算范式进行,每个数据块的计算独立完成,减少了计算节点间的数据通信开销。提出的算法在Spark开源系统中以新的算子方式实现,供Spark应用程序调用。实验表明,新方法可以高效地生成训练数据的BSP数据模型,提高数据样本的可重用性,在基于有监督机器学习算法构建的大规模Bagging集成学习实验中,计算效率能提高50%以上,同时预测精度进一步提高约2%。 展开更多
关键词 bootstrap抽样 Bagging集成学习 分布式集成学习 SPARK
下载PDF
二重抽样对提高辅助信息质量分析
8
作者 杨国天 《中文科技期刊数据库(全文版)经济管理》 2023年第4期8-11,共4页
本研究旨在分析二重抽样方法对提高辅助信息质量分析的影响。通过比较简单随机抽样模型和二重抽样模型,我们发现二重抽样模型在估计总体参数方面具有较高的精度和稳定性,这主要归功于其充分利用辅助信息。在实际应用中,二重抽样方法具... 本研究旨在分析二重抽样方法对提高辅助信息质量分析的影响。通过比较简单随机抽样模型和二重抽样模型,我们发现二重抽样模型在估计总体参数方面具有较高的精度和稳定性,这主要归功于其充分利用辅助信息。在实际应用中,二重抽样方法具有较强的通用性和一定的可行性,尤其适用于资源有限的情境。然而,二重抽样方法也存在一定的局限性,如实施过程较复杂、需要研究者具备专业知识等。因此,在实际应用中,需要充分考虑二重抽样方法的可行性和局限性。未来研究可进一步探讨如何优化二重抽样方法,以便更有效地应用于不同领域的抽样调查。 展开更多
关键词 抽样 辅助信息 统计模型 质量分析
下载PDF
面向类不平衡数据集的重采样方法影响研究
9
作者 丁浩杰 《现代计算机》 2024年第14期36-40,共5页
为了评估重采样方法对类不平衡数据集的影响,对被广泛使用的美国威斯康星州的乳腺癌诊断数据集进行研究,基于逻辑斯特回归、支持向量机、随机森林等三种机器学习算法进行实验,对随机上采样抽样、随机下采样抽样、SMOTE以及ADASYN四种重... 为了评估重采样方法对类不平衡数据集的影响,对被广泛使用的美国威斯康星州的乳腺癌诊断数据集进行研究,基于逻辑斯特回归、支持向量机、随机森林等三种机器学习算法进行实验,对随机上采样抽样、随机下采样抽样、SMOTE以及ADASYN四种重采样方法使用F1值和AUC值进行了分析。实验结果表明,四种重采样方法均可以提升模型性能,其中随机下采样抽样在处理类不平衡数据集时被证明更加有效。 展开更多
关键词 采样方法 随机下采样抽样 支持向量机 逻辑斯特回归 随机森林
下载PDF
基于样本权重的不平衡数据欠抽样方法 被引量:43
10
作者 熊冰妍 王国胤 邓维斌 《计算机研究与发展》 EI CSCD 北大核心 2016年第11期2613-2622,共10页
现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此... 现实世界中广泛存在不平衡数据,其分类问题是数据挖掘和机器学习的一个研究热点.欠抽样是处理不平衡数据集的一种常用方法,其主要思想是选取多数类样本中的一个子集,使数据集的样本分布达到平衡,但其容易忽略多数类中部分有用信息.为此提出了一种基于样本权重的欠抽样方法KAcBag(K-means AdaCost bagging),该方法引入了样本权重来反映样本所处的区域,首先根据各类样本的数量初始化各样本权重,并通过多次聚类对各个样本的权重进行修改,权重小的多数类样本即处于多数类的中心区域;然后按权重大小对多数类样本进行欠抽样,使位于中心区域的样本较容易被抽中,并与所有少数类样本组成bagging成员分类器的训练数据,得到若干个决策树子分类器;最后根据各子分类器的正确率进行加权投票生成预测模型.对19组UCI数据集和某电信运营商客户换机数据进行了测试实验,实验结果表明:KAcBag方法使抽样所得的样本具有较强的代表性,能有效提高少数类的分类性能并缩小问题规模. 展开更多
关键词 不平衡数据 抽样 样本权 聚类 集成学习
下载PDF
数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法 被引量:4
11
作者 谢佳斌 金勇进 谢邦昌 《统计研究》 CSSCI 北大核心 2009年第4期101-104,共4页
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略... 在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。 展开更多
关键词 调查数据 抽样 数据挖掘 PPWWR再抽样
下载PDF
重抽样优化的快速随机抽样一致性算法 被引量:12
12
作者 肖春宝 冯大政 冯祥卫 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第4期607-614,共8页
为了快速、准确地对含有高比例外点的数据进行模型参数估计,提出一种重抽样优化的快速RANSAC算法.首先在模型检验之前增设预检验,并采用一种基于样条曲线的损失函数来评价模型的质量;然后通过反复重抽样和模型检验来优化内点集;再依据... 为了快速、准确地对含有高比例外点的数据进行模型参数估计,提出一种重抽样优化的快速RANSAC算法.首先在模型检验之前增设预检验,并采用一种基于样条曲线的损失函数来评价模型的质量;然后通过反复重抽样和模型检验来优化内点集;再依据双阈值对内点集进行渐近提纯;最后利用最优内点集来计算模型的参数.特征匹配和基础矩阵估计的实验结果表明,该算法具有较高的精度和效率;当外点比例高于50%时,运行速度比传统算法提高大于2个数量级. 展开更多
关键词 参数估计 随机抽样-致性 抽样优化 模型预检验 损失函数
下载PDF
舍选抽样与采样重要性重抽样算法的比较 被引量:6
13
作者 王丙参 魏艳华 孙永辉 《统计与决策》 CSSCI 北大核心 2014年第21期9-13,共5页
文章比较研究了舍选法和重要性重抽样(SIR)算法生成随机数的理论基础,给出了二者的区别与联系,特别讨论了压挤舍选抽样和自适应舍选抽样,并给出了包络函数和重要性抽样函数的选择标准,探讨二者对随机数生成速度和质量的影响。
关键词 舍选法 要性抽样 接受概率 包络函数
下载PDF
基于三阶段Bootstrap EBM的异质性合作社效率评价研究:重庆例证 被引量:4
14
作者 杨丹 黄凤 刘自敏 《东北师大学报(哲学社会科学版)》 CSSCI 北大核心 2015年第6期73-81,共9页
基于对传统DEA模型距离函数特征、决策单元异质性及评价结果稳健性等方面的缺陷,构建三阶段Bootstrap EBM方法。利用重庆市合作社调查的随机抽样调查数据,分析了合作社所处的外部环境变量对各类投入值的不同影响,对比分析了基于EBM距离... 基于对传统DEA模型距离函数特征、决策单元异质性及评价结果稳健性等方面的缺陷,构建三阶段Bootstrap EBM方法。利用重庆市合作社调查的随机抽样调查数据,分析了合作社所处的外部环境变量对各类投入值的不同影响,对比分析了基于EBM距离函数的环境变量调整前后评价效率以及Bootstrap EBM调整前后的效率值及其置信区间的差异,并对比分析了不同类型合作社的效率值差异,最后基于更为准确与客观的效率评价值,有针对性地提出准确衡量及提高合作社效率的政策建议。 展开更多
关键词 异质性 合作社 EBM距离函数 三阶段DEA后一个 bootstrap抽样 置信区间
下载PDF
融合过抽样和欠抽样的不平衡数据重抽样方法 被引量:15
15
作者 吴磊 房斌 +2 位作者 刁丽萍 陈静 谢娜娜 《计算机工程与应用》 CSCD 2013年第21期172-176,185,共6页
在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多... 在机器学习领域的研究当中,分类器的性能会受到许多方面的影响,其中训练数据的不平衡对分类器的影响尤为严重。训练数据的不平衡也就是指在提供的训练数据集中,一类的样本总数远多于另一类的样本总数。常用的不平衡数据的处理方法有很多,只探讨利用重抽样方法对不平衡数据进行预处理来提高分类效果的方法。数据抽样算法有很多,但可以归为两大类:过抽样和欠抽样。针对二分类问题提出了四种融合过抽样和欠抽样算法的重抽样方法:BSM+Tomek、BSM+ENN、CBOS+Tomek和CBOS+ENN,并且与另外十种经典的重抽样算法做了大量的对比实验,实验证明提出的四种预处理算法在多种评价指标下提高了不平衡数据的分类效果。 展开更多
关键词 不平衡数据 抽样 基于聚类的过抽样算法(CBOS) 基于边界值的虚拟少数类向上采样算法(BSM) 可选择最 近邻算法(ENN) Tomek LINKS 预处理
下载PDF
基于Bootstrap抽样的多元过程能力指数估计 被引量:3
16
作者 田志友 田澎 王浣尘 《管理工程学报》 CSSCI 2006年第2期74-77,共4页
过程能力指数主要用于定量描述加工过程满足技术规格要求的能力,目前普遍使用的能力指数如Cp、Cpk、Cpm等主要针对单一质量特性,关于多元质量特性的过程能力指数尚未得到很好地解决。本文首先对多元过程能力指数的发展情况做一总结,指... 过程能力指数主要用于定量描述加工过程满足技术规格要求的能力,目前普遍使用的能力指数如Cp、Cpk、Cpm等主要针对单一质量特性,关于多元质量特性的过程能力指数尚未得到很好地解决。本文首先对多元过程能力指数的发展情况做一总结,指出现存的若干问题,然后在单变量过程服从正态分布的假设下,利用单一质量特性加工过程的差异系数,对单变量过程能力指数进行加权处理,得到多元过程能力指数的计算公式。然后基于Bootstrap抽样技术,对多元过程能力指数的统计分布进行仿真处理,获得了多元能力指数的经验分布及其大致的置信区间,从而为有效进行多元质量特性加工过程分析提供了概率依据。最后以某曲轴加工过程为例给出了应用案例。 展开更多
关键词 多元过程能力指数 差异系数 置信区间 bootstrap抽样
下载PDF
利用多重抽样估计稀有物种的种类数 被引量:3
17
作者 张南松 陈军杰 祝增荣 《生物数学学报》 CSCD 2002年第4期455-460,共6页
利用矩估计和二个稳健估计方法(jackknife估计,bootstrap估计)来处理野外生态学工作者的调查数据,在假定已经发现一些稀有物种的情形下,通过统计推断得到那些未被发现的物种的种类数.利用本文所提出的方法调查水稻田的昆虫群落和林地的... 利用矩估计和二个稳健估计方法(jackknife估计,bootstrap估计)来处理野外生态学工作者的调查数据,在假定已经发现一些稀有物种的情形下,通过统计推断得到那些未被发现的物种的种类数.利用本文所提出的方法调查水稻田的昆虫群落和林地的地面植被群落的稀有种是十分有效的. 展开更多
关键词 抽样 稀有物种 种类数 jackknife估计 bootstrap估计 丰盛度
下载PDF
结构可靠度计算的近似重要性抽样方法及其应用 被引量:12
18
作者 程耿东 蔡文学 《工程力学》 EI CSCD 北大核心 1997年第2期1-8,共8页
本文提出一种近似重要性抽样方法来计算结构可靠度。该方法将结构可靠度计算中的重要性抽样方法与结构优化中的近似重分析技术相结合,并引入误差带的技巧,显著减少了蒙特卡罗方法的计算量。运用该方法于结构正常使用极限状态可靠度分... 本文提出一种近似重要性抽样方法来计算结构可靠度。该方法将结构可靠度计算中的重要性抽样方法与结构优化中的近似重分析技术相结合,并引入误差带的技巧,显著减少了蒙特卡罗方法的计算量。运用该方法于结构正常使用极限状态可靠度分析的实例。 展开更多
关键词 结构可靠度 结构力学 要性抽样 近似分析
下载PDF
Bootstrap方法在渔业捕捞分层抽样调查中的应用分析 被引量:1
19
作者 张寒野 沈振华 +3 位作者 杨建忠 曹萍 谢营梁 陈恩友 《海洋渔业》 CSCD 北大核心 2014年第1期57-62,共6页
应用Bootstrap方法,对太湖捕捞渔业抽样调查参数估计进行研究,探讨分层抽样调查在捕捞产量统计中的应用。随机抽样模拟的结果表明,有放回的Bootstrap方法适用于抽样比例较小的分层抽样调查。对于总体分布未知且样本量容量有限的情况下... 应用Bootstrap方法,对太湖捕捞渔业抽样调查参数估计进行研究,探讨分层抽样调查在捕捞产量统计中的应用。随机抽样模拟的结果表明,有放回的Bootstrap方法适用于抽样比例较小的分层抽样调查。对于总体分布未知且样本量容量有限的情况下分层抽样调查的方差估计,重权Bootstrap方法相比其它方法具有明显的优势,适合用于渔业抽样调查工作。 展开更多
关键词 bootstrap 分层抽样 渔业统计
下载PDF
关于利用重要抽样法控制蒙特卡罗方差的比较 被引量:2
20
作者 王丙参 魏艳华 孙永辉 《统计与决策》 CSSCI 北大核心 2015年第9期78-81,共4页
给出了利用重要性抽样控制M-C方差的方法及其评价标准——有效样本大小,从理论上证明了其合理性,比较研究了重要性抽样函数对方差的影响并给出了改进方法,与采样重要重抽样相比,重要抽样算法抽样相对复杂些,但估计精度远远高于采样重要... 给出了利用重要性抽样控制M-C方差的方法及其评价标准——有效样本大小,从理论上证明了其合理性,比较研究了重要性抽样函数对方差的影响并给出了改进方法,与采样重要重抽样相比,重要抽样算法抽样相对复杂些,但估计精度远远高于采样重要重抽样,最后结合实例验证了前面结论,模拟结果显示,重要性抽样有效、可靠,特别适合模拟小概率事件。 展开更多
关键词 蒙特卡罗方差 要性抽样 采样抽样 有效样本大小
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部