期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
样本结构性偏差与因果推论——基于实验数据的分析
1
作者 周皓 《社会研究方法评论》 2023年第2期126-188,共63页
本文利用仿真实验数据,讨论了样本结构偏离对线性回归和因果推断下的平均实验效应估计量的影响。文章认为:1)样本结构偏离是集合性的联合分布偏离,而非只是单变量分布的偏离;2)非随机的样本结构性偏差主要表现在实验效应估计量、自身系... 本文利用仿真实验数据,讨论了样本结构偏离对线性回归和因果推断下的平均实验效应估计量的影响。文章认为:1)样本结构偏离是集合性的联合分布偏离,而非只是单变量分布的偏离;2)非随机的样本结构性偏差主要表现在实验效应估计量、自身系数估计量,以及与之相关(甚至无关)的变量系数估计量三个方面;3)因果推论视角下,样本结构偏离会导致实验效应估计量有偏;4)分类变量的结构性偏差会随着与真实结构的距离增大而呈非线性加快扩大趋势,特别是对实验效应的估计;5)统计方法无法从根本上解决样本结构性偏差。最后,文章强调必须重视并从根源上解决样本结构性偏差,以期更贴现实地从总体角度描绘社会现实,解释社会现象,回答社会问题。这应该是社会科学定量研究的目标。 展开更多
关键词 样本结构 偏差 实验效应 仿真实验
下载PDF
基于样本结构向量相似度的ID3算法改进
2
作者 陈全园 侯帅琳 李雅琪 《景德镇学院学报》 2023年第6期9-15,共7页
通过对ID3算法的深入研究,发现其存在多值偏向、计算复杂和效率不高等问题。为了解决这些问题,文章对ID3算法模型进行了优化,并提出了一种基于向量相似度的改进ID3算法。在计算信息增益时,首先使用二阶麦克劳林公式简化了原始公式,从而... 通过对ID3算法的深入研究,发现其存在多值偏向、计算复杂和效率不高等问题。为了解决这些问题,文章对ID3算法模型进行了优化,并提出了一种基于向量相似度的改进ID3算法。在计算信息增益时,首先使用二阶麦克劳林公式简化了原始公式,从而减少了ID3算法在log函数上的运算时间和复杂程度。然后通过构造样本结构相似矩阵,并引入向量相似度作为权重,极大程度上避免了多值偏向的问题。通过实例验证对比,文章证明了这种优化在不影响后续运算并保证结果可靠的前提下,能够简化计算过程,并使得生成的决策树的各个分支点更加合理。 展开更多
关键词 ID3算法 样本结构相似矩阵 向量相似度
下载PDF
藏族学生思想状况调查设计与样本结构——我国藏区青年学生思想状况调查研究报告之一
3
《中国西藏》 2016年第4期96-96,共1页
马戎在《西北民族研究》2016年第2期上发表文章,2014年,北京大学课题组对西藏大学、西藏民族学院、西南民族大学、中央民族大学在校藏族学生基本情况及一些议题方面的思想状况开展了问卷调查。回收问卷的总规模为1300人,其中包括了11... 马戎在《西北民族研究》2016年第2期上发表文章,2014年,北京大学课题组对西藏大学、西藏民族学院、西南民族大学、中央民族大学在校藏族学生基本情况及一些议题方面的思想状况开展了问卷调查。回收问卷的总规模为1300人,其中包括了111名藏族教师。 展开更多
关键词 学生思想状况 调查研究报告 藏族学生 样本结构 《西北民族研究》 青年 藏区 设计
下载PDF
基于小样本贝叶斯网络结构学习的质量绩效评价模型研究
4
作者 鲁守东 林仁 《湖南城市学院学报(自然科学版)》 CAS 2017年第6期61-66,共6页
采用一种多元回归加PC算法的改良BN结构学习方法,有效地克服了小样本训练数据下的结构学习可靠性问题﹒从铁路建筑施工现场收集到研究数据后进行探索性因子分析,并萃取出11个质量绩效动因要素;以多元回归分析方法找出5个直接影响因子,... 采用一种多元回归加PC算法的改良BN结构学习方法,有效地克服了小样本训练数据下的结构学习可靠性问题﹒从铁路建筑施工现场收集到研究数据后进行探索性因子分析,并萃取出11个质量绩效动因要素;以多元回归分析方法找出5个直接影响因子,并以此为先验知识构建BN初始网络结构,再应用PC算法进行结构学习,一套理想的质量绩效测度模型被最终获得﹒以3个企业的实际样本数据为依据,进行贝叶斯网络推理和检验,检验结果表明模型具有较好的适切性和科学性﹒ 展开更多
关键词 建筑施工系统 质量绩效评价 样本BN结构学习 多元回归分析
下载PDF
通用性二元立木材积模型的建模样本研究 被引量:23
5
作者 贺东北 曾伟生 骆期邦 《中南林业调查规划》 2001年第1期1-9,共9页
研究提出了组织通用性二元立木材积模型建模样本的理论和方法。通过 1 1个方案的对比试验表明 ,根据建模单元内可能出现的径阶分布范围 ,选取不少于 5个取样径阶 (其中最小和最大径阶必取 ) ,然后在每个取样径阶范围中 ,按高径比大、中... 研究提出了组织通用性二元立木材积模型建模样本的理论和方法。通过 1 1个方案的对比试验表明 ,根据建模单元内可能出现的径阶分布范围 ,选取不少于 5个取样径阶 (其中最小和最大径阶必取 ) ,然后在每个取样径阶范围中 ,按高径比大、中、小取 30株样木 ,总样本量不少于 1 5 0株所构成的建模样本 ,是保证模型具有广泛适用性的高效样本 ,从而可以避免以往取样工作中的盲目性 ,大量节约不必要的无效取样量。这一理论和方法 。 展开更多
关键词 通用性二元立木材积模型 样本组织 样本结构 建模
下载PDF
基于积分型辨识样本机构的水下航行器操纵运动建模(英文)
6
作者 徐锋 陈庆 +1 位作者 邹早建 尹建川 《船舶力学》 EI CSCD 北大核心 2014年第3期211-220,共10页
基于水下航行器的水平面线性水动力模型,分别使用欧拉法和四阶龙哥库塔法进行操纵运动仿真。然后分别使用欧拉型和积分型辨识样本结构进行水动力导数的辨识。通过辨识误差的比较,证明积分型辨识样本机构具有更高的精度和稳定性。通过分... 基于水下航行器的水平面线性水动力模型,分别使用欧拉法和四阶龙哥库塔法进行操纵运动仿真。然后分别使用欧拉型和积分型辨识样本结构进行水动力导数的辨识。通过辨识误差的比较,证明积分型辨识样本机构具有更高的精度和稳定性。通过分析指出,提高参数辨识精度的一个有效途径是减少数据样本同辨识样本结构的局部截断误差。关键词:辨识样本结构;水下航行器;操纵运动; 展开更多
关键词 辨识样本结构 水下航行器 操纵运动 参数辨识
下载PDF
也谈抽样中样本的代表性问题 被引量:1
7
作者 王瑛 《浙江统计》 2002年第9期15-17,共3页
关键词 抽样调查 系统误差 随机误差 样本结构 抽样框 样本 代表性
下载PDF
基于密度核估计的贝叶斯网络结构学习算法 被引量:6
8
作者 韩绍金 李建勋 《计算机工程与应用》 CSCD 2014年第15期107-112,共6页
贝叶斯网络结构学习算法主要包括爬山法和K2算法等,但这些方法均要求面向大样本数据集。针对实际问题中样本集规模小的特点,通过引入概率密度核估计方法以实现对原始样本集的拓展,利用K2算法进行贝叶斯网络结构学习。通过优化选择核函... 贝叶斯网络结构学习算法主要包括爬山法和K2算法等,但这些方法均要求面向大样本数据集。针对实际问题中样本集规模小的特点,通过引入概率密度核估计方法以实现对原始样本集的拓展,利用K2算法进行贝叶斯网络结构学习。通过优化选择核函数和窗宽,基于密度核估计方法实现了样本集的有效扩展;同时基于互信息度进行变量顺序的确认,进而建立了小规模样本集的贝叶斯结构学习算法。仿真结果验证了新学习算法的有效性和实用性。 展开更多
关键词 贝叶斯网络 样本结构学习 K2算法
下载PDF
基于“三新”企业分层抽样单元权重动态调整的估计方法
9
作者 张维群 成鹏东 《统计与信息论坛》 北大核心 2024年第3期3-13,共11页
对“三新”企业进行抽样调查是及时掌握和监测“三新”经济发展的重要手段。考虑到这一类调查总体单元变动比较迅速,抽样框信息变动大,无法及时覆盖总体的最新特征,依此抽样框得到的样本数据结构与总体的分布结构差异较大,样本的代表性... 对“三新”企业进行抽样调查是及时掌握和监测“三新”经济发展的重要手段。考虑到这一类调查总体单元变动比较迅速,抽样框信息变动大,无法及时覆盖总体的最新特征,依此抽样框得到的样本数据结构与总体的分布结构差异较大,样本的代表性较低,会对总体数量特征的有效估计产生影响。因此,基于调查总体单元的变动特征,把抽样框中的单元划分为保留单元和转移单元,在此基础上,依据样本单位分层结构的变动,设计了基于“三新”企业分层抽样单元权重动态调整的估计方法。首先,通过事后分层方法挖掘出不同层的单位特征,并预测抽样框各层容量;其次,依据层规模的变动预测对目标变量估计量的权重进行修正;最后,通过自我加权设计构造出总体动态变动后数量特征的复合估计量,并对其进行优良性讨论。在对“三新”企业的模拟数据进行多次重复抽样实验中,相比于固定抽样框下的传统方法,基于分层抽样单元权重动态调整的估计方法具有更高的抽样效率,构造的关于总体数量特征的估计量具有无偏性和有效性。 展开更多
关键词 “三新”企业 抽样单元 样本分布结构 复合估计 自我加权设计
下载PDF
基于样本的优化
10
作者 张智杰 孙晓明 +1 位作者 张家琳 陈卫 《大数据》 2021年第5期98-110,共13页
基于样本的优化研究的是如何通过用于学习目标函数的样本数据直接优化目标函数。首先介绍这一问题的数学模型——样本优化模型,以及这个模型下的不可近似性结果;然后介绍若干方法和样本优化模型的变种,以绕过这个模型下的不可近似性结果... 基于样本的优化研究的是如何通过用于学习目标函数的样本数据直接优化目标函数。首先介绍这一问题的数学模型——样本优化模型,以及这个模型下的不可近似性结果;然后介绍若干方法和样本优化模型的变种,以绕过这个模型下的不可近似性结果,使得优化成为可能;接着着重介绍其中一个变种——结构化样本优化模型,并详细阐述该模型下的最大覆盖问题和影响力最大化问题的优化算法;最后总结全文,并展望这一问题的未来研究方向。 展开更多
关键词 基于样本的优化 数据驱动的优化 结构样本 最大覆盖问题 影响力最大化问题
下载PDF
温带森林乔木生物量估算:Logistic模型优于Allometric模型 被引量:1
11
作者 周佳玉 袁川 +5 位作者 马杰敏 毛梦绮 岳晓萍 郭立 王帅 高光耀 《生态学报》 CAS CSCD 北大核心 2023年第22期9342-9355,共14页
作为研究森林生态系统结构与功能的基础要素,准确估算植被生物量关乎温室气体减排政策制定,以及区域气候稳定性评估,具有显著的科学意义和社会需求。Allometric模型提供了量化生物量与个体体型关系的简洁数学形式,但其幂函数结构描述了... 作为研究森林生态系统结构与功能的基础要素,准确估算植被生物量关乎温室气体减排政策制定,以及区域气候稳定性评估,具有显著的科学意义和社会需求。Allometric模型提供了量化生物量与个体体型关系的简洁数学形式,但其幂函数结构描述了生物量持续加速且无限增长,与随植株增大而不断加剧的种内种间竞争和资源限制相悖。然而,当前严重缺失大体型植株的不合理样本结构部分掩盖了模型缺陷,是造成该模型获得重复验证的重要潜在原因。相较而言,通过引入限制因子,Logistic模型同时具备描述高速增长和后期渐趋收敛的模型特征,却鲜被用于植被生物量估算。因此,本研究搜集了典型植被类型——温带森林乔木生物量相关的197篇已发表文献(1945—2016年),基于198种针阔叶乔木物种总计26402个叶、茎和地上部分生物量数据,采用Logistic模型分析了生物量随胸径增长的变化规律。结果表明,较之Allometric模型(R^(2*)0.76、RMSE 0.44 g、AIC 7189.9),Logistic模型呈现更好的拟合优度(R^(2*)0.81、RMSE 0.39 g、AIC 5809.1)。此外,Logistic模型计算了平衡生物量与平衡生长率,以反映与生境资源相适应的植株生物量及其累积速率,通过识别生物量渐趋稳定的胸径阈值,发现超过该拐点的大体型样本占比不足0.71%,呈现显著的生态学意义。综上,Logistic模型估算温带森林乔木生物量具备统计效力和理论优势。研究显著改进了植被生物量估算模型,有助于揭示植物碳蓄积策略,了解森林能流规律和碳库动态,为制定气候变化应对政策提供依据。 展开更多
关键词 平衡生物量 平衡生长率 拐点 拟合优度 样本结构
下载PDF
论中国环境影响评价公众参与中的若干问题 被引量:7
12
作者 曹植菁 龙炳清 《四川环境》 2004年第6期38-40,共3页
本文针对中国环境影响评价中公众参与的现状及存在问题,指出公众参与是业主和相关人群双赢的重要举措,公众充分知情是搞好公众参与的前提条件,合理的样本结构和适度的样本空间是公众参与结论客观性的重要保证。
关键词 公众参与 知情权 样本结构 样本空间
下载PDF
城市出行环境对绿色出行行为影响研究 被引量:4
13
作者 和占琼 尹晓 《生态经济》 北大核心 2021年第7期88-96,共9页
构建低碳交通体系、提高绿色出行水平是生态文明建设的重要内容。文章基于TPB理论和VBN理论,在我国14个大中城市调查数据的基础上,利用主成分分析细化提取“城市环境”“交通状态”和“公交服务”三个城市出行环境影响因子,建立多样本... 构建低碳交通体系、提高绿色出行水平是生态文明建设的重要内容。文章基于TPB理论和VBN理论,在我国14个大中城市调查数据的基础上,利用主成分分析细化提取“城市环境”“交通状态”和“公交服务”三个城市出行环境影响因子,建立多样本结构方程模型,从个体社会心理层面揭示了城市出行环境对绿色出行意向的影响因素及作用机理。研究结果表明:城市出行环境对绿色出行决策有明显影响,虽然群组模型中潜变量作用路径相同,但不利绿色出行环境中的居民表现出较高的环保价值观和更强烈的绿色出行意愿,在不利绿色出行环境中,居民绿色出行意向的动力更多来自自身环保意识的强化;对于有利绿色出行环境中的居民,绿色出行意向的动力更多来自个人和社会的行为规范。 展开更多
关键词 城市出行环境 心理潜变量 绿色出行 样本结构方程模型
下载PDF
基于MATLAB的BP神经网络计算铁矿产品成本 被引量:6
14
作者 赵志勇 张志礼 李永利 《河北理工学院学报》 2003年第4期78-83,共6页
根据影响铁矿产品成本的指标构建了BP神经网络模型,应用MATLAB工具直接根据资源状况和生产状况来估算矿产品成本,对神经网络在矿产品成本计算中的应用作了新的尝试。
关键词 MATLAB BP神经网络 铁矿产品 成本 误差反向传播算法 样本结构
下载PDF
改进ID3决策树算法——SS_ID3算法 被引量:1
15
作者 蔡贺 张睿 《甘肃科技》 2011年第14期31-33,8,共4页
从分析ID3决策树算法及解析入手,引入属性样本结构相似度概念,构建了样本结构相似度模型,并以该模型和属性的信息增益共同作为决策树内部结点的选择标准。改进SS_ID3决策树算法,着眼于决策树非叶结点的选择标准的优化,继承了原始ID3决... 从分析ID3决策树算法及解析入手,引入属性样本结构相似度概念,构建了样本结构相似度模型,并以该模型和属性的信息增益共同作为决策树内部结点的选择标准。改进SS_ID3决策树算法,着眼于决策树非叶结点的选择标准的优化,继承了原始ID3决策树算法的优点,并在多值偏向性的修正、决策树的大小控制及分类预测性能等方面取得了积极的改进。 展开更多
关键词 ID3算法 信息增益 样本结构相似度 SS_ID3算法
下载PDF
重庆农转非社区文化建设的问题、原因与对策
16
作者 薛育余 《重庆行政(公共论坛)》 2012年第5期94-96,共3页
一、问题的提出及样本结构 (一)问题的提出 社区文化是人们行为所构成的文化生态系统中,结成以生产关系为基础的包括人们的理想追求、价值观念、群体意识、行为规范、生活习俗、娱乐时尚等文化现象。它具备社会沟通、心理凝聚、行... 一、问题的提出及样本结构 (一)问题的提出 社区文化是人们行为所构成的文化生态系统中,结成以生产关系为基础的包括人们的理想追求、价值观念、群体意识、行为规范、生活习俗、娱乐时尚等文化现象。它具备社会沟通、心理凝聚、行为规范、文化教育等功能。 展开更多
关键词 社区文化建设 农转非 重庆 原因 文化生态系统 行为规范 样本结构 理想追求
下载PDF
高校教师对学生评教结果使用的实证研究
17
作者 沈阳 《教育科学文摘》 2011年第2期67-68,共2页
问卷设计及样本结构分析 学生评教作为教育评价的一部分,按目的也可分为形成性评价与总结性评价两大类。形成性评价不以对被评教师进行分等鉴定为目的,评教结果主要提供给被评教师,用于其改进教学;总结性评价以对教师教学进行等级... 问卷设计及样本结构分析 学生评教作为教育评价的一部分,按目的也可分为形成性评价与总结性评价两大类。形成性评价不以对被评教师进行分等鉴定为目的,评教结果主要提供给被评教师,用于其改进教学;总结性评价以对教师教学进行等级鉴定为目的,其结果主要为人事决策、教学奖惩等提供依据。 展开更多
关键词 学生评教结果 高校教师 实证研究 总结性评价 形成性评价 教师教学 等级鉴定 样本结构
下载PDF
抽样调查中系统性误差的产生原因及控制 被引量:2
18
作者 雷汉威 《上海统计》 北大核心 2001年第7期16-17,共2页
抽样调查的误差是样本的某一估计值与总体对应参数真值的差距,这个差距的大小直接关系到该估计值对总体参数估计的准确程度。根据形成误差的原因,抽样调查中的总误差分为随机误差和系统性误差两部分,而随机误差是由样本结构与总体结... 抽样调查的误差是样本的某一估计值与总体对应参数真值的差距,这个差距的大小直接关系到该估计值对总体参数估计的准确程度。根据形成误差的原因,抽样调查中的总误差分为随机误差和系统性误差两部分,而随机误差是由样本结构与总体结构的随机差异而导致产生的,它虽然是不可避免,但可以用公式计算,其大小可以通过调整样本容量或改变抽样方式来加以控制,而系统性误差主要是人为因素引起的,它既难以计算,又难以控制,成为影响调查结果可靠程度的重要原因。因此本文主要是针对系统性误差产生的原因、特点进行分析,从而找到尽可能缩小系统性误差的途径进行论述。 展开更多
关键词 系统性误差 抽样调查 可靠程度 缩小 样本结构 调整 产生 原因 改变 控制
下载PDF
基于非线性自回归神经网络的GHI预测 被引量:11
19
作者 马燕峰 蒋云涛 +1 位作者 郝毅 赵书强 《太阳能学报》 EI CAS CSCD 北大核心 2019年第3期733-740,共8页
针对水平面总辐照度(global horizontal irradiation,GHI)短期预测问题,提出一种基于非线性自回归神经网络的短期水平面太阳总辐照度预测模型。首先,提出一种并联结构训练样本,以保证训练样本内部的时间耦合性。其次,通过对9项气象参数... 针对水平面总辐照度(global horizontal irradiation,GHI)短期预测问题,提出一种基于非线性自回归神经网络的短期水平面太阳总辐照度预测模型。首先,提出一种并联结构训练样本,以保证训练样本内部的时间耦合性。其次,通过对9项气象参数共511种组合作为输入的模型预测精度进行分析,确定模型最优输入组合。最后,利用4种典型气象条件下GHI时延神经网络预测模型,非线性自回归动态神经网络预测模型预测标准均方根误差均降低。 展开更多
关键词 太阳辐照度 预测 神经网络 动态 非线性自回归 训练样本结构
下载PDF
谈抽样调查资料的正确使用——兼与赵晓雷同志商榷 被引量:2
20
作者 卢小广 《社会》 1987年第6期42-44,共3页
今年第三期《社会》上刊登了赵晓雷同志的《从价值观的序列看中美民族心态的差异》一文(以下简称为赵文)。文章以美国民意测验材料,和我国《英语世界》杂志读者调查资料为基本依据,对中美民族的价值观念进行对比分析。文章还对《英语世... 今年第三期《社会》上刊登了赵晓雷同志的《从价值观的序列看中美民族心态的差异》一文(以下简称为赵文)。文章以美国民意测验材料,和我国《英语世界》杂志读者调查资料为基本依据,对中美民族的价值观念进行对比分析。文章还对《英语世界》读者调查作了简要说明,介绍了该项调查的抽样设计、调查过程和样本结构。在社会学论文中简要地介绍所用资料的搜集过程,是保证社会调查研究严肃性的必要环节,其意义在于通过这种必要的介绍,来检验和督促调查资料的合理使用,防止对社会调查资料的滥用。赵文较为全面地介绍了所用资料的调查情况,正是为了提高社会学研究科学性而作出的努力。遗憾的是赵文未能正确地使用抽样调查资料。 展开更多
关键词 调查资料 非概率抽样 抽样误差 抽样设计 抽样总体 样本结构 抽样调查 样本单位 调查方式 总体状况
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部