-
题名基于含测量误差半参数模型的糖尿病数据研究
被引量:2
- 1
-
-
作者
孙兴
黄振生
-
机构
南京理工大学理学院
-
出处
《重庆工商大学学报(自然科学版)》
2022年第1期85-91,共7页
-
文摘
对于糖尿病数据,利用单指标部分含扭曲测量误差的部分变系数单指标模型进行拟合,由于实验数据的维数较大,相较于传统的参数模型和非参数模型,应用半参数模型不仅可以较好地拟合数据,还可以避免“维数灾祸”问题;此外,如果在拟合时忽略误差的影响,可能导致模型估计产生偏差,因此,进一步选择体质指数(BMI)作为潜在的混淆因子,并假设响应变量和单指标变量均受到BMI的乘积污染;观察实验结果发现:6种血清指标测量数据和性别的系数会随着BMI的变化而变化,并且对比带有测量误差和不含测量误差两种情形下的结果发现,糖尿病人定量测量值、年龄和平均血压均受到BMI的污染;这些结果说明选择单指标部分带有测量误差的部分变系数单指标模型对该数据集进行拟合是合理的,并且相较于不含测量误差的半参数模型,可以更好地挖掘数据中的信息。
-
关键词
部分变系数单指标模型
乘积扭曲测量误差
糖尿病数据
-
Keywords
partially varying-coefficient single-index model
product distortion measurement error
diabetes data
-
分类号
O212.7
[理学—概率论与数理统计]
-
-
题名基于半参数测量误差模型的加利福尼亚房价数据研究
- 2
-
-
作者
娄文
-
机构
南京理工大学理学院
-
出处
《重庆工商大学学报(自然科学版)》
2020年第6期95-102,共8页
-
文摘
对于加利福尼亚房价数据,房屋中位年龄可以看作是潜在的混淆变量,有可能影响其他协变量与响应变量之间的关系。如果忽略测量误差对变量的影响,并直接运用假设响应变量和协变量可以准确观测的经典半参数模型来拟合该数据,则可能会导致结果存在较大偏差,因此提出了利用单指标扭曲测量误差模型对该数据进行拟合。观察扭曲函数的拟合曲线后发现:中位房价、中位收入、总房间数、总卧室数和人口确实受到了以房屋中位年龄为混淆变量的乘积污染,这说明了选择的单指标扭曲测量误差模型相比于不考虑测量误差的半参数模型更适合加利福尼亚房价数据。
-
关键词
单指标模型
乘积扭曲测量误差
加利福尼亚房价数据
-
Keywords
single-index models
multiplicative distortion measurement errors
California housing prices data
-
分类号
O212.7
[理学—概率论与数理统计]
-