-
题名大数据下分位数回归通讯有效算法及其应用
被引量:1
- 1
-
-
作者
周勇
张澍一
李子洋
-
机构
华东师范大学统计与数据科学前沿理论及应用教育部重点实验室
-
出处
《管理科学学报》
CSCD
北大核心
2023年第5期70-102,共33页
-
基金
国家自然科学基金资助重点项目(71931004)
国家自然科学基金资助项目(72201101)
+2 种基金
科技部国家重点研发计划资助项目(2021YFA1000101,2021YFA1000102,2021YFA1000104)
教育部人文社会科学研究资助青年基金项目(22YJC910013)
上海市浦江人才计划资助项目(21PJC034)。
-
文摘
考虑风险度量中常见的分位数回归模型,给出在超大容量数据且复杂数据类型下的几类快速分布式算法.虽然仅考虑分位数回归模型,但本文提供的算法大多数可以应用到其它更一般的模型中.由于分位数回归模型的目标函数为非光滑函数,通常的分块集成法和光滑函数高效通讯算法并不适用.本文首先针对完整观测数据,给出了分位数回归模型参数估计的等度连续法,光滑函数逼近法和改进的数萃(Meta)方法三种分布式通讯有效算法.进一步,考虑了非平衡半监督数据,分别针对无标签数据样本量较小和较大两种情形,提出了加权损失函数法和改进的数萃方法两种数据融合方法.所提出的方法可以把分散在不同机器上的半监督数据进行数据融合,从而实现不同数据类型和不同样本量情形下的高效通讯分布式计算,提高算法的精度和参数估计的效率.本文通过大量仿真模拟研究了所提出的算法在有限样本下的表现,并将其应用到了洛杉矶流浪人口数的实际数据分析中,发现其均具有较好的准确性.
-
关键词
大数据分析
数据融合
通讯有效算法
分位数回归
-
Keywords
big data analysis
data fusion
communication-efficient algorithm
quantile regression
-
分类号
C93-03
[经济管理—管理学]
O212.1
[理学—概率论与数理统计]
-
-
题名气象调整下的区域空气质量评估
被引量:5
- 2
-
-
作者
张澍一
陈松蹊
郭斌
王恒放
林伟
-
机构
北京大学光华管理学院
北京大学统计科学中心
西南财经大学统计研究中心
西南财经大学统计学院
Department of Statistics
北京大学数学科学学院
-
出处
《中国科学:数学》
CSCD
北大核心
2020年第4期527-558,共32页
-
基金
科技部国家重点研发计划(批准号:2016YFC0207701,2016YFC0207702和2016YFC0207703)
国家重点基础研究发展计划(批准号:2015CB856000)
+2 种基金
国家自然科学基金(批准号:71532001,71371016,11971390和11671018)
北京市自然科学基金(批准号:Z190001)
中央高校基本科研业务费专项资金(批准号:JBK1806002)资助项目。
-
文摘
虽然空气污染是由污染物排放到大气中造成的,但是由于气象条件会影响污染物的扩散,因而实际观测到的污染水平会受到气象条件的影响.因此,有效的空气质量管理要求污染评估指标和统计方法不受气象因素的干扰,并能准确客观地反映污染物浓度的变化.为了评估北京地区潜在污染物排放的变化,本文提出一种消除气象干扰的时空调整方法.通过控制气象条件,调整后的污染物时空平均浓度可以捕捉到潜在排放量的变化.本文提出具体调整均值的方法,并进行理论和数值分析,将此方法应用于北京地区的空气质量评估,揭示一些有趣的模式和趋势,这些结果可以用于空气质量评估和管理.
-
关键词
空气质量评估
气象混杂
非参数回归
时空调整
-
Keywords
air-quality assessment
meteorological confounding
nonparametric regression
spatio-temporal adjustment
-
分类号
X823
[环境科学与工程—环境工程]
-