多均值变点估计问题是目前统计界的一个热点问题。文献中已有多种算法处理该问题,其中筛选排序算法(Screening and Ranking algorithm,SaRa)由于具有快速检测和高精度的特点而被广泛关注。值得注意的是,该算法在筛选步骤的阈值选取倾向...多均值变点估计问题是目前统计界的一个热点问题。文献中已有多种算法处理该问题,其中筛选排序算法(Screening and Ranking algorithm,SaRa)由于具有快速检测和高精度的特点而被广泛关注。值得注意的是,该算法在筛选步骤的阈值选取倾向于保守,其主要原因是SaRa算法中方差参数采用了分段方法进行估计。本文的主要目的是改进多均值变点估计的SaRa算法。首先,运用局部多项式结合交叉验证方法给出了误差标准差的一个全局估计,并将其应用于初筛变点步骤中。然后,通过对候选变点的局部诊断函数值进行排序,进而结合MBIC准则得到了最终的变点估计。数值模拟结果显示了本文所提出的改进的SaRa算法在变点的数目及位置的估计准确率均高于现有的方法。最后,将该方法应用于深圳市车流量实际数据,通过分析该区域的工作日及非工作日变点分布特点,可为交管部门和出行人群提供参考建议。展开更多
文摘多均值变点估计问题是目前统计界的一个热点问题。文献中已有多种算法处理该问题,其中筛选排序算法(Screening and Ranking algorithm,SaRa)由于具有快速检测和高精度的特点而被广泛关注。值得注意的是,该算法在筛选步骤的阈值选取倾向于保守,其主要原因是SaRa算法中方差参数采用了分段方法进行估计。本文的主要目的是改进多均值变点估计的SaRa算法。首先,运用局部多项式结合交叉验证方法给出了误差标准差的一个全局估计,并将其应用于初筛变点步骤中。然后,通过对候选变点的局部诊断函数值进行排序,进而结合MBIC准则得到了最终的变点估计。数值模拟结果显示了本文所提出的改进的SaRa算法在变点的数目及位置的估计准确率均高于现有的方法。最后,将该方法应用于深圳市车流量实际数据,通过分析该区域的工作日及非工作日变点分布特点,可为交管部门和出行人群提供参考建议。
基金supported by the National Key R&D Program of China(Grant No.2020YFB1707801)the Fundamental Research Funds for the Central Universities(Grant No.2020MS034)+1 种基金supported by the China Postdoctoral Science Foundation(Grant No.2020M680269)the National Natural Science Foundation of China(Grant No.12101023)。