基于缺失数据的Logistic模型的分布式优化方法被引量：4

A Distributed Optimization Method for Logistic Model With Missing Data

下载PDF

导出

摘要随着互联网、物联网和云计算的高速发展,数据呈现"爆炸式"增长趋势,然而,各类信息的大量流通使我们无法获得完整的数据。如何快速、高效地处理缺失数据是我们面临的一大挑战。在大数据背景下,文章将数据分别存储在不同的子机器中,结合分布式优化方法,对协变量随机缺失的指示变量建立Logistic模型,并基于该模型提出一个替代似然函数来进行参数估计。模拟和实证研究结果表明,所提出的基于替代似然函数的分布式优化方法优于基于平均思想的OneShot方法。 With the rapid development of the Internet,the Internet of Things(IoT)and cloud computing,data shows an"explosive"growth trend.However,the massive flow of all kinds of information makes it impossible for us to obtain complete data.How to deal with the missing data quickly and efficiently is a big challenge we are faced with.In the context of big data,and combining with the distributed optimization method,the paper stores data in different sub-machines respectively to establish the Logistic model for the indicator variables with the covariates missing at random.And based on this model,the paper proposes a surrogate likelihood function to estimate parameters.Simulation and empirical results show that the distributed optimization method based on surrogate likelihood function is superior to the OneShot method based on average thought.

作者潘莹丽刘展蔡雯 Pan Yingli;Liu Zhan;Cai Wen(School of Mathematics and Statistics,Hubei University,Wuhan 430062,China;Hubei Key Laboratory of Applied Mathematics,Hubei University,Wuhan 430062,China)

机构地区湖北大学数学与统计学学院湖北大学应用数学湖北省重点实验室

出处《统计与决策》 CSSCI 北大核心 2020年第22期23-26,共4页 Statistics & Decision

基金国家自然科学基金资助项目(11901175)。

关键词大数据随机缺失 LOGISTIC模型替代似然函数分布式优化 big data missing at random Logistic model surrogate likelihood function distributed optimization

分类号 O212 [理学—概率论与数理统计]

引文网络
相关文献

参考文献2

1赵丽丽.新经济业态下P2P网贷平台风险评价及问题平台甄别[J].扬州大学学报（人文社会科学版）,2020,24(4):63-73. 被引量：5
2关雪峰,曾宇媚.时空大数据背景下并行数据处理分析挖掘的进展及趋势[J].地理科学进展,2018,37(10):1314-1327. 被引量：57

二级参考文献35

1彭晓明,郭浩然,庞建民.多核处理器——技术、趋势和挑战[J].计算机科学,2012,39(S3):320-326. 被引量：20
2赵永华,迟学斌.基于SMP集群的MPI+OpenMP混合编程模型及有效实现[J].微电子学与计算机,2005,22(10):7-11. 被引量：33
3隽志才,倪安宁,贾洪飞,李杰.两种策略下的最短路径并行算法研究与实现[J].系统工程理论方法应用,2006,15(2):123-127. 被引量：6
4卢俊,张保明,黄薇,李二森.基于GPU的遥感影像数据融合IHS变换算法[J].计算机工程,2009,35(7):261-263. 被引量：18
5刘润涛,安晓华,高晓爽.一种基于R-树的空间索引结构[J].计算机工程,2009,35(23):32-34. 被引量：10
6卢照,师军.并行最短路径搜索算法的设计与实现[J].计算机工程与应用,2010,46(3):69-71. 被引量：21
7杨靖宇,张永生,董广军.基于GPU的遥感影像SAM分类算法并行化研究[J].测绘科学,2010,35(3):9-11. 被引量：11
8贾婷,魏祖宽,唐曙光,金在弘.一种面向并行空间查询的数据划分方法[J].计算机科学,2010,37(8):198-200. 被引量：12
9卢风顺,宋君强,银福康,张理论.CPU/GPU协同并行计算研究综述[J].计算机科学,2011,38(3):5-9. 被引量：95
10李建江,崔健,王聃,严林,黄义双.MapReduce并行编程模型研究综述[J].电子学报,2011,39(11):2635-2642. 被引量：187

共引文献60

1刘亚林,郭秋红.时空大数据的智能处理与服务探讨[J].计算机产品与流通,2020,0(7):108-108.
2魏巍巍.空间数据挖掘的方法进展及其问题探究[J].产业与科技论坛,2020(8):35-36.
3黄强伟.大数据时代图书馆信息资源共享与协作探究[J].南北桥,2018,0(2):2-2.
4李烁.数据挖掘技术在物流企业信息共享中的应用探究[J].电脑编程技巧与维护,2018(12):114-115. 被引量：2
5李钢,陈未雨,杨兰,刘倩,陈曦亮.武汉市快递自提点的空间格局与集聚模式研究[J].地理科学进展,2019,38(3):407-416. 被引量：30
6蒋红丽,肖行,沈占奇,唐康.基于BIM技术的精细化建筑空间信息管理与智慧城市的建设研究[J].建筑与装饰,2019,0(9):139-140. 被引量：1
7刘艳亭,李健,郭敬鹏.智慧医院规划建设与应用研究进展[J].中国医学装备,2019,16(6):177-181. 被引量：20
8马莉.智慧城市时空大数据平台研究[J].科技创新与应用,2019,0(25):58-59. 被引量：4
9ZHONG Jian.Research on the Data Mining Technology in College Students'Attendance System Based on the Big Data Architecture[J].International English Education Research,2019(2):85-87.
10李军,刘举庆,游林,俞艳,张晓盼,董恒.时空大数据支持的土地储备智能决策体系与应用研究[J].中国土地科学,2019,33(9):111-120. 被引量：15

同被引文献45

1蔡艳婧,王强,程实.基于分布式集群的网络浏览行为大数据分析平台构建[J].中国电子科学研究院学报,2019,14(1):1-7. 被引量：18
2吴文君,郭枭,赵家明,王朱伟,张延华.基于多路径传输的动态负载均衡路由算法[J].北京工业大学学报,2019,45(4):330-337. 被引量：15
3王冠男,杨镜非,王硕,端凌立,张嘉,武雅桐.考虑EV换电站调度和区块链数据存储的电网分布式优化[J].电力系统自动化,2019,43(8):110-127. 被引量：27
4路畅,郭力,刘一欣,高爽,徐斌.基于柔性互联的独立微电网分布式优化调度方法[J].电网技术,2019,43(5):1512-1519. 被引量：25
5史久根,王继,张径,徐皓.软件定义网络中基于流量管理的分布式防火墙策略[J].电子与信息学报,2019,41(1):91-98. 被引量：6
6许鑫,时雷,何龙,张浩,马新明.基于NoSQL数据库的农田物联网云存储系统设计与实现[J].农业工程学报,2019,35(1):172-179. 被引量：35
7刘承启,林振荣,黄文海.基于LSTM的WEB服务响应时间大数据预测方法[J].四川大学学报（自然科学版）,2019,56(1):71-77. 被引量：7
8叶康,冷喜武,肖飞,李雄立,朱励程.基于大数据标签技术的电网监控智能分析方法[J].电测与仪表,2019,56(4):75-79. 被引量：42
9杜鹏,米增强,贾雨龙,林立乾.基于网损灵敏度方差的配电网分布式储能位置与容量优化配置方法[J].电力系统保护与控制,2019,47(6):103-109. 被引量：52
10唐海国,龚汉阳,冷华,朱吉然,毛涛.负荷数据不完全的配电网降损优化方法[J].电力系统及其自动化学报,2019,31(3):128-132. 被引量：14

引证文献4

1潘莹丽,刘飞,刘展,赵晓洛.基于大规模数据尾期望回归的分布式计算方法[J].统计与决策,2022(12):11-16. 被引量：1
2王巧莉,马军,杨恒翔,王燕军,高逸凡,古丽孜热·艾尔肯.基于多路径遍历优先选择的缺失数据云存储方法[J].电力大数据,2022,25(6):36-42. 被引量：2
3梁雪青,杜舒明,赵小凡,刘超.分布式电力大数据存储系统参数优化方法[J].电子设计工程,2023,31(10):101-105. 被引量：1
4马海鑫,余杰文,侯剑,韩吉安,宋学清.智能电网海量非结构化数据分布式存储研究[J].电子设计工程,2023,31(11):116-119. 被引量：5

二级引证文献9

1陆嘉铭,奚增辉,瞿海妮,许唐云,姚嵘,屈志坚.电力量测数据缺失补齐方法研究与实践[J].电力大数据,2023,26(7):40-49. 被引量：1
2亢清波,魏志远,黄文涛,侯云飞,仇佳鑫,李妍.油气田中分布式智能电网技术研究与应用[J].通信电源技术,2023,40(19):61-65.
3吴呈瑜,张红斌,占敖.低信噪比场景下全相位FFT载频估计改进算法[J].无线电通信技术,2023,49(6):1073-1080.
4朱佳明,王浩国,方烨阳,杨金涛,杨松坤,吴倩.智慧配电网辅助规划平台分布式计算数据通信实现方法[J].电器工业,2024(4):20-27. 被引量：1
5严世杰.智能电网与分布式自动化控制系统[J].中国科技投资,2024(5):137-139.
6王陆璐,左中秋,吴成成,黄佳瑞,钱青春.避雷器泄漏电流测量原理分析及内置式监测装置研制[J].高压电器,2024,60(8):174-182.
7徐世阳.基于双向长短记忆网络融合模型的招标文件解析技术研究[J].电力大数据,2024,27(4):80-94.
8邓志东,刘鲲鹏.基于改进贝叶斯网络的电力大数据存储架构可扩展性优化算法[J].微型电脑应用,2024,40(9):102-106.
9路耀杰.基于Java的继电保护大数据管理系统设计研究[J].信息记录材料,2024,25(10):155-158.

1黄晨光,张兵,易彩,靳行.高速列车轴箱轴承多故障滚动体振动模型及其缺陷定位方法[J].振动与冲击,2020,39(18):34-43. 被引量：3
2付林,黄耀德,曹新慧,郭文斌.基于能源互联网的P2P能源共享与协调新框架[J].现代科学仪器,2020(6):122-126.
3姚林,张岩.基于分布式稀疏LS的热轧过程质量相关故障检测[J].工业仪表与自动化装置,2020(6):65-68.
4崔笛,张伟平.当前状态数据中比例风险模型的一种贝叶斯变量选择方法[J].中国科学技术大学学报,2020,50(10):1303-1314.

统计与决策

2020年第22期

浏览历史

内容加载中请稍等...

基于缺失数据的Logistic模型的分布式优化方法被引量：4

参考文献2

二级参考文献35

共引文献60

同被引文献45

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于缺失数据的Logistic模型的分布式优化方法 被引量：4

参考文献2

二级参考文献35

共引文献60

同被引文献45

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于缺失数据的Logistic模型的分布式优化方法被引量：4