作为一门新兴的学科领域,数据科学的科学性受到了关注且其科学问题未明确提出。文中从科学研究范式及方法论、可证伪性和可再现性、科学精神及快速迭代以及科学研究纲领及理论体系4个方面探讨了数据科学的“科学性”,并解答了为什么数...作为一门新兴的学科领域,数据科学的科学性受到了关注且其科学问题未明确提出。文中从科学研究范式及方法论、可证伪性和可再现性、科学精神及快速迭代以及科学研究纲领及理论体系4个方面探讨了数据科学的“科学性”,并解答了为什么数据科学是一门新兴科学的问题。在此基础上,结合DIKW模型(DIKW Pyramid or Hierarchy)、DMP(Data-Model-Problem)模型、数据科学的统计学和机器学习方法论以及数据科学的流程与活动,提出了数据科学的7个核心科学问题:解释在先还是在后或无、问题对齐数据还是数据对齐问题、更加相信数据还是模型、更加重视性能还是可解释性、如何划分数据、如何用已知数据解决未知数据的问题、人在环路还是人出环路。最后,提出了数据科学研究的4点建议:聚焦数据科学本身的理论研究,推动数据的科学、技术和工程需要进一步分离和专业化,加强人工智能赋能的数据科学的理论与实践以及数据科学学科(Data Science as A Discipline)与学科中的数据科学(Data Science Within A Discipline)的联动。展开更多
快速准确的电力系统扰动检测能够为后续扰动分析提供有效的指导信息,而广域测量系统(wide area measurement system,WAMS)的广泛应用为扰动检测提供了有力的数据基础。基于PMU量测数据,该文提出一种考虑PMU不良数据的扰动事件检测方法...快速准确的电力系统扰动检测能够为后续扰动分析提供有效的指导信息,而广域测量系统(wide area measurement system,WAMS)的广泛应用为扰动检测提供了有力的数据基础。基于PMU量测数据,该文提出一种考虑PMU不良数据的扰动事件检测方法。首先分析PMU异常数据行为特性,揭示扰动事件与不良数据的差异性特征。进一步,提出一种基于差分Teager-Kaiser能量算子与3Sigma准则相结合的PMU异常数据初筛方法,避免了低强度扰动漏检和扰动的重复检测问题。接着,利用动态时间规整和最大互信息系数分别计算不同PMU间的时空相似性,以及同一台PMU内不同量测间的相关性,并以此作为表征扰动事件和不良数据差异的特征。最后,通过局部离群概率算法对得到的综合度量指标进行分析,可实现在含有不良数据场景下的扰动事件准确检测。基于IEEE39系统,实际电网模型以及PMU实测数据,验证所提方法具有较好准确性、实时性以及泛化能力。展开更多
文摘作为一门新兴的学科领域,数据科学的科学性受到了关注且其科学问题未明确提出。文中从科学研究范式及方法论、可证伪性和可再现性、科学精神及快速迭代以及科学研究纲领及理论体系4个方面探讨了数据科学的“科学性”,并解答了为什么数据科学是一门新兴科学的问题。在此基础上,结合DIKW模型(DIKW Pyramid or Hierarchy)、DMP(Data-Model-Problem)模型、数据科学的统计学和机器学习方法论以及数据科学的流程与活动,提出了数据科学的7个核心科学问题:解释在先还是在后或无、问题对齐数据还是数据对齐问题、更加相信数据还是模型、更加重视性能还是可解释性、如何划分数据、如何用已知数据解决未知数据的问题、人在环路还是人出环路。最后,提出了数据科学研究的4点建议:聚焦数据科学本身的理论研究,推动数据的科学、技术和工程需要进一步分离和专业化,加强人工智能赋能的数据科学的理论与实践以及数据科学学科(Data Science as A Discipline)与学科中的数据科学(Data Science Within A Discipline)的联动。
文摘快速准确的电力系统扰动检测能够为后续扰动分析提供有效的指导信息,而广域测量系统(wide area measurement system,WAMS)的广泛应用为扰动检测提供了有力的数据基础。基于PMU量测数据,该文提出一种考虑PMU不良数据的扰动事件检测方法。首先分析PMU异常数据行为特性,揭示扰动事件与不良数据的差异性特征。进一步,提出一种基于差分Teager-Kaiser能量算子与3Sigma准则相结合的PMU异常数据初筛方法,避免了低强度扰动漏检和扰动的重复检测问题。接着,利用动态时间规整和最大互信息系数分别计算不同PMU间的时空相似性,以及同一台PMU内不同量测间的相关性,并以此作为表征扰动事件和不良数据差异的特征。最后,通过局部离群概率算法对得到的综合度量指标进行分析,可实现在含有不良数据场景下的扰动事件准确检测。基于IEEE39系统,实际电网模型以及PMU实测数据,验证所提方法具有较好准确性、实时性以及泛化能力。