当前电网数字化转型升级,电力设备智能运维技术快速发展,在运维过程中积累了大量包含电网重要信息的电力设备缺陷文本。由于文本数据标签稀疏,以及描述语言的模糊性、差异性等问题,电力文本中的运维信息难以被有效挖掘。文章提出了一种...当前电网数字化转型升级,电力设备智能运维技术快速发展,在运维过程中积累了大量包含电网重要信息的电力设备缺陷文本。由于文本数据标签稀疏,以及描述语言的模糊性、差异性等问题,电力文本中的运维信息难以被有效挖掘。文章提出了一种针对电力设备缺陷文本的数据增强方法。首先,使用缺陷文本数据集微调预训练模型ERNIE(enhanced representation through knowledge integration),应用多阶段知识掩码策略将电气领域专业知识集成到对缺陷文本的动态编码中;然后在流形假设的基础上基于降噪自动编码器架构设计破坏函数和重建函数,遵循基于信息价值的掩码单元选择策略构建破坏函数,基于微调过的ERNIE构建重建函数,在“破坏-重建”过程中获得位于原始数据流形范围内的增强样本;其次对增强数据集基于影响函数和多样性度量进行数据选择,过滤掉数据质量差和重复度高的增强样本;最后通过多层训练框架,将增强数据应用于各种缺陷文本挖掘任务。算例基于真实设备巡检、检修记录构建了电力设备缺陷文本等级分类任务。结果表明,所提出的算法对缺陷文本挖掘效果有较大提升,并且可以广泛灵活地应用在多种电力设备缺陷文本挖掘任务中。展开更多
随着复杂系统信息化程度不断加深,业界对复杂系统不同领域数字孪生体中的异构数据的集成要求越来越高。然而,由于复杂系统领域不断升级,不同领域数字孪生体之间没有统一的数据集成标准,最后造成异构数据交换和使用困难,出现“信息孤岛...随着复杂系统信息化程度不断加深,业界对复杂系统不同领域数字孪生体中的异构数据的集成要求越来越高。然而,由于复杂系统领域不断升级,不同领域数字孪生体之间没有统一的数据集成标准,最后造成异构数据交换和使用困难,出现“信息孤岛”现象,严重阻碍了系统研发的信息化进程。为了提升复杂系统数字孪生体之间异构数据资源的利用率,本文提出认知线索的概念,采用开放式生命周期协作服务(open services for lifecycle collaboration,OSLC)规范对数字孪生体异构数据资源进行服务化,并结合基于本体的认知模型构建认知线索作为统一数据源,实现复杂系统数字孪生体的异构数据集成管理。最后本文以自动装填的机械系统为对象开展案例研究,成功验证了所提出方法的可行性和有效性。展开更多
文摘当前电网数字化转型升级,电力设备智能运维技术快速发展,在运维过程中积累了大量包含电网重要信息的电力设备缺陷文本。由于文本数据标签稀疏,以及描述语言的模糊性、差异性等问题,电力文本中的运维信息难以被有效挖掘。文章提出了一种针对电力设备缺陷文本的数据增强方法。首先,使用缺陷文本数据集微调预训练模型ERNIE(enhanced representation through knowledge integration),应用多阶段知识掩码策略将电气领域专业知识集成到对缺陷文本的动态编码中;然后在流形假设的基础上基于降噪自动编码器架构设计破坏函数和重建函数,遵循基于信息价值的掩码单元选择策略构建破坏函数,基于微调过的ERNIE构建重建函数,在“破坏-重建”过程中获得位于原始数据流形范围内的增强样本;其次对增强数据集基于影响函数和多样性度量进行数据选择,过滤掉数据质量差和重复度高的增强样本;最后通过多层训练框架,将增强数据应用于各种缺陷文本挖掘任务。算例基于真实设备巡检、检修记录构建了电力设备缺陷文本等级分类任务。结果表明,所提出的算法对缺陷文本挖掘效果有较大提升,并且可以广泛灵活地应用在多种电力设备缺陷文本挖掘任务中。
文摘随着复杂系统信息化程度不断加深,业界对复杂系统不同领域数字孪生体中的异构数据的集成要求越来越高。然而,由于复杂系统领域不断升级,不同领域数字孪生体之间没有统一的数据集成标准,最后造成异构数据交换和使用困难,出现“信息孤岛”现象,严重阻碍了系统研发的信息化进程。为了提升复杂系统数字孪生体之间异构数据资源的利用率,本文提出认知线索的概念,采用开放式生命周期协作服务(open services for lifecycle collaboration,OSLC)规范对数字孪生体异构数据资源进行服务化,并结合基于本体的认知模型构建认知线索作为统一数据源,实现复杂系统数字孪生体的异构数据集成管理。最后本文以自动装填的机械系统为对象开展案例研究,成功验证了所提出方法的可行性和有效性。