现有用户画像方法缺乏不同粒度文本信息表示,且特征提取阶段存在噪声,导致构建画像不够准确。针对以上问题,提出一种融合多粒度信息的用户画像生成方法(user profile based on multi-granularity information fusion,UP-MGIF)。首先,该...现有用户画像方法缺乏不同粒度文本信息表示,且特征提取阶段存在噪声,导致构建画像不够准确。针对以上问题,提出一种融合多粒度信息的用户画像生成方法(user profile based on multi-granularity information fusion,UP-MGIF)。首先,该方法在嵌入层融合字粒度、词粒度表示向量以扩充特征内容;其次,在改进双向门控循环单元网络基础上,结合降噪自编码器和注意力机制设计一种特征提取混合模型Bi-GRU-DAE-Attention,实现特征降噪和语义增强;最后,将鲁棒性强的特征向量输入到分类器中实现用户画像生成。实验表明,该用户画像生成方法在医疗和互联网两个画像数据集上的分类准确率高于其他基线方法,并通过消融实验验证了各个模块的有效性。展开更多
近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检...近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检测的策略来为K-prototype算法选择初始中心,并提出一种新的混合型数据聚类初始化算法(initialization of K-prototype clustering based on outlier detection and density,IKP-ODD)。给定一个候选对象,IKP-ODD通过计算其距离离群因子、加权密度以及与已有初始中心之间的加权距离来判断候选对象是否是一个初始中心。IKP-ODD通过采用距离离群因子和加权密度,防止选择离群点作为初始中心。在计算对象的加权密度以及对象之间的加权距离时,采用邻域粗糙集中的粒度邻域熵来计算每一个属性的重要性,并根据属性重要性的大小为不同属性赋予不同的权重,有效地反映不同属性之间的差异性。在多个UCI数据集上的实验表明,相对于现有的初始化方法,IKP-ODD能够更好地解决K-prototype聚类的初始化问题。展开更多
面向“30·60”双碳目标,矿区能源利用方式的绿色、经济、高效转型成为我国能源革命的迫切需求。西部矿区拥有丰富的可再生能源资源禀赋,但仍面临着可再生能源就地消纳困难,电力设备投资成本高、利用率低以及外送输电通道有限的困...面向“30·60”双碳目标,矿区能源利用方式的绿色、经济、高效转型成为我国能源革命的迫切需求。西部矿区拥有丰富的可再生能源资源禀赋,但仍面临着可再生能源就地消纳困难,电力设备投资成本高、利用率低以及外送输电通道有限的困难。为提升矿区用能清洁化程度,提升矿区能源供给的稳定性与可靠性,增强矿区对外部电网的支撑能力,提出全清洁能源下的高品质矿区能源系统(High-quality Coal Mine Energy System,HCMES)及其配置优化方法。首先,考虑西部矿山综合能源系统的负荷特点与伴生能源利用,结合可再生能源发电与废弃矿井抽水蓄能,构建全清洁能源下的HCMES架构。其次,考虑到矿区生产全流程负荷的需求响应能力,考虑系统的能量平衡约束,提出全清洁能源下的高品质矿区能源系统优化配置模型。最后,以系统年平均综合成本最小化为目标,将原问题转化为混合整数线性规划模型,求解生成高品质矿区能源系统优化配置方案。以我国西部某年产煤量1200万t的矿区实际数据为实例,验证所提模型与方法的有效性,并分析可再生能源出力与生产负荷需求不确定性对系统优化配置结果的影响。算例仿真设置了4种矿区能源系统配置方式:不配置储能、配置抽水蓄能、配置电化学储能、配置抽水蓄能(不外购电能)。结果表明,所提出的HCMES相较于其他配置方式可减少电气一次设备投资11.11%,相较于方式3可降低年平均综合成本7.91%,且最多可减少矿区生产用能总二氧化碳排放量91.17%。展开更多
文摘现有用户画像方法缺乏不同粒度文本信息表示,且特征提取阶段存在噪声,导致构建画像不够准确。针对以上问题,提出一种融合多粒度信息的用户画像生成方法(user profile based on multi-granularity information fusion,UP-MGIF)。首先,该方法在嵌入层融合字粒度、词粒度表示向量以扩充特征内容;其次,在改进双向门控循环单元网络基础上,结合降噪自编码器和注意力机制设计一种特征提取混合模型Bi-GRU-DAE-Attention,实现特征降噪和语义增强;最后,将鲁棒性强的特征向量输入到分类器中实现用户画像生成。实验表明,该用户画像生成方法在医疗和互联网两个画像数据集上的分类准确率高于其他基线方法,并通过消融实验验证了各个模块的有效性。
文摘近年来,混合型数据的聚类问题受到广泛关注。作为处理混合型数据的一种有效方法,K-prototype聚类算法在初始化聚类中心时通常采用随机选取的策略,然而这种策略在很多实际应用中难以保证聚类结果的质量。针对上述问题,采用基于离群点检测的策略来为K-prototype算法选择初始中心,并提出一种新的混合型数据聚类初始化算法(initialization of K-prototype clustering based on outlier detection and density,IKP-ODD)。给定一个候选对象,IKP-ODD通过计算其距离离群因子、加权密度以及与已有初始中心之间的加权距离来判断候选对象是否是一个初始中心。IKP-ODD通过采用距离离群因子和加权密度,防止选择离群点作为初始中心。在计算对象的加权密度以及对象之间的加权距离时,采用邻域粗糙集中的粒度邻域熵来计算每一个属性的重要性,并根据属性重要性的大小为不同属性赋予不同的权重,有效地反映不同属性之间的差异性。在多个UCI数据集上的实验表明,相对于现有的初始化方法,IKP-ODD能够更好地解决K-prototype聚类的初始化问题。
文摘面向“30·60”双碳目标,矿区能源利用方式的绿色、经济、高效转型成为我国能源革命的迫切需求。西部矿区拥有丰富的可再生能源资源禀赋,但仍面临着可再生能源就地消纳困难,电力设备投资成本高、利用率低以及外送输电通道有限的困难。为提升矿区用能清洁化程度,提升矿区能源供给的稳定性与可靠性,增强矿区对外部电网的支撑能力,提出全清洁能源下的高品质矿区能源系统(High-quality Coal Mine Energy System,HCMES)及其配置优化方法。首先,考虑西部矿山综合能源系统的负荷特点与伴生能源利用,结合可再生能源发电与废弃矿井抽水蓄能,构建全清洁能源下的HCMES架构。其次,考虑到矿区生产全流程负荷的需求响应能力,考虑系统的能量平衡约束,提出全清洁能源下的高品质矿区能源系统优化配置模型。最后,以系统年平均综合成本最小化为目标,将原问题转化为混合整数线性规划模型,求解生成高品质矿区能源系统优化配置方案。以我国西部某年产煤量1200万t的矿区实际数据为实例,验证所提模型与方法的有效性,并分析可再生能源出力与生产负荷需求不确定性对系统优化配置结果的影响。算例仿真设置了4种矿区能源系统配置方式:不配置储能、配置抽水蓄能、配置电化学储能、配置抽水蓄能(不外购电能)。结果表明,所提出的HCMES相较于其他配置方式可减少电气一次设备投资11.11%,相较于方式3可降低年平均综合成本7.91%,且最多可减少矿区生产用能总二氧化碳排放量91.17%。