当前分布式光伏系统短期发电功率预测结构多设定为目标式,预测范围在实际发电环境下受限,导致平均绝对预测误差增加。为此设计基于利用层次方法的平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering Using Hierarchies,BIR...当前分布式光伏系统短期发电功率预测结构多设定为目标式,预测范围在实际发电环境下受限,导致平均绝对预测误差增加。为此设计基于利用层次方法的平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering Using Hierarchies,BIRCH)的分布式光伏系统短期发电功率预测方法。首先,明确预测指标,采用多层级的方式设计预测结构;其次,结合BIRCH原理,设计发电功率预测模型;最后,采用梯度回归处理的方式来实现最终预测。测试结果表明,对比传统变分模态分解-麻雀搜索算法-反向传播(Variational Mode Decomposition-Sparrow Search Algorithm-Back Propagation,VMD-SSA-BP)光伏系统短期发电功率预测小组、传统时序动态回归光伏系统短期发电功率预测小组,此次所设计的方法得出的平均绝对预测误差被较好地控制在2.1以下,预测效果更佳,针对性更强,误差可控,具有实际的应用价值。展开更多
平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,...平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系;此外,算法在分裂节点时,选取距离最远的2个聚类特征作为子簇,其他聚类特征会根据与这2个聚类特征之间的距离关系分裂为另外的子簇,造成处于簇与簇之间的样本数据错误分类,这样会忽略聚类特征之间的关系。针对BIRCH算法的这2个问题,提出了基于阈值的自适应算法,用于解决原算法统一空间阈值的问题;并在针对聚类特征关系的问题上,结合朴素贝叶斯算法对原算法进行改进。对改进后BIRCH算法与传统的算法进行仿真实验。结果表明,改进算法在损失效率的情况下,聚类效果得到了明显的改善,并且与其他算法相比,所提算法具有不错的表现性,而且具有跨数据集的鲁棒性。展开更多
为解决实时分析处理的海洋Argo浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题,提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法DBIRCH(Density-Based Balanced Iterative Reducing and Clust...为解决实时分析处理的海洋Argo浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题,提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法DBIRCH(Density-Based Balanced Iterative Reducing and Clustering Using Hierarchies)。该算法通过使用新引入的参数密度阈值修正因子,动态的更新限制CF(Clustering Feature)树生长的约束系数子空间阈值,同时结合密度关联思想在不同邻域内多次建立CF树且合并,最终以核心CF树子节点为聚类结果输出,避免了BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)算法对参数的过度依赖,同时因能处理任意形状簇从而提升了数据处理的整体鲁棒性,提高了处理Argo剖面监测数据的时效性和算法的整体吞吐速度。为测试算法的综合性能,使用真实Argo浮标剖面实时监测数据集,并根据不同的参数对算法做出多组对比实验,同时使用不同评价指标对算法从运行时间和聚类准确率上进行综合评估,从全局角度分析该算法在DBSCAN(Density-Based Spatial Clustering of Applications with Noise)、BIRCH及DBIRCH 3种不同算法中综合聚类性能最优。实验结果表明,在3种算法中,BIRCH算法运算速度最快,但准确率最低;DBSCAN算法聚类性能高于BIRCH算法,但运算速度最慢;改进的DBIRCH算法运算效率略低于BIRCH算法,但聚类准确率最高。展开更多
为了提升文本聚类效果,改善传统聚类算法在参数设定,稳定性等方面存在的不足,提出新的文本聚类算法TCBIBK(a Text Clustering algorithm Based on Improved BIRCH and K-nearest neighbor)。该算法以BIRCH聚类算法为原型,聚类过程中除...为了提升文本聚类效果,改善传统聚类算法在参数设定,稳定性等方面存在的不足,提出新的文本聚类算法TCBIBK(a Text Clustering algorithm Based on Improved BIRCH and K-nearest neighbor)。该算法以BIRCH聚类算法为原型,聚类过程中除判断文本对象与簇的距离外,增加判断簇与簇之间的距离,采取主动的簇合并或分裂,设置动态的阈值。同时结合KNN分类算法,在保证良好聚类效率前提下提升聚类稳定性,将TCBIBK算法应用于文本聚类,能够提高文本聚类效果。对比实验结果表明,该算法聚类有效性与稳定性都得到较大提高。展开更多
文摘平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系;此外,算法在分裂节点时,选取距离最远的2个聚类特征作为子簇,其他聚类特征会根据与这2个聚类特征之间的距离关系分裂为另外的子簇,造成处于簇与簇之间的样本数据错误分类,这样会忽略聚类特征之间的关系。针对BIRCH算法的这2个问题,提出了基于阈值的自适应算法,用于解决原算法统一空间阈值的问题;并在针对聚类特征关系的问题上,结合朴素贝叶斯算法对原算法进行改进。对改进后BIRCH算法与传统的算法进行仿真实验。结果表明,改进算法在损失效率的情况下,聚类效果得到了明显的改善,并且与其他算法相比,所提算法具有不错的表现性,而且具有跨数据集的鲁棒性。
文摘为解决实时分析处理的海洋Argo浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题,提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法DBIRCH(Density-Based Balanced Iterative Reducing and Clustering Using Hierarchies)。该算法通过使用新引入的参数密度阈值修正因子,动态的更新限制CF(Clustering Feature)树生长的约束系数子空间阈值,同时结合密度关联思想在不同邻域内多次建立CF树且合并,最终以核心CF树子节点为聚类结果输出,避免了BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)算法对参数的过度依赖,同时因能处理任意形状簇从而提升了数据处理的整体鲁棒性,提高了处理Argo剖面监测数据的时效性和算法的整体吞吐速度。为测试算法的综合性能,使用真实Argo浮标剖面实时监测数据集,并根据不同的参数对算法做出多组对比实验,同时使用不同评价指标对算法从运行时间和聚类准确率上进行综合评估,从全局角度分析该算法在DBSCAN(Density-Based Spatial Clustering of Applications with Noise)、BIRCH及DBIRCH 3种不同算法中综合聚类性能最优。实验结果表明,在3种算法中,BIRCH算法运算速度最快,但准确率最低;DBSCAN算法聚类性能高于BIRCH算法,但运算速度最慢;改进的DBIRCH算法运算效率略低于BIRCH算法,但聚类准确率最高。
文摘为了提升文本聚类效果,改善传统聚类算法在参数设定,稳定性等方面存在的不足,提出新的文本聚类算法TCBIBK(a Text Clustering algorithm Based on Improved BIRCH and K-nearest neighbor)。该算法以BIRCH聚类算法为原型,聚类过程中除判断文本对象与簇的距离外,增加判断簇与簇之间的距离,采取主动的簇合并或分裂,设置动态的阈值。同时结合KNN分类算法,在保证良好聚类效率前提下提升聚类稳定性,将TCBIBK算法应用于文本聚类,能够提高文本聚类效果。对比实验结果表明,该算法聚类有效性与稳定性都得到较大提高。