为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇...为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。展开更多
针对基于接收信号强度的位置指纹室内定位算法定位精度不高的问题,提出了一种均值层次聚类和自适应加权K近邻(weighted K nearest neighbor,WKNN)的室内定位算法。算法首先在设置的参考点上采集蓝牙信号强度构建离线指纹数据库,然后采...针对基于接收信号强度的位置指纹室内定位算法定位精度不高的问题,提出了一种均值层次聚类和自适应加权K近邻(weighted K nearest neighbor,WKNN)的室内定位算法。算法首先在设置的参考点上采集蓝牙信号强度构建离线指纹数据库,然后采用均值层次聚类方法将所有参考点根据各自之间的相似度分为n个类,滤除掉相似度较小的参考点,最后根据待定位点和参考点间的信号距离的相似度,计算出距离差的标准差来自适应确定K值,并进行位置估算。实验结果表明,本文提出的算法在定位精度上比WKNN、动态加权K近邻(enhanced weighted K nearest neighbor,EWKNN)方法分别提升了30.0%和18.0%,在定位实时性上比WKNN和EWKNN方法分别提高了19.2%和28.4%。将该算法用于室内物体定位,可以同时提高定位精度和定位实时性。展开更多
针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EK...针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。展开更多
文摘为了充分利用实际高速公路路段交通拥堵信息,更合理地聚类交通拥堵的内在规律和特征变化,提出自适应确定聚类中心C和类别K值(adaptive center and K-means value,ACK-Means)的聚类算法,进行高速公路拥堵路段聚类。ACK-Means算法借助簇类密度、簇类间距以及簇类强度,同时又考虑到数据样本的偶然性,对离群点进行合理分配,ACK-Means算法可实现自适应确定聚类中心C和类别K值。基于实际交通拥堵信息构建数据集,Python编程实现高速公路拥堵路段ACK-Means聚类,巧妙解决了高速公路拥堵路段聚类数目K和聚类中心C设定问题。聚类结果表明,ACK-Means算法实现高速公路拥堵路段无监督聚类,聚类结果完全基于实际的高速公路交通拥堵信息,具有更高的实用性。
文摘针对基于接收信号强度的位置指纹室内定位算法定位精度不高的问题,提出了一种均值层次聚类和自适应加权K近邻(weighted K nearest neighbor,WKNN)的室内定位算法。算法首先在设置的参考点上采集蓝牙信号强度构建离线指纹数据库,然后采用均值层次聚类方法将所有参考点根据各自之间的相似度分为n个类,滤除掉相似度较小的参考点,最后根据待定位点和参考点间的信号距离的相似度,计算出距离差的标准差来自适应确定K值,并进行位置估算。实验结果表明,本文提出的算法在定位精度上比WKNN、动态加权K近邻(enhanced weighted K nearest neighbor,EWKNN)方法分别提升了30.0%和18.0%,在定位实时性上比WKNN和EWKNN方法分别提高了19.2%和28.4%。将该算法用于室内物体定位,可以同时提高定位精度和定位实时性。
文摘针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法(Extension K Nearest Neighbor,EKNN)。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。