针对降维算法局部线性嵌入算法LLE(Local Linear Embedding)未能充分保留高维数据中邻域之间的结构的问题,提出了一种新的融合邻域分布属性的局部线性嵌入算法。该算法通过计算每个样本数据的邻域分布以及KL(Kullback-Leibler)散度度量...针对降维算法局部线性嵌入算法LLE(Local Linear Embedding)未能充分保留高维数据中邻域之间的结构的问题,提出了一种新的融合邻域分布属性的局部线性嵌入算法。该算法通过计算每个样本数据的邻域分布以及KL(Kullback-Leibler)散度度量不同邻域点与其中心样本各自的近邻分布差异,并利用其差值优化重构的权重系数,从而获得更精确的低维电机数据。通过可视化、Fisher测量和识别精度3个评价结果验证了该算法挖掘电机轴承检测数据高维结构的有效性。展开更多
为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之...为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之间的距离;然后,从信息几何的观点出发,对t分布随机近邻嵌入(t-stochastic neighbor embedding,t-SNE)进行改进,实现了新算法.真实文本数据集上的二维嵌入和分类实验的结果表明:FIMSNE的性能在总体上优于t-SNE、费希尔信息非参数嵌入(Fisher information nonparametric embedding,FINE)和主成分分析(principal components analysis,PCA).展开更多
文摘针对降维算法局部线性嵌入算法LLE(Local Linear Embedding)未能充分保留高维数据中邻域之间的结构的问题,提出了一种新的融合邻域分布属性的局部线性嵌入算法。该算法通过计算每个样本数据的邻域分布以及KL(Kullback-Leibler)散度度量不同邻域点与其中心样本各自的近邻分布差异,并利用其差值优化重构的权重系数,从而获得更精确的低维电机数据。通过可视化、Fisher测量和识别精度3个评价结果验证了该算法挖掘电机轴承检测数据高维结构的有效性。
文摘为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之间的距离;然后,从信息几何的观点出发,对t分布随机近邻嵌入(t-stochastic neighbor embedding,t-SNE)进行改进,实现了新算法.真实文本数据集上的二维嵌入和分类实验的结果表明:FIMSNE的性能在总体上优于t-SNE、费希尔信息非参数嵌入(Fisher information nonparametric embedding,FINE)和主成分分析(principal components analysis,PCA).