近年来深度学习在短文本聚类方面发挥巨大作用,最近提出的短文本聚类(Short Text Clustering, STC)算法在此方面取得不错的成效。为进一步提高聚类准确率并优化算法性能,基于指数函数提出改进的随机近邻嵌入算法。该算法用指数函数度量...近年来深度学习在短文本聚类方面发挥巨大作用,最近提出的短文本聚类(Short Text Clustering, STC)算法在此方面取得不错的成效。为进一步提高聚类准确率并优化算法性能,基于指数函数提出改进的随机近邻嵌入算法。该算法用指数函数度量样本点与聚类中心差距,放大不同特征差别,并在后期使用k-means++算法预先确定聚类中心与聚类数目。在Stackoverflow数据集上的实验证明,随机指数嵌入聚类模型(e-STC)在准确率与标准互信息上均优于原STC模型,准确率相对提高3.2%,互信息相对提高2.9%。展开更多
为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之...为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之间的距离;然后,从信息几何的观点出发,对t分布随机近邻嵌入(t-stochastic neighbor embedding,t-SNE)进行改进,实现了新算法.真实文本数据集上的二维嵌入和分类实验的结果表明:FIMSNE的性能在总体上优于t-SNE、费希尔信息非参数嵌入(Fisher information nonparametric embedding,FINE)和主成分分析(principal components analysis,PCA).展开更多
针对贝叶斯跟踪中目标状态的预测分布和后验分布,利用序列蒙特卡洛方法,基于多变量t-分布提出了一种新的粒子滤波算法,称之为t-分布粒子滤波器.为了根据样本估计目标状态的概率分布,提出了一种新的ECME算法,并嵌入到t-分布粒子滤波器中...针对贝叶斯跟踪中目标状态的预测分布和后验分布,利用序列蒙特卡洛方法,基于多变量t-分布提出了一种新的粒子滤波算法,称之为t-分布粒子滤波器.为了根据样本估计目标状态的概率分布,提出了一种新的ECME算法,并嵌入到t-分布粒子滤波器中.理论分析表明,在t-分布条件下,t-分布粒子滤波器是在样本数量上的渐近最优估计器.在机动目标跟踪实验中,比较了t-分布粒子滤波器、无色卡尔曼滤波(Unscented Kalm an filter)及自助式粒子滤波器(Bootstrap partic le filters)的跟踪精度.展开更多
为了提取被强噪声淹没的机械设备振动信号中蕴含的微弱故障特征,依据有用信号和噪声在空间分布特性的不同,将流形学习的方法引入到信号降噪中,提出一种将双树复小波包(DTCWPT)和t分布随机近邻嵌入(t-SNE)结合的去噪方法,充分利用了DTCWP...为了提取被强噪声淹没的机械设备振动信号中蕴含的微弱故障特征,依据有用信号和噪声在空间分布特性的不同,将流形学习的方法引入到信号降噪中,提出一种将双树复小波包(DTCWPT)和t分布随机近邻嵌入(t-SNE)结合的去噪方法,充分利用了DTCWPT分解的多尺度特性以及t-SNE的非线性降维能力。将振动信号进行双树复小波包分解,依据各尺度小波包系数Shannon熵值搜索最佳小波包基,利用提出的新的阈值函数,对最佳小波包基的小波包系数进行去噪并单支重构组成高维信号空间,然后,采用t-SNE提取高维空间的低维流形,对低维信号序列进一步采用阈值去噪,利用谱回归分析重构回一维信号序列。最后,通过对仿真信号与滚动轴承振动信号进行去噪,结果证实了方法具有良好的非线性去噪性能,将仿真信号的信噪比从-1提高到8.6 d B,并且能更有效的提取强噪声干扰下滚动轴承的故障特征频率。展开更多
文摘近年来深度学习在短文本聚类方面发挥巨大作用,最近提出的短文本聚类(Short Text Clustering, STC)算法在此方面取得不错的成效。为进一步提高聚类准确率并优化算法性能,基于指数函数提出改进的随机近邻嵌入算法。该算法用指数函数度量样本点与聚类中心差距,放大不同特征差别,并在后期使用k-means++算法预先确定聚类中心与聚类数目。在Stackoverflow数据集上的实验证明,随机指数嵌入聚类模型(e-STC)在准确率与标准互信息上均优于原STC模型,准确率相对提高3.2%,互信息相对提高2.9%。
文摘为提高文本分类的准确率,提出了费希尔信息度量随机近邻嵌入算法(Fisher information metric based on stochastic neighbor embedding,FIMSNE).首先,把文本的词频向量看作统计流形上的概率密度样本点,利用费希尔信息度量计算样本点之间的距离;然后,从信息几何的观点出发,对t分布随机近邻嵌入(t-stochastic neighbor embedding,t-SNE)进行改进,实现了新算法.真实文本数据集上的二维嵌入和分类实验的结果表明:FIMSNE的性能在总体上优于t-SNE、费希尔信息非参数嵌入(Fisher information nonparametric embedding,FINE)和主成分分析(principal components analysis,PCA).
文摘针对贝叶斯跟踪中目标状态的预测分布和后验分布,利用序列蒙特卡洛方法,基于多变量t-分布提出了一种新的粒子滤波算法,称之为t-分布粒子滤波器.为了根据样本估计目标状态的概率分布,提出了一种新的ECME算法,并嵌入到t-分布粒子滤波器中.理论分析表明,在t-分布条件下,t-分布粒子滤波器是在样本数量上的渐近最优估计器.在机动目标跟踪实验中,比较了t-分布粒子滤波器、无色卡尔曼滤波(Unscented Kalm an filter)及自助式粒子滤波器(Bootstrap partic le filters)的跟踪精度.
文摘为了提取被强噪声淹没的机械设备振动信号中蕴含的微弱故障特征,依据有用信号和噪声在空间分布特性的不同,将流形学习的方法引入到信号降噪中,提出一种将双树复小波包(DTCWPT)和t分布随机近邻嵌入(t-SNE)结合的去噪方法,充分利用了DTCWPT分解的多尺度特性以及t-SNE的非线性降维能力。将振动信号进行双树复小波包分解,依据各尺度小波包系数Shannon熵值搜索最佳小波包基,利用提出的新的阈值函数,对最佳小波包基的小波包系数进行去噪并单支重构组成高维信号空间,然后,采用t-SNE提取高维空间的低维流形,对低维信号序列进一步采用阈值去噪,利用谱回归分析重构回一维信号序列。最后,通过对仿真信号与滚动轴承振动信号进行去噪,结果证实了方法具有良好的非线性去噪性能,将仿真信号的信噪比从-1提高到8.6 d B,并且能更有效的提取强噪声干扰下滚动轴承的故障特征频率。