摘要
提出一种基于多重解码器的自编码器模型,用于学习生物序列数据的表示,并使用k-means算法对序列的表示进行聚类.试验结果验证了提出的方法在DNA序列数据集上具有良好的性能.
In this paper, an autoencoder model based on multi-decoder is proposed to learn the representation of biological sequence data, and thenk-means is used to cluster the representation of sequences.Experimental results show that the proposed method has good performance on DNA sequence data sets.
作者
陈城
林劼
CHEN Cheng;LIN Jie(School of Mathematics and Statistics,Fujian Normal University,Fuzhou 350117,China)
出处
《福建师范大学学报(自然科学版)》
CAS
2022年第6期1-9,共9页
Journal of Fujian Normal University:Natural Science Edition
基金
国家自然科学基金资助项目(61472082)。
关键词
生物序列聚类
自编码器
表示学习
biological sequence clustering
autoencoder
representation learning