期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
结合多尺度卷积胶囊网络的植物lncRNA编码小肽预测
1
作者 胡鹤还 孟军 +1 位作者 赵思远 纪腾其 《郑州大学学报(理学版)》 北大核心 2022年第1期12-18,共7页
长非编码RNA(lncRNA)是一类不编码蛋白、长度大于200 nt的非编码RNA。然而,最近研究表明,部分lncRNA中含有不超过300 nt的短开放阅读框(sORFs),具备编码小肽的能力。这一发现使得sORFs编码小肽(SEPs)这一崭新的研究领域引起人们的重视... 长非编码RNA(lncRNA)是一类不编码蛋白、长度大于200 nt的非编码RNA。然而,最近研究表明,部分lncRNA中含有不超过300 nt的短开放阅读框(sORFs),具备编码小肽的能力。这一发现使得sORFs编码小肽(SEPs)这一崭新的研究领域引起人们的重视。目前,对SEPs的研究大多采用生物实验和传统机器学习方法。由于生物实验方法造价高、耗时长、传统机器学习涉及过多人工干预,提出一种结合多尺度卷积胶囊网络的深度学习模型,既能够充分提取序列特征,又通过胶囊间的连接进行特征聚类。采用五折交叉验证评估模型性能,在苔藓数据集上与单一深度学习模型和简单融合深度学习模型相比,取得较好的分类效果。另外,采用拟南芥、大豆两个物种的数据集进行独立测试,验证了模型具有良好的泛化能力。 展开更多
关键词 胶囊网络 长非编码RNA 短开放阅读框 小肽 预测
下载PDF
基于表示学习和深度森林的长链非编码RNA编码短肽预测模型 被引量:1
2
作者 纪腾其 孟军 +1 位作者 赵思远 胡鹤还 《计算机应用》 CSCD 北大核心 2021年第12期3614-3619,共6页
长链非编码RNA(lncRNA)中的小开放阅读框(sORFs)能够编码长度不超过100个氨基酸的短肽。针对短肽预测研究中lncRNA中的sORFs特征不鲜明且高可信度数据尚不充分的问题,提出一种基于表示学习的深度森林(DF)模型。首先,使用常规lncRNA特征... 长链非编码RNA(lncRNA)中的小开放阅读框(sORFs)能够编码长度不超过100个氨基酸的短肽。针对短肽预测研究中lncRNA中的sORFs特征不鲜明且高可信度数据尚不充分的问题,提出一种基于表示学习的深度森林(DF)模型。首先,使用常规lncRNA特征提取方法对sORFs进行编码;其次,通过自编码器(AE)进行表示学习来获得输入数据的高效表示;最后,训练DF模型实现对lncRNA编码短肽的预测。实验结果表明,该模型在拟南芥数据集上能够达到92.08%的准确率,高于传统机器学习模型、深度学习模型以及组合模型,且具有较好的稳定性;此外,在大豆与玉米数据集上进行的模型测试中,该模型的准确率分别能达到78.16%和74.92%,验证了所提模型良好的泛化能力。 展开更多
关键词 长链非编码RNA 小开放阅读框 短肽 表示学习 深度森林 预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部