-
题名融合多视角和多标签学习的RNA结合蛋白识别
被引量:1
- 1
-
-
作者
杨海涛
邓赵红
王士同
-
机构
江南大学人工智能与计算机学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2021年第11期2193-2205,共13页
-
基金
国家自然科学基金(61772239)
食品科学与技术国家重点实验室开放课题(SKLF-ZZB-201901)
+2 种基金
轻工业技术与工程国家一流学科计划(LITE2018-02,LITE2018-03)
江苏省六大人才高峰项目(XYDXX-056)
上海市“脑与类脑智能基础转化应用研究”市级重大科技专项(2018SHZDZX01)。
-
文摘
RNA结合蛋白(RBP)是一类伴随RNA调控代谢过程与RNA结合的蛋白质的总称。一种RBP可能存在多种靶标RNA,其表达缺陷会造成多种疾病。现有的方法大都是针对某种特定的RBP设计二分类模型,预测一条RNA是否可以与之结合。但这些方法没有考虑到不同RBP之间的结合相似性和关联性。对此,iDeepM利用多标签深度学习法进行了改进。此方法使用多标签技术和长短时记忆网络(LSTM),学习到不同RBP之间的结合相似性,预测一条给定的RNA与多种RBP的结合情况,但是该方法未能对RNA序列进行充分的特征学习和多标签学习,预测精度较低。延续iDeepM多标签的研究方法,提出新方法RRMVL,首次使用RNA序列视角、氨基酸序列视角、RNA序列语义视角和多间隙二肽成分视角组成多视角数据来处理多标签RBP识别问题。为了利用多视角数据的不同学习优势,融合四种视角提取到的深度特征,使用逻辑回归原理对它们进行多标签特征学习,将学习后的加权特征向量输入至链式多标签分类器中训练,使之达到最优多标签链式学习的效果。实验研究表明,融合多视角和多标签学习的RNA结合蛋白识别模型预测精度较之前使用单视角方法有了明显的提升。
-
关键词
多视角深度特征学习
多标签特征学习
最优多标签链式学习
RNA结合蛋白识别
-
Keywords
multi-view deep feature learning
multi-label feature learning
optimal multi-label chain learning
RNAbinding proteins recognition
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-