DNA N4-甲基胞嘧啶位点是DNA甲基化的代表类型.之前的实验方法存在耗时且昂贵的特点,因此开发高质量的预测方法是至关重要的.本文提出一种预测方法称之为i4mCGD.首先,利用三核苷酸组成、核苷酸的电子-离子相互作用伪电位和位置特异性三...DNA N4-甲基胞嘧啶位点是DNA甲基化的代表类型.之前的实验方法存在耗时且昂贵的特点,因此开发高质量的预测方法是至关重要的.本文提出一种预测方法称之为i4mCGD.首先,利用三核苷酸组成、核苷酸的电子-离子相互作用伪电位和位置特异性三核苷酸倾向,对DNA序列进行编码;其次,融合3种向量,利用互信息对融合后的特征空间进行筛选;最后,将最优特征子集输入到门控循环单元和深度神经网络组成的深度学习框架GRU_D中,利用十折交叉验证方法对模型进行评估.6个数据集上i4mCGD的预测准确率分别达到92.4%、91.9%、88.6%、93.7%、95.3%和97.3%.与其他先进方法相比,i4mCGD具有更优异的预测性能,是一种有效的4mC预测方法.展开更多
DNA N4-甲基胞嘧啶(N4-methylcytosine,4mC)是生物体中一种非常重要的表观遗传修饰,在生物过程中起着非常重要的作用。因此,本文提出了一种基于集成学习的方法来预测DNA N4-甲基胞嘧啶(N4-methylcytosine,4mC)位点,简称为4mC-DeepM。该...DNA N4-甲基胞嘧啶(N4-methylcytosine,4mC)是生物体中一种非常重要的表观遗传修饰,在生物过程中起着非常重要的作用。因此,本文提出了一种基于集成学习的方法来预测DNA N4-甲基胞嘧啶(N4-methylcytosine,4mC)位点,简称为4mC-DeepM。该方法同时使用了DNA序列组成信息和one-hot编码后的位置信息,将DNA序列组成信息、one-hot编码后的序列位置信息分别放入全连接网络和卷积神经网络,然后将它们的输出通过全连接网络进行集成,得到最终预测结果。展开更多
DNA N4-胞嘧啶甲基化(N4-methylcytosine,4mC)是一种重要的表观遗传修饰,能在基因表达、细胞修复、DNA复制及保护等方面发挥作用.机器学习算法在预测4mC位点时,一个重要的环节是特征提取,为更充分地提取数据特征,进一步提高4mC位点的预...DNA N4-胞嘧啶甲基化(N4-methylcytosine,4mC)是一种重要的表观遗传修饰,能在基因表达、细胞修复、DNA复制及保护等方面发挥作用.机器学习算法在预测4mC位点时,一个重要的环节是特征提取,为更充分地提取数据特征,进一步提高4mC位点的预测准确率,提出了一种基于双层卷积神经网络的4mC位点预测模型.首先,将序列数据进行特征编码,搭建具有双卷积层和双池化层的卷积神经网络模型,采用L2范式正则化避免模型过拟合,并采用10折交叉验证保证模型预测的稳定性;其次,对模型参数进行调试,选取预测能力较高的参数组合进行模型训练;最后,将模型的4mC位点预测能力与几种已有算法进行比较.结果表明,双层卷积神经网络模型具有较好的预测性能和鲁棒性,优于基于一般机器学习和单层卷积神经网络的4mC位点预测算法,有效提高了4mC位点的预测能力.展开更多