-
题名基于改进的大间隔最近邻胰腺单细胞分类方法
- 1
-
-
作者
奚紫怡
鲁佳宇
陈卓
相洁
王彬
-
机构
太原理工大学信息与计算机学院
-
出处
《太原理工大学学报》
CAS
北大核心
2023年第5期812-819,共8页
-
基金
国家自然科学基金资助项目(62176177)。
-
文摘
【目的】细胞类型鉴定是单细胞RNA测序的关键步骤之一,存在单细胞RNA测序数据分类准确率较低及各细胞类型距离特征度量不足的问题。【方法】提出一种基于多相似性损失函数(Multi Similarity Loss,MSL)的大间隔最近邻(Large Margin Nearest Neighbor,LMNN)单细胞分类方法。多相似性损失从多个角度衡量相似性,解决了LMNN算法的三元组损失函数训练样本较小时样本对之间关系利用率不高的问题,从而提升单细胞分类效果。【结果】在胰腺单细胞数据集baron_human和segerstolpe上的实验表明,基于MSL-LMNN的分类准确率高于主要度量学习方法,而且与随机森林结合的准确率达到0.96,较现有单细胞分类方法有所提升。【结论】提出的MSL-LMNN能够准确有效地识别胰腺单细胞测序数据细胞类型,具有一定的应用价值。
-
关键词
胰腺单细胞数据
大间隔最近邻
多相似性损失函数
随机森林
-
Keywords
pancreatic single cell data
large margin nearest neighbor
multi similarity loss
random forest
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-