-
题名基于密度感知模式的生物序列分类算法
- 1
-
-
作者
胡耀炜
段磊
李岭
韩超
-
机构
四川大学计算机学院
四川大学华西公共卫生学院
四川大学生命科学学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第2期427-432,共6页
-
基金
国家自然科学基金资助项目(61572332
81473446)
+1 种基金
中国博士后科学基金特别资助项目(2016T90850)
中央高校基本科研业务费资助项目(2016SCU04A22)~~
-
文摘
针对现有的基于模式的序列分类算法对于生物序列存在分类精度不理想、模型训练时间长的问题,提出密度感知模式,并设计了基于密度感知模式的生物序列分类算法——BSC。首先,在生物序列中挖掘具有"密度感知"的频繁序列模式;然后,对挖掘出的频繁序列模式进行筛选、排序制定成分类规则;最后,通过分类规则对没有分类的序列进行分类预测。在4组真实生物序列中进行实验,分析了BSC算法参数对结果的影响并提供了推荐参数设置;同时分类结果表明,相比其他四种基于模式的分类算法,BSC算法在实验数据集上的准确率至少提高了2.03个百分点。结果表明,BSC算法有较高的生物序列分类精度和执行效率。
-
关键词
生物序列
序列分类
序列模式
密度感知模式
分类规则
-
Keywords
biological sequence
sequence classification
sequential pattern
density-aware pattern
classification rule
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-