期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于CRISPR序列的致泻性大肠埃希菌跨种传播风险机器学习模型构建
1
作者 冯新元 赵佳雪 +5 位作者 龙金照 胡景妍 席岩岩 陈帅印 杨海燕 段广才 《中国畜牧兽医》 CAS CSCD 北大核心 2024年第9期4060-4065,共6页
【目的】基于CRISPR序列信息应用机器学习模型预测致泻性大肠埃希菌感染人的潜在风险,并以此识别具有人兽共患风险的高危菌株。【方法】从Enterobase数据库批量获取806株中国分离的致泻性大肠埃希菌基因组序列信息,提取CRISPR位点的间... 【目的】基于CRISPR序列信息应用机器学习模型预测致泻性大肠埃希菌感染人的潜在风险,并以此识别具有人兽共患风险的高危菌株。【方法】从Enterobase数据库批量获取806株中国分离的致泻性大肠埃希菌基因组序列信息,提取CRISPR位点的间隔序列构造特征,建立机器学习模型并使用交叉验证评价机器学习模型的预测效果。使用最佳模型输出致泻性大肠埃希菌的感染风险,并比较不同动物来源分离株对人的潜在感染风险。【结果】从806株菌株中共获取1093个间隔序列簇,人源分离株独有间隔序列簇为196个,动物源分离株独有间隔序列簇为291个,其中606个二者共享,线性判别分析发现人源和动物源菌株的间隔序列簇分布存在明显差异。以间隔序列簇作为特征,成功构建随机森林模型、逻辑斯谛回归模型、支持向量机模型和梯度提升树模型4种机器学习模型,其宿主预测准确率均超过0.82,受试者工作特征曲线下面积(area under receiver operating characteristic curve,AUC)值均接近0.9。最终确定随机森林模型的分类效果最佳,优化后模型预测准确率为0.844,AUC值为0.915。根据最佳模型输出的致泻性大肠埃希菌的感染风险,猪源分离株感染人的风险最高,羊源分离株感染人的风险较低,极少数禽源分离株可能具备感染人的潜力。【结论】基于间隔序列构建的机器学习模型对具有人兽共患风险的致泻性大肠埃希菌具备一定的识别能力,该模型为传染性疾病防控提供了新思路。 展开更多
关键词 间隔序列 机器学习 致泻性大肠埃希菌 跨种传播风险预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部