摘要
在对部分已知基因序列与 EST 数据库比对搜索的匹配结果进行深入分析的基础上, 总结出了匹配程度检验、Gap 检验、包含性检验、长度检验等多种措施对 EST 匹配结果的真假进行判别, 并研制出了相应的分析软件 EDSAc1.0, 用于从基因序列的众多 EST 匹配中尽可能地筛选出真正相关的匹配.在此基础上, 该软件可进一步鉴定出基因序列中的外显子区域. 用标准测试数据集 HMR195 中的人类基因序列对其性能进行测试时, EDSAc1.0 鉴定出的蛋白编码区在核苷酸水平上的专一性 Sp 达到了0.997, 敏感度 Sn 达到了 0.88, 优于对国际同类软件 TAP 的对比测试结果. EDSAc1.0 已提供网上服务(http://infosci.hust.edu.cn).
出处
《科学通报》
EI
CAS
CSCD
北大核心
2004年第22期2305-2311,共7页
Chinese Science Bulletin