摘要
大规模蛋白质组表达谱研究的蛋白质鉴定一般采取基于数据库搜索的策略,因此数据库的选择及搜索策略在蛋白质鉴定中非常重要。现有的人类蛋白质数据库远不够完善,而从其他物种的蛋白质数据库中所能得到的补充非常有限,但人类基因组数据库中却可能存在很大的补充空间。在对国际人类蛋白质数据库充分调研、比较的基础上,提出了一种分步搜索的策略。这种策略首先利用一个质量较高、覆盖率相对较大的非冗余数据库进行基本鉴定,随后利用其他蛋白和核酸数据库进行补充鉴定和新蛋白挖掘。该策略能有效地鉴定尽可能多的高可靠蛋白,并能进一步充分利用质谱数据进行补充鉴定和新蛋白挖掘,对大规模蛋白质组表达谱研究具有重要的意义。
Widely used method of protein identification for high-throughout proteome expression profile studies was database-dependent, so the selection of databases for the protein identification was very important. Despite the deficiency of available human protein databases, the complementarity of human proteins could be got mainly from human genome but not from the protein databases of other organisms. According to the comparison of the current protein databases from different aspects, IPI was recommended for the basic identification for the studies of human proteome expression profile, and other human protein or nucleic acid databases were needed for the complementary identification and novel protein mining.
出处
《遗传》
CAS
CSCD
北大核心
2005年第5期687-693,共7页
Hereditas(Beijing)
基金
国家863计划(编号:2002BA711A11
2004BA711A21)
国家973计划(编号:2001CB510209)
北京市科技计划项目(编号:H030230280590)
国家自然科学基金资助(创新研究群体科学基金)(编号:321003)~~
关键词
蛋白质组
蛋白质鉴定
蛋白质数据库
质谱
proteome
protein identification
protein database
mass spectrum