香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个read...香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个reads片段,总碱基数为4.35 G。利用组装软件,对获得的高质量序列进行组装,共得到104,636个Unigene,平均长度为784 nt,N50为1,702。将Unigene序列与公共数据库进行比对,28,766个Unigenes获得了注释。其中26,856个Unigene在NR蛋白数据库中获得注释,24,003个Unigenes在NT数据库中获得注释,21,401个Unigene在Swiss-Prot蛋白数据库中获得注释,16,137个Unigene在COG数据库中获得注释,11,410个Unigene在GO数据库中获得注释。根据KEGG注释信息,18,564个Unigene被划分到256个代谢途径中。SSR位点搜索发现,在4,217个Unigene中含有4,706个SSR位点。分析所获得的转录组数据,将为香榧功能基因的克隆,基因的表达,指纹图谱构建和分子标记辅助选育奠定基础。展开更多
文摘香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个reads片段,总碱基数为4.35 G。利用组装软件,对获得的高质量序列进行组装,共得到104,636个Unigene,平均长度为784 nt,N50为1,702。将Unigene序列与公共数据库进行比对,28,766个Unigenes获得了注释。其中26,856个Unigene在NR蛋白数据库中获得注释,24,003个Unigenes在NT数据库中获得注释,21,401个Unigene在Swiss-Prot蛋白数据库中获得注释,16,137个Unigene在COG数据库中获得注释,11,410个Unigene在GO数据库中获得注释。根据KEGG注释信息,18,564个Unigene被划分到256个代谢途径中。SSR位点搜索发现,在4,217个Unigene中含有4,706个SSR位点。分析所获得的转录组数据,将为香榧功能基因的克隆,基因的表达,指纹图谱构建和分子标记辅助选育奠定基础。