期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
gFACs:Gene Filtering,Analysis,and Conversion to Unify Genome Annotations Across Alignment and Gene Prediction Frameworks 被引量:3
1
作者 Madison Caballero Jill Wegrzyn 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2019年第3期305-310,共6页
Published genomes frequently contain erroneous gene models that represent issues associated with identification of open reading frames,start sites,splice sites,and related structural features.The source of these incon... Published genomes frequently contain erroneous gene models that represent issues associated with identification of open reading frames,start sites,splice sites,and related structural features.The source of these inconsistencies is often traced back to integration across text file formats designed to describe long read alignments and predicted gene structures.In addition,the majority of gene prediction frameworks do not provide robust downstream filtering to remove problematic gene annotations,nor do they represent these annotations in a format consistent with current file standards.These frameworks also lack consideration for functional attributes,such as the presence or absence of protein domains that can be used for gene model validation.To provide oversight to the increasing number of published genome annotations,we present a software package,the Gene Filtering,Analysis,and Conversion(gFACs),to filter,analyze,and convert predicted gene models and alignments.The software operates across a wide range of alignment,analysis,and gene prediction files with a flexible framework for defining gene models with reliable structural and functional attributes.gFACs supports common downstream applications,including genome browsers,and generates extensive details on the filtering process,including distributions that can be visualized to further assess the proposed gene space.gFACs is freely available and implemented in Perl with support from BioPerl libraries at https://gitlab.com/PlantGenomicsLab/gFACs. 展开更多
关键词 genome annotation BIOINFORMATICS Protein annotation gene prediction ALIGNMENT
原文传递
解磷真菌产紫青霉菌SW-10全基因组测序及功能分析 被引量:2
2
作者 刘峰 张培雨 +5 位作者 姜雯 刘树堂 孙雪芳 赵子铉 刘湘 孙青 《山东农业科学》 北大核心 2023年第9期1-9,共9页
磷是植物生长必需的营养元素之一,但土壤的固化作用等导致土壤有效磷只占土壤全磷含量的1%~5%。解磷真菌通过分泌有机酸及磷酸酶等能持续、稳定提高土壤磷素的有效性并促进作物对磷素的吸收。本课题组前期分离鉴定出一株对难溶性无机磷... 磷是植物生长必需的营养元素之一,但土壤的固化作用等导致土壤有效磷只占土壤全磷含量的1%~5%。解磷真菌通过分泌有机酸及磷酸酶等能持续、稳定提高土壤磷素的有效性并促进作物对磷素的吸收。本课题组前期分离鉴定出一株对难溶性无机磷和有机磷均具有较好解磷效果的产紫青霉菌(Penicillium purpurogenum),将其命名为SW-10。本研究采用Illumina NovaSeq测序平台对菌株SW-10进行全基因组测序,完成基因组拼装后进行基因预测、功能注释和解磷相关基因分析。结果表明,菌株SW-10基因组大小为29.1 Mb,总基因序列长度15597887 bp,共预测到9195个编码基因,基因平均长度1696 bp。在GO、KEGG和KOG数据库中分别有6608、3878个和8817个基因得到注释;鉴定出多个与解磷相关的基因,包括柠檬酸合成酶基因2个、苹果酸脱氢酶基因2个、碱性磷酸酶基因2个、酸性磷酸酶基因7个、植酸酶基因1个和磷酸盐转运蛋白基因2个;利用hmmscan软件预测出菌株SW-10基因组序列中存在碳水化合物活性酶(CAZyme)基因共计460个,推测其具有较好的细胞壁水解酶活性。本研究结果可为后续产紫青霉菌解磷相关基因的挖掘利用及其遗传信息的改良提供相关理论依据,同时为其它解磷真菌的基因组学研究提供参考信息。 展开更多
关键词 产紫青霉菌SW-10 解磷 全基因组测序 基因预测 功能注释
下载PDF
SCGPred:A Score-based Method for Gene Structure Prediction by Combining Multiple Sources of Evidence
3
作者 Xiao Li Qingan Ren +3 位作者 Yang Weng Haoyang Cai Yunmin Zhu Yizheng Zhang 《Genomics, Proteomics & Bioinformatics》 SCIE CAS CSCD 2008年第3期175-185,共11页
Predicting protein-coding genes still remains a significant challenge. Although a variety of computational programs that use commonly machine learning methods have emerged, the accuracy of predictions remains a low le... Predicting protein-coding genes still remains a significant challenge. Although a variety of computational programs that use commonly machine learning methods have emerged, the accuracy of predictions remains a low level when implementing in large genomic sequences. Moreover, computational gene finding in newly se- quenced genomes is especially a difficult task due to the absence of a training set of abundant validated genes. Here we present a new gene-finding program, SCGPred, to improve the accuracy of prediction by combining multiple sources of evidence. SCGPred can perform both supervised method in previously well-studied genomes and unsupervised one in novel genomes. By testing with datasets composed of large DNA sequences from human and a novel genome of Ustilago maydi, SCGPred gains a significant improvement in comparison to the popular ab initio gene predictors. We also demonstrate that SCGPred can significantly improve prediction in novel genomes by combining several foreign gene finders with similarity alignments, which is superior to other unsupervised methods. Therefore, SCGPred can serve as an alternative gene-finding tool for newly sequenced eukaryotic genomes. The program is freely available at http://bio.scu.edu.cn/SCGPred/. 展开更多
关键词 gene finding gene prediction genome annotation supervised method unsupervised method combiner method
原文传递
利用蛋白质同源性搜索检验细菌预测基因的起始位点
4
作者 夏伟 周大为 李炜疆 《食品与生物技术学报》 CAS CSCD 北大核心 2012年第8期865-870,共6页
细菌基因组中基因密度高、结构相对简单,基因预测可以达到较高的准确度。细菌基因预测的一个重要问题是难以准确判断基因起始位点,目前应用最广的基因组自动注释方法给出的结果中,占总数约1/5的基因的起始位点有分歧,尚无利用基因结构... 细菌基因组中基因密度高、结构相对简单,基因预测可以达到较高的准确度。细菌基因预测的一个重要问题是难以准确判断基因起始位点,目前应用最广的基因组自动注释方法给出的结果中,占总数约1/5的基因的起始位点有分歧,尚无利用基因结构的统计特征改进起始位点预测的有效方法。通过蛋白质同源性搜索,为推断起始位点提供新的线索。对氧化葡萄糖酸杆菌Gluconobacter oxydans 621H全基因组的分析表明,这种方法可以实质性改善起始位点预测结果。 展开更多
关键词 基因组注释 基因预测 同源性搜索
下载PDF
雨生红球藻低覆盖度基因组草图分析 被引量:1
5
作者 陈军 郑华军 +2 位作者 刘亚铭 赵国屏 秦松 《中国生物工程杂志》 CAS CSCD 北大核心 2018年第7期21-28,共8页
开展雨生红球藻基因组测序研究,对于解读绿藻起源与进化及生物逆境胁迫响应机制,以及推动雨生红球藻产业发展都具有重要意义。利用Illumina Hiseq 2500对雨生红球藻(Haematococcus pluvialis)进行高通量测序,获得低覆盖度全基因组草... 开展雨生红球藻基因组测序研究,对于解读绿藻起源与进化及生物逆境胁迫响应机制,以及推动雨生红球藻产业发展都具有重要意义。利用Illumina Hiseq 2500对雨生红球藻(Haematococcus pluvialis)进行高通量测序,获得低覆盖度全基因组草图。通过计算k-mer分布预测该基因组草图大小约为547Mb,GC含量为59.2%,为纯合或单倍体。共得到11 059个预测基因,平均基因长度为1 711bp,平均CDS长度为681bp;平均每个基因包含3.2个外显子,外显子的平均长度为353bp。代谢通路分析表明,具有完整的糖酵解、三羧酸循环、磷酸戊糖途径、嘌呤和嘧啶合成等基本代谢通路。 展开更多
关键词 雨生红球藻 基因组测序 基因预测 功能注释
原文传递
一株出芽短梗霉全基因组序列测定及其分析 被引量:1
6
作者 张高川 王大慧 卫功元 《基因组学与应用生物学》 CAS CSCD 北大核心 2017年第11期4693-4700,共8页
出芽短梗霉因其发酵产物种类的多样性而具有广阔的工业应用前景。本研究利用下一代测序技术,对一株高产普鲁兰多糖的出芽短梗霉菌株(Aureobasidium pullulans CCTCC M 2012259)全基因组进行测序、组装和生物信息学分析。研究表明,该菌... 出芽短梗霉因其发酵产物种类的多样性而具有广阔的工业应用前景。本研究利用下一代测序技术,对一株高产普鲁兰多糖的出芽短梗霉菌株(Aureobasidium pullulans CCTCC M 2012259)全基因组进行测序、组装和生物信息学分析。研究表明,该菌株的基因组全长约为26.37 Mb,共包含36条scaffolds和76 contigs,Gen Bank登录号:PRJNA350822。利用Gene Mark-ES软件对该基因组进行基因预测,共得到10 069个编码蛋白的基因。使用Blastp将其与Uniprot KB数据库中所有已知真菌蛋白进行比对,发现有6 218个预测蛋白与Uniprot KB数据库中的4 925个已知蛋白高度相似。利用DAVID工具对这些蛋白进行GO基因功能注释、KEGG通路注释和蛋白酶分析,分别注释得到4 444条GO功能条目、1 566条KEGG通路条目和1 740条蛋白酶信息。测定与分析为今后针对出芽短梗霉的功能基因挖掘以及分子遗传改造等工作的开展奠定了坚实的理论基础。 展开更多
关键词 出芽短梗霉 全基因组 测序 基因预测 功能注释
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部