期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于多源数据的在线数据评估技术 被引量:7
1
作者 邱健 牛琳琳 +3 位作者 于海承 贺静波 丁平 刘宇星 《电网技术》 EI CSCD 北大核心 2013年第9期2658-2663,共6页
在线数据模型及电网参数是电网调度一体化运行计算分析的基础。考虑多源数据的特征,提出了基于多源数据的在线数据评估方法。采用动态智能映射策略方法进行在线数据模型评估,进而利用模型评估的结论结合SCADA/EMS的数据给出电网参数评... 在线数据模型及电网参数是电网调度一体化运行计算分析的基础。考虑多源数据的特征,提出了基于多源数据的在线数据评估方法。采用动态智能映射策略方法进行在线数据模型评估,进而利用模型评估的结论结合SCADA/EMS的数据给出电网参数评估方法;最后利用电力系统高级计算的相关知识对在线数据进行调整。实际算例证明该方法能够对在线数据进行全面的评估及校核,并具有较高的计算精度,能为智能电网技术支持系统在线数据实用化分析提供一种可行的方法。 展开更多
关键词 多源数据映射策略 参数评估 在线数据评估 在线数据实用化
下载PDF
一种针对RNA-Seq数据的基因异构体表达水平计算方法 被引量:3
2
作者 刘学军 李蒙 张礼 《中国生物医学工程学报》 CAS CSCD 北大核心 2013年第4期454-463,共10页
RNA-Seq是基于高通量测序技术对转录组进行研究的实验技术,被大量用来进行基因的选择性剪切研究。针对RNA-Seq数据中读段对基因异构体的多源映射以及读段在基因参考序列上呈非均匀分布的问题,基于文本数据分析领域流的LDA(latent dirich... RNA-Seq是基于高通量测序技术对转录组进行研究的实验技术,被大量用来进行基因的选择性剪切研究。针对RNA-Seq数据中读段对基因异构体的多源映射以及读段在基因参考序列上呈非均匀分布的问题,基于文本数据分析领域流的LDA(latent dirichlet allocation)模型,提出了一个新的基因异构体表达值计算方法 LDAseq。利用已知的基因异构体注释信息对模型参数进行约束,解决读段对基因异构体的多源映射问题;通过引入固定长度的"探针"将基因参考序列进行分段,解决读段在整个基因参考序列上呈非均匀分布的问题。将LDAseq应用到一个小鼠数据集和一个人类乳腺癌数据集,并和目前流行的方法 Cufflinks和RSEM进行对比。结果表明,所提出的LDAseq方法相比Cufflinks和RSEM准确率分别提高了75.5%和62.8%,从而获得了较为准确的基因异构体表达水平计算结果。 展开更多
关键词 RNA-SEQ 异构体表达 多源映射 LDA 概率模型
下载PDF
基于模型选择的差异基因和异构体检测 被引量:2
3
作者 王黎黎 刘学军 张礼 《数据采集与处理》 CSCD 北大核心 2016年第5期965-973,共9页
基因和异构体差异表达分析是获取基因和异构体功能的重要途径,现已成为生物信息学的一个重要领域。RNA-seq是一种高通量测序技术,近年来广泛用于转录组研究。RNA-seq数据的读段多源映射现象给差异异构体检测带来挑战。针对该问题,本文... 基因和异构体差异表达分析是获取基因和异构体功能的重要途径,现已成为生物信息学的一个重要领域。RNA-seq是一种高通量测序技术,近年来广泛用于转录组研究。RNA-seq数据的读段多源映射现象给差异异构体检测带来挑战。针对该问题,本文采用先计算基因和异构体的表达水平,再进行差异分析的方法,以计算表达水平的PGseq模型为基础,采用贝叶斯因子方法进行模型选择,提出一个新的差异检测方法 PG_bayes,解决了基因和异构体两方面的差异检测问题。将PG_bayes应用于人类和小鼠共4个真实数据集中,并与目前流行的差异检测方法进行对比。实验结果表明,PG_bayes方法在差异基因和差异异构体检测中具有较高的准确度和灵敏度,并且在差异异构体检测方面表现出优势。 展开更多
关键词 RNA-SEQ 差异检测 多源映射 模型选择 贝叶斯因子
下载PDF
保留非全长读段的ISO-seq数据转录组表达分析 被引量:2
4
作者 刘学军 瞿锡垚 张礼 《数据采集与处理》 CSCD 北大核心 2019年第4期594-604,共11页
近年来,基于单分子测序技术的ISO-seq数据以其超长读段长度被越来越多地应用于转录组新型异构体预测研究,但目前大多数研究工作只用到全长读段数据,丢失了非全长读段数据中较多有用信息,因而数据没有得到充分利用。针对这一问题,本文在... 近年来,基于单分子测序技术的ISO-seq数据以其超长读段长度被越来越多地应用于转录组新型异构体预测研究,但目前大多数研究工作只用到全长读段数据,丢失了非全长读段数据中较多有用信息,因而数据没有得到充分利用。针对这一问题,本文在保留非全长读段的基础上提出了两个能同时预测异构体结构和计算其表达比例的模型基于狄利克雷采样的异构体探测与预测(Dirichletsampling for isoform detection and prediction,DSIDP)和基于马尔科夫链的异构体探测与预测(Markovchain for isoform detection and predition,MCIDP)。两个模型均从全长读段中建立异构体预测集,并采用全长读段和非全长读段计算异构体表达比例。DSIDP将所有读段比对至异构体预测集,并使用Dirichlet采样解决多源映射问题,MCIDP使用马尔科夫链模拟基因外显子之间的选择性剪切,该模型还能预测出数据中没有全长读段的异构体。本文采用模拟数据和真实数据验证了两个模型的有效性。 展开更多
关键词 PacBio ISO-seq 转录组表达 第三代测序技术 新型异构体检测 多源映射
下载PDF
改进的RNA-Seq数据转录组表达分析研究 被引量:3
5
作者 石新新 刘学军 张礼 《数据采集与处理》 CSCD 北大核心 2015年第5期1028-1035,共8页
基于高通量测序的RNA-Seq(RNA-sequencing)是用于转录组研究的一种新技术,针对该技术在转录组表达分析研究中存在的读段多源映射和读段非均匀分布等难点,提出一个改进的转录组表达研究方法 LDASeqII(Improvement of latent Dirichlet al... 基于高通量测序的RNA-Seq(RNA-sequencing)是用于转录组研究的一种新技术,针对该技术在转录组表达分析研究中存在的读段多源映射和读段非均匀分布等难点,提出一个改进的转录组表达研究方法 LDASeqII(Improvement of latent Dirichlet allocation for sequencing data)。模型利用剪接异构体结构信息对参数进行约束并进行外显子读段数目归一化处理,解决了读段非均匀分布下的多源映射问题。通过引入"伪外显子"和"伪转录本"分别处理接合区读段和噪声读段。将模型应用到真实数据集上,并与原LDASeq(Latent Dirichlet allocation for sequencing data)模型和目前流行的Cufflinks与RSEM(RNA-Seq by expectation maximization)方法进行对比。结果显示,改进方法获得了更为准确的转录本及基因表达水平计算结果。 展开更多
关键词 基因表达 RNA-SEQ 转录组表达 多源映射 非均匀性
下载PDF
基于平滑LDA的RNA-Seq数据表达分析研究 被引量:1
6
作者 欧书华 刘学军 张礼 《计算机科学与探索》 CSCD 北大核心 2016年第3期381-388,共8页
RNA-Seq是目前转录组研究的一种重要技术,针对RNA-Seq数据分析中读段的多源映射,参考序列分布的不均匀性,一些转录本中外显子分布稀疏以及跨结合区读段处理问题,提出了一个新的转录组表达研究模型sLDASeqQ该模型根据基因中转录本注释信... RNA-Seq是目前转录组研究的一种重要技术,针对RNA-Seq数据分析中读段的多源映射,参考序列分布的不均匀性,一些转录本中外显子分布稀疏以及跨结合区读段处理问题,提出了一个新的转录组表达研究模型sLDASeqQ该模型根据基因中转录本注释信息对模型参数进行约束,对跨结合区的读段按长度分配处理,解决了读段非均匀分布和跨结合区问题;在模型中增加一个超参数,从而解决了外显子的稀疏问题。将该模型应用到3个真实的数据集上,并与其他主流方法进行比较,结果表明该模型获得了较为准确的基因以及转录本表达水平计算结果。 展开更多
关键词 RNA-SEQ 基因转录本表达水平 平滑LDA 结合区 多源映射 非均匀性
下载PDF
Power Big Data Fusion Prediction
7
作者 Liu Yan Song Yu +1 位作者 Li Gang Liang Weiqiang 《Computer Technology and Application》 2016年第3期165-171,共7页
This paper is a research on the characteristics of power big data. According to the characteristics of "large volume", "species diversity", "sparse value density", "fast speed" of the power big data, a predict... This paper is a research on the characteristics of power big data. According to the characteristics of "large volume", "species diversity", "sparse value density", "fast speed" of the power big data, a prediction model of multi-source information fusion for large data is established, the fusion prediction of various parameters of the same object is realized. A combined algorithm of Map Reduce and neural network is used in this paper. Using clustering and nonlinear mapping ability of neural network, it can effectively solve the problem of nonlinear objective function approximation, and neural network is applied to the prediction of fusion. In this paper, neural network model using multi layer feed forward network--BP neural network. Simultaneously, to achieve large-scale data sets in parallel computing, the parallelism and real-time property of the algorithm should be considered, further combined with Reduce Map model, to realize the parallel processing of the algorithm, making it more suitable for the study of the fusion of large data. And finally, through simulation, it verifies the feasibility of the proposed model and algorithm. 展开更多
关键词 Power big data fusion prediction Map Reduce BP neural network.
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部