期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
Bayesian Computation for the Parameters of a Zero-Inflated Cosine Geometric Distribution with Application to COVID-19 Pandemic Data
1
作者 Sunisa Junnumtuam Sa-Aat Niwitpong Suparat Niwitpong 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第5期1229-1254,共26页
A new three-parameter discrete distribution called the zero-inflated cosine geometric(ZICG)distribution is proposed for the first time herein.It can be used to analyze over-dispersed count data with excess zeros.The b... A new three-parameter discrete distribution called the zero-inflated cosine geometric(ZICG)distribution is proposed for the first time herein.It can be used to analyze over-dispersed count data with excess zeros.The basic statistical properties of the new distribution,such as the moment generating function,mean,and variance are presented.Furthermore,confidence intervals are constructed by using the Wald,Bayesian,and highest posterior density(HPD)methods to estimate the true confidence intervals for the parameters of the ZICG distribution.Their efficacies were investigated by using both simulation and real-world data comprising the number of daily COVID-19 positive cases at the Olympic Games in Tokyo 2020.The results show that the HPD interval performed better than the other methods in terms of coverage probability and average length in most cases studied. 展开更多
关键词 Bayesian analysis confidence interval gibbs sampling random-walk metropolis zero-inflated count data
下载PDF
Comparative Assessment of Zero-Inflated Models with Application to HIV Exposed Infants Data
2
作者 Faith Nekesa Collins Odhiambo Linda Chaba 《Open Journal of Statistics》 2019年第6期664-685,共22页
In a typical Kenyan HIV clinical setting, there is a likelihood of registering many zeros during the routine monthly data collection of new HIV infections among HIV exposed infants (HEI). This is attributed to the imp... In a typical Kenyan HIV clinical setting, there is a likelihood of registering many zeros during the routine monthly data collection of new HIV infections among HIV exposed infants (HEI). This is attributed to the implementation of the prevention of mother to child transmission (PMTCT) policies. However, even though the PMTCT policy is implemented uniformly across all public health facilities, implementation naturally differs from every facility due to differential health systems and infrastructure. This leads to structured zero among reported positive HEI (where PMTCT implementation is optimum) and non-structured zero among reported positive HEI (where PMTCT implementation is not optimum). Hence the classical zero-inflated and hurdle models that do not account for the abundance of structured and non-structured zeros in the data can give misleading results. The purpose of this study is to systematically compare performance of the various zero-inflated models with an application to HIV Exposed Infants (HEI) in the context of structured and unstructured zeros. We revisit zero-inflated, hurdle models, Poisson and negative binomial count models and conduct the simulations by varying sample size and levels of abundance zeros. Results from simulation study and real data analysis of exposed infant diagnosis show the negative binomial emerging as the best performing model when fitting data with both structured and non-structured zeros under various settings. 展开更多
关键词 zero-inflated Models HIV EXPOSED INFANTS Structured Zeroes Mother-to-Child Transmission COUNT data
下载PDF
资治通鉴与政府统计研究 被引量:1
3
作者 鲜祖德 雷奇彪 《统计研究》 CSSCI 北大核心 2024年第1期4-17,共14页
由北宋史学家司马光编撰的《资治通鉴》包含丰富的统计数据,涵盖户籍人口、赋税徭役、军情战报、农业生产等诸多方面,是研究我国古代政府统计演变历程极为宝贵的史料基础。为总结历史经验,汲取历史智慧,本文基于对《资治通鉴》中统计活... 由北宋史学家司马光编撰的《资治通鉴》包含丰富的统计数据,涵盖户籍人口、赋税徭役、军情战报、农业生产等诸多方面,是研究我国古代政府统计演变历程极为宝贵的史料基础。为总结历史经验,汲取历史智慧,本文基于对《资治通鉴》中统计活动、统计数据、统计思想和统计方法的细致钩沉与深入解读,聚焦典型案例,突出数据治理,从政府统计工作组织开展情况、政府统计的主要内容,以及防范和惩治统计造假等三个部分对五代及以前时期我国政府统计的状况加以刻画与总结。研究发现:我国古代政府统计起步时间早,渐趋成熟和稳定;统计工作历来备受重视,日益成为国家治理的有效工具和相关决策的重要基础;统计造假问题时有发生,防范和惩处力度较大;统计数据的收集利用程度与经济社会状况高度相关;统计与其他领域深度融合,专门的统计问题研究较为欠缺。 展开更多
关键词 资治通鉴 政府统计 数据治理 统计史
下载PDF
COM-negative binomial distribution: modeling overdispersion and ultrahigh zero-inflated count data 被引量:1
4
作者 Huiming ZHANG Kai TAN Bo LI 《Frontiers of Mathematics in China》 SCIE CSCD 2018年第4期967-998,共32页
We focus on the COM-type negative binomial distribution with three parameters, which belongs to COM-type (a, b, 0) class distributions and family of equilibrium distributions of arbitrary birth-death process. Beside... We focus on the COM-type negative binomial distribution with three parameters, which belongs to COM-type (a, b, 0) class distributions and family of equilibrium distributions of arbitrary birth-death process. Besides, we show abundant distributional properties such as overdispersion and underdispersion, log-concavity, log-convexity (infinite divisibility), pseudo compound Poisson, stochastic ordering, and asymptotic approximation. Some characterizations including sum of equicorrelated geometrically distributed random variables, conditional distribution, limit distribution of COM-negative hypergeometric distribution, and Stein's identity are given for theoretical properties. COM- negative binomial distribution was applied to overdispersion and ultrahigh zeroinflated data sets. With the aid of ratio regression, we employ maximum likelihood method to estimate the parameters and the goodness-of-fit are evaluated by the discrete Kolmogorov-Smirnov test. 展开更多
关键词 Overdispersion zero-inflated data infinite divisibility Stein'scharacterization discrete Kolmogorov-Smirnov test
原文传递
魏子孝治疗甲状腺疾病医案挖掘分析 被引量:7
5
作者 孙明月 高蕊 《中国中医药信息杂志》 CAS CSCD 2012年第2期25-27,共3页
目的基于数据挖掘技术,总结魏子孝教授治疗甲状腺机能亢进症(以下简称"甲亢")及亚急性甲状腺炎(以下简称亚甲炎)的诊疗思路与经验。方法收集127篇魏教授诊治甲亢及亚甲炎患者的医案,其中甲亢82例、亚甲炎45例。根据甲亢及亚... 目的基于数据挖掘技术,总结魏子孝教授治疗甲状腺机能亢进症(以下简称"甲亢")及亚急性甲状腺炎(以下简称亚甲炎)的诊疗思路与经验。方法收集127篇魏教授诊治甲亢及亚甲炎患者的医案,其中甲亢82例、亚甲炎45例。根据甲亢及亚甲炎临床诊疗医案采集表制定结构化电子病历采集模板,将病例资料录入《中医医案采集与数据挖掘系统软件》,对医案的症状、证候、用药、配伍及其关系采用关联规则、聚类分析等数据挖掘方法进行挖掘分析。结果魏教授治疗甲亢的主要治法为益气、滋阴、疏肝、养血、散结、化痰、行气导滞等,治疗甲亢核心用药为茯苓、白芍、苍术、白术、柴胡等;治疗亚急性甲状腺炎的主要治法为清热、散结、滋阴、化痰、通络、解毒,核心用药为白花蛇舌草、牛蒡子、玄参、生甘草、土贝母等。结论数据挖掘分析结果基本反映了魏子孝教授治疗甲亢及亚甲炎的治疗经验。 展开更多
关键词 甲状腺机能亢进症 亚急性甲状腺炎 医案 数据挖掘 专家经验 魏子孝
下载PDF
备件消耗信息的鱼雷贮存可靠性评估 被引量:1
6
作者 李大伟 张志华 刘天华 《火力与指挥控制》 CSCD 北大核心 2011年第12期81-84,共4页
鱼雷服役后属于长期贮存装备,那么开展其贮存可靠性研究具有重要意义。针对鱼雷备件信息较易获得的现实,开展了其备件消耗数据结构的分析研究,提出了基于成败型数据处理鱼雷贮存失效数据的方法,并且结合Z IP模型的思想建立了鱼雷的备件... 鱼雷服役后属于长期贮存装备,那么开展其贮存可靠性研究具有重要意义。针对鱼雷备件信息较易获得的现实,开展了其备件消耗数据结构的分析研究,提出了基于成败型数据处理鱼雷贮存失效数据的方法,并且结合Z IP模型的思想建立了鱼雷的备件统计模型,并利用矩估计方法对鱼雷贮存可靠性进行了评估。最后利用计算机进行了大量的数据仿真,通过与真值对比分析验证了方法的可行性,可以较为客观地评估鱼雷贮存可靠性。 展开更多
关键词 备件消耗信息 zi数据 成败型数据 模拟仿真
下载PDF
基于数据挖掘技术的俞景茂教授诊治小儿遗尿的规律研究 被引量:3
7
作者 邬思远 季聪华 +3 位作者 陈华 吴龙涛 蒋燕华 王珊珊 《浙江中医药大学学报》 CAS 2016年第11期825-828,共4页
[目的]探讨俞景茂教授治疗小儿遗尿的诊疗规律和学术经验。[方法]收集俞景茂教授诊治小儿遗尿的门诊病案,利用Epi Data软件建设病案数据库,采用Clementine12.0,运用关联规则Apriori算法对症候和药物出现的频次,以及药物之间的相互关联... [目的]探讨俞景茂教授治疗小儿遗尿的诊疗规律和学术经验。[方法]收集俞景茂教授诊治小儿遗尿的门诊病案,利用Epi Data软件建设病案数据库,采用Clementine12.0,运用关联规则Apriori算法对症候和药物出现的频次,以及药物之间的相互关联性进行统计分析,并结合临床实践,分析并总结俞景茂教授治疗小儿遗尿的诊治规律。[结果]统计分析显示舌淡红、夜尿不约、眠深难醒等十项症候为高频症候,炙甘草、菟丝子、巴戟天等二十味药物为高频药物,菟丝子、黄芪、白术、巴戟天等九味药物为核心药物,提示俞景茂教授在诊治小儿遗尿中重在补肾、健脾和开窍。[结论]通过数据挖掘方法,有效总结了俞景茂教授在小儿遗尿方面的诊疗思路和临床经验,该方法的应用对于挖掘名老中医临床经验具有重要的价值。 展开更多
关键词 俞景茂 医案 遗尿 加减二黄五子汤 数据挖掘 规律研究 学术经验
下载PDF
大数据时代与孙子文献研究
8
作者 付朝 《孙子研究》 2016年第1期75-79,共5页
大数据正在改变着我们的生活以及理解世界的方式,成为新发明和新服务的源泉。为促进大数据时代孙子兵学文献研究的健康发展,笔者对其思想探索和理论预研、原有文献的数据化转换、网络信息的采集和传播、孙子自主教学系统的研发,以及如... 大数据正在改变着我们的生活以及理解世界的方式,成为新发明和新服务的源泉。为促进大数据时代孙子兵学文献研究的健康发展,笔者对其思想探索和理论预研、原有文献的数据化转换、网络信息的采集和传播、孙子自主教学系统的研发,以及如何以大数据思想对某些课题进行深入探讨等问题提出建议。以期尽快建成一个开放共享的兵学文献系统,使孙子兵学文献研究紧跟时代步伐,占领学术制高点。 展开更多
关键词 大数据 孙子 文献 研究
下载PDF
A Bayesian hierarchical model for analyzing methylated RNA immunoprecipitation sequencing data 被引量:2
9
作者 Minzhe Zhangl Qiwei Lil Yang Xie 《Frontiers of Electrical and Electronic Engineering in China》 CSCD 2018年第3期275-286,共12页
Background: The recently emerged technology of methylated RNA immunoprecipitation sequencing (MeRIP-seq) sheds light on the study of RNA epigenetics. This new bioinformatics question calls for effective and robust ... Background: The recently emerged technology of methylated RNA immunoprecipitation sequencing (MeRIP-seq) sheds light on the study of RNA epigenetics. This new bioinformatics question calls for effective and robust peaking calling algorithms to detect mRNA methylation sites from MeRIP-seq data. Methods: We propose a Bayesian hierarchical model to detect methylation sites from MeRIP-seq data. Our modeling approach includes several important characteristics. First, it models the zero-inflated and over-dispersed counts by deploying a zero-inflated negative binomial model. Second, it incorporates a hidden Markov model (HMM) to account for the spatial dependency of neighboring read enrichment. Third, our Bayesian inference allows the proposed model to borrow strength in parameter estimation, which greatly improves the model stability when dealing with MeRIP-seq data with a small number of replicates. We use Markov chain Monte Carlo (MCMC) algorithms to simultaneously infer the model parameters in a de novo fashion. The R Shiny demo is available at https://qiwei. shinyapps.io/BaySeqPeak and the R/C ++ code is available at https://github.com/liqiwei2000/BaySeqPeak. Results: In simulation studies, the proposed method outperformed the competing methods exomePeak and MeTPeak, especially when an excess of zeros were present in the data. In real MeRIP-seq data analysis, the proposed method identified methylation sites that were more consistent with biological knowledge, and had better spatial resolution compared to the other methods. Conclusions: In this study, we develop a Bayesian hierarchical model to identify methylation peaks in MeRIP-seq data. The proposed method has a competitive edge over existing methods in terms of accuracy, robustness and spatial resolution. 展开更多
关键词 MeRIP-seq data RNA epigenomics Bayesian inference hidden Markov model zero-inflated negativebinomial
原文传递
基于EMIF的互操作信息平台的设计
10
作者 王义卿 《微型电脑应用》 2013年第3期46-49,共4页
校园网的建设随着教育信息化的发展而普及,但是目前缺乏有关专业方面的标准和规范,造成已建成的校园内子系统之间或校与校管理系统之间兼容性较差或难以兼容,因此,也难以实现相互之间信息和资源的交流和共享。正是在这种背景下,重点研... 校园网的建设随着教育信息化的发展而普及,但是目前缺乏有关专业方面的标准和规范,造成已建成的校园内子系统之间或校与校管理系统之间兼容性较差或难以兼容,因此,也难以实现相互之间信息和资源的交流和共享。正是在这种背景下,重点研究了教育部推出的教育管理信息系统的互操作规范(Education Management Information System Interoperability Framework,EMIF),采用了该规范的特点,引入集群的概念,使用客户端代理(Agent)和区域集成服务器(Zone Integration Server,简称ZIS)模式构建分布式异构环境下,基于EMIF的信息共享和数据集成平台。 展开更多
关键词 EMIF AGENT ziS 集群 分布式异构环境
下载PDF
基于网络爬虫的电商评价数据可视化 被引量:2
11
作者 孙媛 张俊芳 《现代信息科技》 2020年第12期95-97,共3页
文章通过网络爬虫数据采集方式获取电商平台《弟子规》书籍的评价数据,利用Python的jieba中文分词组件对电商评价文本数据进行分词、去除停用词、词频统计等数据处理,采用词云图的形式将用户评价信息进行数据可视化展现,试图帮助人们了... 文章通过网络爬虫数据采集方式获取电商平台《弟子规》书籍的评价数据,利用Python的jieba中文分词组件对电商评价文本数据进行分词、去除停用词、词频统计等数据处理,采用词云图的形式将用户评价信息进行数据可视化展现,试图帮助人们了解数据背后的价值。从大量网络评论中提取反映评论褒贬极性的特质词语,避免消费者所需信息被大量的评论噪音掩盖,从而为消费者的购买决策和企业的营销策略提供支持。 展开更多
关键词 网络爬虫 弟子规 数据可视化
下载PDF
An Exceptional Generalization of the Poisson Distribution
12
作者 Per-Erik Hagmark 《Open Journal of Statistics》 2012年第3期313-318,共6页
A new two-parameter count distribution is derived starting with probabilistic arguments around the gamma function and the digamma function. This model is a generalization of the Poisson model with a noteworthy assortm... A new two-parameter count distribution is derived starting with probabilistic arguments around the gamma function and the digamma function. This model is a generalization of the Poisson model with a noteworthy assortment of qualities. For example, the mean is the main model parameter;any possible non-trivial variance or zero probability can be attained by changing the other model parameter;and all distributions are visually natural-shaped. Thus, exact modeling to any degree of over/under-dispersion or zero-inflation/deflation is possible. 展开更多
关键词 COUNT data Gamma Function POISSON GENERALIZATION DISCRETIZATION Modeling Over/Under-Dispersion zero-inflation/Deflation
下载PDF
《针灸资生经》治疗痛症的选穴规律挖掘分析
13
作者 陈鑫宇 陈梦娜 +2 位作者 刘磊 褚骏豪 张良瑞 《中医药临床杂志》 2022年第11期2114-2118,共5页
目的:探究《针灸资生经》中治疗痛症的选穴规律。方法:整理《针灸资生经》所记载痛症的其症状、用穴及针灸治疗手段。运用数理统计及数据挖掘的方法,探究数据下隐藏的规律。结果:《针灸资生经》中关于痛症的记载共37种,针灸治疗痛症共运... 目的:探究《针灸资生经》中治疗痛症的选穴规律。方法:整理《针灸资生经》所记载痛症的其症状、用穴及针灸治疗手段。运用数理统计及数据挖掘的方法,探究数据下隐藏的规律。结果:《针灸资生经》中关于痛症的记载共37种,针灸治疗痛症共运用299穴计804频次,穴位归经分布前三的分别是足太阳膀胱经、足少阳胆经和任脉;手阳明大肠经的曲池穴使用频次最高,经外奇穴的使用频次最少。结论:《针灸资生经》中治疗痛症广泛运用十四经腧穴,以足太阳膀胱经、足少阳胆经和任脉腧穴运用最为广泛,以手阳明大肠经的曲池穴使用频次最高,部分穴位配伍存在较密切的内在关联规律。 展开更多
关键词 针灸资生经 选穴规律 数据挖掘 针灸
下载PDF
古今字考辨丛札
14
作者 俞绍宏 《汉字汉语研究》 2018年第3期70-78,共9页
本文利用出土先秦秦汉文字材料,考辨了《字诂》等文献中所论及的"■与己""■与亥"等十七组古今字。
关键词 出土文字材料 古今字 考辨
下载PDF
Dynamic road crime risk prediction with urban open data
15
作者 Binbin ZHOU Longbiao CHEN +3 位作者 Fangxun ZHOU Shijian LI Sha ZHAO Gang PAN 《Frontiers of Computer Science》 SCIE EI CSCD 2022年第1期113-125,共13页
Crime risk prediction is helpful for urban safety and citizens’life quality.However,existing crime studies focused on coarse-grained prediction,and usually failed to capture the dynamics of urban crimes.The key chall... Crime risk prediction is helpful for urban safety and citizens’life quality.However,existing crime studies focused on coarse-grained prediction,and usually failed to capture the dynamics of urban crimes.The key challenge is data sparsity,since that 1)not all crimes have been recorded,and 2)crimes usually occur with low frequency.In this paper,we propose an effective framework to predict fine-grained and dynamic crime risks in each road using heterogeneous urban data.First,to address the issue of unreported crimes,we propose a cross-aggregation soft-impute(CASI)method to deal with possible unreported crimes.Then,we use a novel crime risk measurement to capture the crime dynamics from the perspective of influence propagation,taking into consideration of both time-varying and location-varying risk propagation.Based on the dynamically calculated crime risks,we design contextual features(i.e.,POI distributions,taxi mobility,demographic features)from various urban data sources,and propose a zero-inflated negative binomial regression(ZINBR)model to predict future crime risks in roads.The experiments using the real-world data from New York City show that our framework can accurately predict road crime risks,and outperform other baseline methods. 展开更多
关键词 crime prediction road crime risk urban computing data sparsity zero-inflated negative binomial regression
原文传递
基于备件需求信息的使用可靠性评估 被引量:4
16
作者 李大伟 张志华 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2011年第9期1770-1775,共6页
针对许多长期贮存产品的现场使用可靠性信息收集困难.相对其备件需求信息较易收集到的现实,利用备件需求信息对该类产品的使用可靠性进行了评估.为了能够客观的评估产品的使用可靠性,首先对长期贮存产品的备件消耗数据结构进行了重点研... 针对许多长期贮存产品的现场使用可靠性信息收集困难.相对其备件需求信息较易收集到的现实,利用备件需求信息对该类产品的使用可靠性进行了评估.为了能够客观的评估产品的使用可靠性,首先对长期贮存产品的备件消耗数据结构进行了重点研究,得出了数据结构符合典型ZI数据的结论.在此基础上,结合工程上造成该类数据类型出现的原因,对不需求备件的产品进行了重点考虑,进一步建立了产品备件需求的统计模型.其次,结合工程经验和历史信息,提出了模型参数的先验分布,并利用Bayes方法给出了产品备件需求信息的处理方法.最后利用计算机模拟验证了该方法能够较好的评估产品的使用可靠性以及其适用性. 展开更多
关键词 备件需求信息 zi(zero-inflated)数据 使用可靠性 贝叶斯方法
原文传递
基于EMIF的数字化大学区域集成设计
17
作者 蒋勋 张尧弼 范茂兴 《无锡南洋职业技术学院论丛》 2006年第2期36-42,共7页
遵循教育部新近推出的EMIF规范,从根本上解决了学校信息系统集成中由于各个子系统的数据格式不一致,难以集成的问题。结合教育管理软件的特点,基于集群思想对规范中的核心部件区域集成服务器进行了方案设计,实现了一个分布式异构环境下... 遵循教育部新近推出的EMIF规范,从根本上解决了学校信息系统集成中由于各个子系统的数据格式不一致,难以集成的问题。结合教育管理软件的特点,基于集群思想对规范中的核心部件区域集成服务器进行了方案设计,实现了一个分布式异构环境下数据共享和互操作平台。采用组件化的设计思想,各层之间松散耦合,做到即插即用,最后提出方案实现中的一些技巧。 展开更多
关键词 EMIF 消息服务 异构数据源 数据集成 ziS 集群
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部