基于云原生数据库的许多应用场景需要处理海量的数据流.为了实时分析数据流中的群体趋势信息而又不泄露单个用户的隐私,这些应用需要在每个时刻都可以为数据流中的最近数据集快速创建可以安全发布的差分隐私直方图.然而,现有的直方图发...基于云原生数据库的许多应用场景需要处理海量的数据流.为了实时分析数据流中的群体趋势信息而又不泄露单个用户的隐私,这些应用需要在每个时刻都可以为数据流中的最近数据集快速创建可以安全发布的差分隐私直方图.然而,现有的直方图发布方法因缺乏高效数据结构,导致无法快速提取关键信息以确保数据的实时可用性.为解决此问题,深入分析数据采样与隐私保护之间的关系,提出基于采样的数据流差分隐私快速发布算法SPF(sampling based fast publishing algorithm with differential privacy for data stream).SPF首创高效数据流采样草图结构(efficient data stream sampling sketch structure,EDS),EDS对滑动窗口内数据进行采样统计估计,并过滤不合理数据,实现了对关键信息的快速提取.然后,证明EDS结构输出的近似值理论上等效于对真实值添加差分隐私噪声.最后,为了满足用户所提供的隐私保护强度,并且避免正确反映原始数据流的真实情况,提出了一种基于高效数据流采样的自适应加噪算法.根据用户的隐私保护强度和EDS结构所提供的隐私保护强度之间的关系,通过隐私分配的方式自适应生成最终可发布直方图.实验证明,相较于现有算法,SPF在保持相同数据可用性的前提下显著降低了时间和空间开销.展开更多
缺氧诱导因子(hypoxia-inducible factor, HIF)与肝细胞癌的发生发展相关。HIF-1α在包括肝细胞癌在内的多种癌症类型的发生发展中发挥着重要作用,但其在肝细胞癌中的靶基因尚未完全确定。为找到HIF-1α在肝癌中新的致癌靶点,通过整合HI...缺氧诱导因子(hypoxia-inducible factor, HIF)与肝细胞癌的发生发展相关。HIF-1α在包括肝细胞癌在内的多种癌症类型的发生发展中发挥着重要作用,但其在肝细胞癌中的靶基因尚未完全确定。为找到HIF-1α在肝癌中新的致癌靶点,通过整合HIF-1α敲除的RNA-seq数据,HIF-1α的ChIP-Seq数据,HIF-1α在肝癌中的共表达基因,以及肝癌相关的GEO(Gene Expression Omnibus)数据集,寻找HIF-1α的潜在靶基因。通过分析TCGA(The Cancer Genome Atlas)肝癌数据库、GEO和HPA(Human Protein Atlas)数据集,研究HIF-1α与ATP2C1的相关性,ATP2C1在肝癌中的表达及预后。通过建立物理和化学(氯化钴)缺氧模型验证ATP2C1与低氧及HIF-1α的关系。通过GO(Gene Ontology),KEGG(Kyoto Encyclopedia of Genes and Genomes)和GSEA(Gene Set Enrichment Analysis)分析探索ATP2C1的生物学功能。通过设计体外实验证实ATP2C1对HCC的作用。利用STRING和BioGRID两个蛋白互作在线数据库获得ATP2C1的互作蛋白,并研究其在肝癌中的表达及相关性。通过整合及筛选数据,ATP2C1被鉴定为一个HIF-1α的潜在靶基因。ATP2C1与HIF-1α高度相关,在肝细胞癌中高表达,且伴随有不良预后。富集分析与体外实验的结果表明ATP2C1参与调控HCC细胞的增殖迁移。蛋白互作数据表明ATP2C1与TMEM165存在互作关系,生存分析表明TMEM1651高表达的肝癌患者预后较差。相关性分析的结果显示ATP2C1与肝癌中TMEM165和MMP2的表达高度相关,表明ATP2C1可能与TMEM165和MMP2存在互作关系,并参与了肝癌的进展过程。结果表明,ATP2C1是HIF-1α的靶基因和肝细胞癌的生物标志物,其敲低抑制了HCC的增殖和迁移。展开更多
文摘基于云原生数据库的许多应用场景需要处理海量的数据流.为了实时分析数据流中的群体趋势信息而又不泄露单个用户的隐私,这些应用需要在每个时刻都可以为数据流中的最近数据集快速创建可以安全发布的差分隐私直方图.然而,现有的直方图发布方法因缺乏高效数据结构,导致无法快速提取关键信息以确保数据的实时可用性.为解决此问题,深入分析数据采样与隐私保护之间的关系,提出基于采样的数据流差分隐私快速发布算法SPF(sampling based fast publishing algorithm with differential privacy for data stream).SPF首创高效数据流采样草图结构(efficient data stream sampling sketch structure,EDS),EDS对滑动窗口内数据进行采样统计估计,并过滤不合理数据,实现了对关键信息的快速提取.然后,证明EDS结构输出的近似值理论上等效于对真实值添加差分隐私噪声.最后,为了满足用户所提供的隐私保护强度,并且避免正确反映原始数据流的真实情况,提出了一种基于高效数据流采样的自适应加噪算法.根据用户的隐私保护强度和EDS结构所提供的隐私保护强度之间的关系,通过隐私分配的方式自适应生成最终可发布直方图.实验证明,相较于现有算法,SPF在保持相同数据可用性的前提下显著降低了时间和空间开销.
文摘缺氧诱导因子(hypoxia-inducible factor, HIF)与肝细胞癌的发生发展相关。HIF-1α在包括肝细胞癌在内的多种癌症类型的发生发展中发挥着重要作用,但其在肝细胞癌中的靶基因尚未完全确定。为找到HIF-1α在肝癌中新的致癌靶点,通过整合HIF-1α敲除的RNA-seq数据,HIF-1α的ChIP-Seq数据,HIF-1α在肝癌中的共表达基因,以及肝癌相关的GEO(Gene Expression Omnibus)数据集,寻找HIF-1α的潜在靶基因。通过分析TCGA(The Cancer Genome Atlas)肝癌数据库、GEO和HPA(Human Protein Atlas)数据集,研究HIF-1α与ATP2C1的相关性,ATP2C1在肝癌中的表达及预后。通过建立物理和化学(氯化钴)缺氧模型验证ATP2C1与低氧及HIF-1α的关系。通过GO(Gene Ontology),KEGG(Kyoto Encyclopedia of Genes and Genomes)和GSEA(Gene Set Enrichment Analysis)分析探索ATP2C1的生物学功能。通过设计体外实验证实ATP2C1对HCC的作用。利用STRING和BioGRID两个蛋白互作在线数据库获得ATP2C1的互作蛋白,并研究其在肝癌中的表达及相关性。通过整合及筛选数据,ATP2C1被鉴定为一个HIF-1α的潜在靶基因。ATP2C1与HIF-1α高度相关,在肝细胞癌中高表达,且伴随有不良预后。富集分析与体外实验的结果表明ATP2C1参与调控HCC细胞的增殖迁移。蛋白互作数据表明ATP2C1与TMEM165存在互作关系,生存分析表明TMEM1651高表达的肝癌患者预后较差。相关性分析的结果显示ATP2C1与肝癌中TMEM165和MMP2的表达高度相关,表明ATP2C1可能与TMEM165和MMP2存在互作关系,并参与了肝癌的进展过程。结果表明,ATP2C1是HIF-1α的靶基因和肝细胞癌的生物标志物,其敲低抑制了HCC的增殖和迁移。