-
题名基于HGAV的多源异构数据集成方法
被引量:1
- 1
-
-
作者
郏奎奎
刘海滨
-
机构
中国航天系统科学与工程研究院
-
出处
《计算机系统应用》
2018年第3期27-35,共9页
-
基金
国家自然科学基金(U150120175)
-
文摘
针对信息系统中海量数据多源异构和难以共享的问题,提出了多源异构数据虚拟集成框架.数据集成系统中的GAV(Global-As-View)模式映射方法面对信息量分布不均匀的数据源时,查询效率较低,在对GAV改进的基础上,提出了基于HGAV(Hierarchical-Global-As-view)的模式映射算法,通过引入中间数据源模式,形成分层的全局视图,大大缩减了映射空间,简化了映射集合,便于查询的重写和优化.利用宁东智慧环保项目中的五大类数据对本文所提出的算法加以验证,实验结果表明该算法相较于GAV模式映射算法提高了数据集成效率,缩短了查询时间.
-
关键词
数据集成
映射
查询
HGAV
中介模式
-
Keywords
data integration
mapping
query
HGAV
mediation model
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于决策树的煤化工污染物定量化溯源研究
被引量:1
- 2
-
-
作者
郏奎奎
刘海滨
-
机构
中国航天系统科学与工程研究院
-
出处
《环境工程》
CAS
CSCD
北大核心
2016年第S1期1169-1175,共7页
-
基金
国家自然科学基金重点支持项目(U150120175)
-
文摘
环境污染问题日益严峻,煤化工生产是环境污染的重要源头之一,但由于煤化工生产过程中所产生的污染物种类繁多且各类产品的生产量不同,污染问题通常难以定量化溯源。挖掘环境污染物的产生原因、分析研究不同产品的生产和产量对各类环境污染物(如PM2.5、SO2)的量化影响是有效解决环境污染问题的必要前提。数据挖掘方法能够挖掘出隐藏在数据中知识或关联关系,其中的决策树算法以香农的信息论为理论背景,能计算出多个影响因子中影响力的大小关系,并且还能找到数量型属性的临界点,是环境污染定量化溯源的有效方法。本文利用决策树算法构建环境污染物量化分析模型,以宁东能源化工基地为例,研究解析煤化工产品的生产状况对环境污染物含量的影响情况。
-
关键词
煤化工生产
环境污染物
大数据
数据挖掘
决策树
-
Keywords
coal chemical product
environmental pollutants
big data
data mining
decision tree
-
分类号
X784
[环境科学与工程—环境工程]
-