期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
Integration of Big Data: A Survey 被引量:1
1
作者 Jingya Hui Lingli Li Zhaogong Zhang 《国际计算机前沿大会会议论文集》 2018年第1期9-9,共1页
下载PDF
Integrating Multi-Source Web Records into Relational Database 被引量:1
2
作者 HUANG Jianbin JI Hongbing SUN Heli 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1177-1181,共5页
How to integrate heterogeneous semi-structured Web records into relational database is an important and challengeable research topic. An improved model of conditional random fields was presented to combine the learnin... How to integrate heterogeneous semi-structured Web records into relational database is an important and challengeable research topic. An improved model of conditional random fields was presented to combine the learning of labeled samples and unlabeled database records in order to reduce the dependence on tediously hand-labeled training data. The pro- posed model was used to solve the problem of schema matching between data source schema and database schema. Experimental results using a large number of Web pages from diverse domains show the novel approach's effectiveness. 展开更多
关键词 Web data integration schema matching conditional random fields
下载PDF
Log integration on large scale for global networking monitoring
3
作者 缪嘉嘉 吴泉源 贾焰 《Journal of Central South University》 SCIE EI CAS 2009年第6期976-981,共6页
Supposing that the overall situation is dug out from the distributed monitoring nodes, there should be two critical obstacles, heterogenous schema and instance, to integrating heterogeneous data from different monitor... Supposing that the overall situation is dug out from the distributed monitoring nodes, there should be two critical obstacles, heterogenous schema and instance, to integrating heterogeneous data from different monitoring sensors. To tackle the challenge of heterogenous schema, an instance-based approach for schema mapping, named instance-based machine-learning (IML) approach was described. And to solve the problem of heterogenous instance, a novel approach, called statistic-based clustering (SBC) approach, which utilized clustering and statistics technologies to match large scale sources holistically, was also proposed. These two algorithms utilized the machine-leaning and clustering technology to improve the accuracy. Experimental analysis shows that the IML approach is more precise than SBC approach, reaching at least precision of 81% and recall rate of 82%. Simulation studies further show that SBC can tackle large scale sources holisticalty with 85% recall rate when there are 38 data sources. 展开更多
关键词 MACHINE-LEARNING CLUSTERING data integration schema matching instance matching
下载PDF
Autonomous Data Exchange: The Malady and a Possible Path to Its Cure
4
作者 Eli Rohn 《Intelligent Information Management》 2015年第1期22-32,共11页
Data exchange is a goal-oriented social communications system implemented through computerized technology. Data definition languages (DDLs) provide the syntax for communicating within and between organizations, illocu... Data exchange is a goal-oriented social communications system implemented through computerized technology. Data definition languages (DDLs) provide the syntax for communicating within and between organizations, illocutionary acts, such as informing, ordering and warning. Data exchange results in meaning-preserving mapping between an ensemble (a constrained variety) and its external (unconstrained) variety. Research on unsupervised structured and semi-structured data exchange has not produced any significant successes over the past fifty years. As a step towards finding a solution, this article proposes a new look at data exchange by using the principles of complex adaptive systems (CAS) to analyze current shortcomings and to propose a direction that may indeed lead to workable and mathematically grounded solution. Three CAS attributes key to this research are variety, tension and entropy. We use them to show that older and contemporary DDLs are identical in their core, thus explaining why even XML and Ontologies have failed to a create fully automated data exchange mechanism. Then we show that it is possible to construct a radically different DDL that overcomes existing data exchange limitations—its variety, tension and entropy are different from existing solutions. The article has these major parts: definition of key CAS attributes;quantitative examination of representative old and new DDLs using these attributes;presentation of the results and their pessimistic ramification;a section that proposes a new theoretical way to construct DDLs that is based entirely on CAS principles, thus enabling unsupervised data exchange. The theory is then tested, showing very promising results. 展开更多
关键词 Software Engineering data Definition schema matching data integration Complex Adaptive Systems
下载PDF
异构数据源集成中的模式映射技术 被引量:19
5
作者 杨雪梅 董逸生 +2 位作者 王永利 钱江波 钱刚 《计算机科学》 CSCD 北大核心 2006年第7期87-91,共5页
模式映射是异构数据源集成中实现查询重形成(Reformulation)的关键技术,本文首先介绍了模式映射的集中式和非集中式集成体系,总结了定义模式映射的3种基本形式:GAV、LAV和GLAV,重点探讨了模式映射中的核心技术:模式匹配和映射生成,最后... 模式映射是异构数据源集成中实现查询重形成(Reformulation)的关键技术,本文首先介绍了模式映射的集中式和非集中式集成体系,总结了定义模式映射的3种基本形式:GAV、LAV和GLAV,重点探讨了模式映射中的核心技术:模式匹配和映射生成,最后讨论了模式映射技术新的研究议题。 展开更多
关键词 异构数据源集成 模式映射 模式匹配
下载PDF
SKM:一种基于模式结构和已有匹配知识的模式匹配模型 被引量:9
6
作者 申德荣 余恩运 +3 位作者 张旭 寇月 聂铁铮 于戈 《软件学报》 EI CSCD 北大核心 2009年第2期327-338,共12页
针对已有基于模式结构的模式匹配方法的局限性,提出了一种利用模式结构信息和已有匹配知识的模式匹配模——SKM(schema and reused knowledge based matching model).在该模型中,借鉴神经网络元之间的影响过程实现语义匹配推理;通过重... 针对已有基于模式结构的模式匹配方法的局限性,提出了一种利用模式结构信息和已有匹配知识的模式匹配模——SKM(schema and reused knowledge based matching model).在该模型中,借鉴神经网络元之间的影响过程实现语义匹配推理;通过重用已有匹配知识深入挖掘模式元素之间的深层语义关系;基于已有匹配知识自动缩减不确定阈值区之间来确定匹配阈值,有效减少人工干涉;给出了简单的确定模式元素之间匹配关系的方法;同时通过自适应式迭代模型,进一步挖掘求精已有匹配知识.实验结果表明,SKM模型切实可行. 展开更多
关键词 模式匹配 知识重用 语义推理 数据集成 数据挖掘
下载PDF
Deep Web集成服务的不确定模式匹配 被引量:14
7
作者 姜芳艽 孟小峰 贾琳琳 《计算机学报》 EI CSCD 北大核心 2008年第8期1412-1421,共10页
随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模... 随着Deep Web的迅猛发展,从高度自治、异构及动态变化的Web数据库中,为用户提供高质量的数据逐渐成为当前Deep Web集成服务的一个研究热点.在大部分Web数据库只能通过查询接口为用户提供服务的前提下,如何建立用户请求与集成查询接口模式之间以及集成查询接口模式与Web数据库查询接口模式之间的匹配关系,是Deep Web集成服务中进行合理的用户请求转换的关键.之前的相关工作都是寻找最佳的匹配结果,回避匹配的不确定性,丢弃了可能有价值的其他匹配结果.文中首先剖析了请求转换中模式匹配的不确定性,提出了数字类型的相似度计算方法,给出了进行数字类型的模式匹配的有效的剪枝方法以及数据类型驱动的模式匹配优化方法,并在此基础上提出了一种基于相似度计算的不确定性模式匹配方法,最后通过大量的实验证明了该方法的有效性. 展开更多
关键词 DEEP WEB 集成服务 相似度 模式匹配 不确定性
下载PDF
模式匹配研究进展 被引量:15
8
作者 潘超 杨良怀 +2 位作者 龚卫华 古辉 陈敏智 《计算机系统应用》 2010年第11期265-277,共13页
随着网络和信息技术的发展,各个应用领域的合作越来越密切,数据的互操作性日显重要。由于数据源数据模式的自治性、异构性,为实现数据共享,模式匹配已成为数据密集型分布式应用的一项基本任务,成为学术界近年来的一个研究热点。对模式... 随着网络和信息技术的发展,各个应用领域的合作越来越密切,数据的互操作性日显重要。由于数据源数据模式的自治性、异构性,为实现数据共享,模式匹配已成为数据密集型分布式应用的一项基本任务,成为学术界近年来的一个研究热点。对模式匹配的研究现状和趋势作了简述:介绍了模式匹配的基本技术及分类,分析并比较了典型的模式匹配系统,讲述了模式匹配的发展趋势。 展开更多
关键词 模式匹配 数据集成 本体比对 模式映射
下载PDF
面向智慧民生领域的增量交互式数据集成方法 被引量:8
9
作者 夏丁 王亚沙 +1 位作者 赵梓棚 崔达 《计算机研究与发展》 EI CSCD 北大核心 2017年第3期586-596,共11页
智慧民生作为智慧城市的重点领域,包含众多应用系统,积累了大量层次结构数据.为了形成城市范围完整数据集,需要集成并统一异构的数据模式,向用户提供统一的数据视图.针对智慧民生领域的领域知识宽泛、缺乏中文语义匹配支持、模式数量众... 智慧民生作为智慧城市的重点领域,包含众多应用系统,积累了大量层次结构数据.为了形成城市范围完整数据集,需要集成并统一异构的数据模式,向用户提供统一的数据视图.针对智慧民生领域的领域知识宽泛、缺乏中文语义匹配支持、模式数量众多、元素标签缺失但实例数据丰富等几方面特点,提出了一种增量交互式模式集成方法.该方法采用增量迭代的方式逐步完成多模式集成任务,大幅降低集成计算量;在模式匹配阶段,综合利用模式信息和实例数据构造了多种适用于中文且能力互补的匹配器,并通过相似度熵来度量机器的决策置信度,适度引入人工干预;在中介模式生成阶段,处理模式间可能出现的各种冲突,最终输出全局统一的中介模式.利用从互联网爬取的多源二手房数据设计并完成实验,实验结果表明:此方法在人工干预程度足够小的前提下,具有较好的模式匹配准确性. 展开更多
关键词 模式匹配 模式集成 数据集成 智慧城市 智慧民生
下载PDF
不确定模式匹配研究综述 被引量:4
10
作者 翁年凤 刁兴春 +1 位作者 曹建军 冯径 《计算机科学》 CSCD 北大核心 2011年第12期1-5,共5页
模式匹配是数据集成、语义Web等研究领域的重要研究内容,需要依据一定的启发式信息发现模式元素之间的对应关系。鉴于启发式信息处理方法的不同,对模式匹配方法进行了分类,并从模式匹配结果集结方法的角度,介绍了综合模式匹配方法。不... 模式匹配是数据集成、语义Web等研究领域的重要研究内容,需要依据一定的启发式信息发现模式元素之间的对应关系。鉴于启发式信息处理方法的不同,对模式匹配方法进行了分类,并从模式匹配结果集结方法的角度,介绍了综合模式匹配方法。不确定性是模式匹配过程固有的特性,介绍了建模模式匹配过程中不确定性的数据模型,在此基础上介绍了处理模式匹配过程中不确定性的模式匹配方法。最后对模式匹配研究进行了展望。 展开更多
关键词 数据集成 模式匹配 不确定性
下载PDF
模式匹配方法研究 被引量:10
11
作者 郑文怡 鞠时光 《计算机应用研究》 CSCD 北大核心 2006年第2期60-63,共4页
从模式匹配的定义开始介绍,对已有的模式匹配方法进行分类,探讨了这些方法适用的领域和所能发掘的信息,区分了实例级和模式级、元素级和结构级以及基于自然语言和基于约束的匹配程序,以期在比较不同模式匹配方法或研究新匹配算法以及实... 从模式匹配的定义开始介绍,对已有的模式匹配方法进行分类,探讨了这些方法适用的领域和所能发掘的信息,区分了实例级和模式级、元素级和结构级以及基于自然语言和基于约束的匹配程序,以期在比较不同模式匹配方法或研究新匹配算法以及实现模式匹配组件时有所帮助。 展开更多
关键词 模式匹配 数据集成 匹配程序 数据库
下载PDF
基于混合跳链条件随机场的异构Web记录集成方法 被引量:8
12
作者 黄健斌 姬红兵 孙鹤立 《软件学报》 EI CSCD 北大核心 2008年第8期2149-2158,共10页
提出了一种混合跳链条件随机场序列统计学习模型,以实现异构Web记录与关系数据库的模式匹配.该模型可以在由手工标注样本和关系数据库记录组成的联合样本集上进行训练,减少了对繁琐手工标注样本的依赖.此外,通过在线性链条件随机场模型... 提出了一种混合跳链条件随机场序列统计学习模型,以实现异构Web记录与关系数据库的模式匹配.该模型可以在由手工标注样本和关系数据库记录组成的联合样本集上进行训练,减少了对繁琐手工标注样本的依赖.此外,通过在线性链条件随机场模型上增加对跳边的支持,使得该模型能够有效地处理状态变量间的长距离依赖.在多个领域的真实数据集上的实验结果表明,所提出的方法能够显著提高异构Web记录语义模式匹配的性能. 展开更多
关键词 混合跳链条件随机场 WEB数据集成 模式匹配
下载PDF
数据集成领域中的模式匹配技术研究 被引量:2
13
作者 许峰 满振梅 王志坚 《计算机工程》 EI CAS CSCD 北大核心 2006年第6期40-41,共2页
随着网络技术的发展,未来的信息处理需要一种对大量的、异构的数据源的统一存取手段,多数据源集成就是研究这一问题。而模式匹配是数据集成领域中一个基本的问题,它主要考虑全局模式和局部模式之间的匹配。文章提出了一种解决模式匹配... 随着网络技术的发展,未来的信息处理需要一种对大量的、异构的数据源的统一存取手段,多数据源集成就是研究这一问题。而模式匹配是数据集成领域中一个基本的问题,它主要考虑全局模式和局部模式之间的匹配。文章提出了一种解决模式匹配问题中数据模式复杂语义冲突的方法,并将其集成到一个统一的模式。 展开更多
关键词 数据集成 模式匹配 语义冲突
下载PDF
Deep Web数据集成中查询处理的研究与进展 被引量:4
14
作者 姜芳艽 孟小峰 《计算机科学与探索》 CSCD 2009年第2期113-129,共17页
随着Web上在线数据库的大量涌现,Deep Web数据集成成为当前信息领域的一个研究热点,而查询处理是其中的一个重要的组成部分。由于Web数据库具有规模大、自治性、异构性以及动态性等特点,使得Deep Web数据集成中的查询处理比传统的分布... 随着Web上在线数据库的大量涌现,Deep Web数据集成成为当前信息领域的一个研究热点,而查询处理是其中的一个重要的组成部分。由于Web数据库具有规模大、自治性、异构性以及动态性等特点,使得Deep Web数据集成中的查询处理比传统的分布环境下的查询处理更具挑战性。围绕Deep Web数据集成中查询处理的三个关键研究点:模式匹配、Web数据库的选择以及查询转换,综述了近年来国际上相关的、具代表性的研究成果,分析了这些方法的优缺点,总结并展望了未来的发展方向。 展开更多
关键词 深层网络 数据集成 模式匹配 数据库选择 查询转换
下载PDF
支持Web深层数据库网格的部分关键技术的研究 被引量:1
15
作者 申德荣 聂铁铮 +2 位作者 余恩运 寇月 于戈 《计算机科学》 CSCD 北大核心 2007年第8期123-125,154,共4页
当前,深层Web数据库数量急剧增加,然而其知识并没有得到有效的利用。本文提出将特定的深层Web数据库应用于网格环境中的思想,并针对支持深层Web数据库网格的部分关键技术进行研究,主要包括:(1)深层Web数据库元信息定义模型与模式抽取模... 当前,深层Web数据库数量急剧增加,然而其知识并没有得到有效的利用。本文提出将特定的深层Web数据库应用于网格环境中的思想,并针对支持深层Web数据库网格的部分关键技术进行研究,主要包括:(1)深层Web数据库元信息定义模型与模式抽取模型的研究;(2)多层次的模式匹配模型和自协调模型研究;(3)基于属性松弛的Web数据库查询与集成模型研究;(4)多目标函数代价模型和面向局部性的自适应优化调度模型研究。研发成果将为构建深层Web数据库网格提供良好的支持,就像网格的概念所定义的一样,为用户提供统一的接口,可按需为消费者提供集成的深层Web数据知识。其具有广阔的应用前景。 展开更多
关键词 数据库网格 深层Web 模式匹配 近似查询 数据集成优化
下载PDF
基于素数的多源模式匹配方法的研究 被引量:1
16
作者 李颖 刘国华 +1 位作者 佟冰 刘顺江 《燕山大学学报》 CAS 2009年第2期141-145,共5页
模式匹配是获取不同模式间语义关联关系的技术,是数据集成过程中的关键操作。随着可检索在线数据库数量的迅速增加,大规模的模式匹配工作的需要使多源模式匹配方法成为模式匹配领域研究的重点。针对现有多源模式匹配方法的缺陷,本文提... 模式匹配是获取不同模式间语义关联关系的技术,是数据集成过程中的关键操作。随着可检索在线数据库数量的迅速增加,大规模的模式匹配工作的需要使多源模式匹配方法成为模式匹配领域研究的重点。针对现有多源模式匹配方法的缺陷,本文提出了一种基于素数的多源模式匹配方法,并提出了具体算法—PMSM。该方法将素数理论引入模式匹配过程中,使单纯的字符匹配转换为素数计算,提高了匹配效率,同时保留了现有多源模式匹配方法的优点。实验证明,PMSM切实可行。 展开更多
关键词 在线数据库 多源模式匹配 数据集成 素数 复杂匹配
下载PDF
多源Web对象与关系数据的集成 被引量:1
17
作者 黄健斌 姬红兵 孙鹤立 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2007年第1期126-130,153,共6页
利用序列数据语义标注学习方法来解决异构数据源的模式匹配问题,将从多个网站抽取的异构Web对象集成到关系数据库中.在线性链条件随机场的基础上提出了一种可叠加多阶链的组合条件随机场模型.该模型可以在由手工标注数据和关系数据库记... 利用序列数据语义标注学习方法来解决异构数据源的模式匹配问题,将从多个网站抽取的异构Web对象集成到关系数据库中.在线性链条件随机场的基础上提出了一种可叠加多阶链的组合条件随机场模型.该模型可以在由手工标注数据和关系数据库记录组成的联合样本集上进行训练,因此减少了对繁琐手工标注样本的依赖;此外,通过在线性链条件随机场模型上叠加高阶链,使得该模型能够有效地处理状态变量间的长距离依赖.在多个领域的真实数据集上的实验和分析结果表明,所提出的方法能显著提高异构Web数据的字段标注性能. 展开更多
关键词 WEB数据集成 模式匹配 组合条件随机场
下载PDF
模式匹配不确定性的多因素集结度量 被引量:1
18
作者 胡文彬 潘祝山 纪兆辉 《智能系统学报》 CSCD 北大核心 2015年第2期286-292,共7页
为了能够有效度量模式匹配的不确定性,提出了一个模式匹配不确定性的度量模型,根据不确定性因素间的关系提出了一个集结算子。使用全知熵度量语义匹配和属性匹配的不确定性,引入过程不确定性的度量方法度量匹配决策过程的不确定性。使... 为了能够有效度量模式匹配的不确定性,提出了一个模式匹配不确定性的度量模型,根据不确定性因素间的关系提出了一个集结算子。使用全知熵度量语义匹配和属性匹配的不确定性,引入过程不确定性的度量方法度量匹配决策过程的不确定性。使用多因素集结算子判断各因素的影响程度,并可合成各度量结果。实验证明,所提模型和方法能够有效度量模式匹配的不确定性,且具有高效性和可扩展性。 展开更多
关键词 模式定义 模式分析 模式匹配 不确定性分析 数据不确定性度量 度量方法 决策分析 集结评估方法
下载PDF
基于源模式分裂的模式匹配算法
19
作者 张凌宇 刘国华 +3 位作者 褚兵义 王聪 麻会东 苑迎 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期196-201,共6页
模式匹配就是在作为输入的模式中有对应语义关系的元素间产生一个映射.为了提高模式匹配的效率,提出了一种新型的模式匹配方法——源模式分裂模式匹配算法.它可以解决标准模式匹配难以解决的问题:1)源模式的某一个属性和多个目标模式的... 模式匹配就是在作为输入的模式中有对应语义关系的元素间产生一个映射.为了提高模式匹配的效率,提出了一种新型的模式匹配方法——源模式分裂模式匹配算法.它可以解决标准模式匹配难以解决的问题:1)源模式的某一个属性和多个目标模式的多个属性之间建立匹配关系;2)表格中的不同元组对应其他表格同一元组的不同属性值的匹配.在匹配过程中,该方法先搜索种类型属性,然后根据种类型属性建立选择条件,最后把源模式进行分裂形成视图,再重新生成候选匹配集合,从而提高模式匹配的质量. 展开更多
关键词 模式 映射 数据集成 源模式分裂模式匹配
下载PDF
基于用户模式Deep Web检索系统的研究
20
作者 李益民 魏立新 解成俊 《计算机工程与设计》 CSCD 北大核心 2009年第3期767-769,共3页
针对传统Web数据集成系统实用性、伸缩性和适应性差的问题,提出了一种新的Web数据集成系统体系结构UQSIQ,实现Web规模的数据集成。系统根据用户查询的模式映射相关领域,选择Web数据库,执行查询排序查询结果。介绍了组成系统的关键组件,... 针对传统Web数据集成系统实用性、伸缩性和适应性差的问题,提出了一种新的Web数据集成系统体系结构UQSIQ,实现Web规模的数据集成。系统根据用户查询的模式映射相关领域,选择Web数据库,执行查询排序查询结果。介绍了组成系统的关键组件,及领域映射和用户模式匹配等处理大规模异构Web数据的关键技术。 展开更多
关键词 DEEPWEB 数据集成 查询模式 领域映射 模式匹配
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部