检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种基于条件概率分布的近似重复记录检测方法被引量：3: 1; 作者缪嘉嘉吴刚 +2 位作者毛捍东杨强邓苏《小型微型计算机系统》 CSCD 北大核心 2004年第12期2164-2168,共5页; 数据集成往往会形成一些近似重复记录 ,如何检测重复信息是数据质量研究中的一个热门课题 .文中提出了一种高效的基于条件概率分布的动态聚类算法来进行近似重复记录检测 .该方法在评估两个记录之间是否近似等价的问题上 ,解决了原来的... 展开更多; 关键词信息集成近似重复记录动态聚类概率后缀树; 下载PDF 职称材料

近似重复记录的增量式识别算法被引量：4: 2; 作者许向阳佘春红《计算机工程与应用》 CSCD 北大核心 2003年第12期191-193,220,共4页; 摘要数据清理是数据仓库中的一个重要研究内容,近似重复记录的识别是其中的一个技术难点。文章介绍了近邻排序方法,并以此为基础,研究了在数据模式与匹配规则不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IM... 展开更多; 关键词数据清理近似重复记录增量式识别特征记录; 下载PDF 职称材料

近似重复记录的自适应距离度量检测被引量：2: 3; 作者黄健斌姬红兵孙鹤立《西安电子科技大学学报》 EI CAS CSCD 北大核心 2007年第2期331-336,共6页; 提出了一种结合自适应字符串距离度量的记录相似度学习方法,用于多源Web数据集成中的重复记录检测.该方法首先使用最大熵分类器标注记录对中字段间的关联类型;然后根据每个字段对的关联类型,为其选择合适的距离函数;最后使用支持向量机... 展开更多; 关键词近似重复记录检测记录链接实体匹配数据集成; 下载PDF 职称材料

多数据源近似重复记录增量式识别方法仿真: 4; 作者蒙芳翟建丽《计算机仿真》北大核心 2020年第8期362-365,423,共5页; 在进行数据录入的过程中,经常会发生录错、数据源表现各异等状况。因而针对传统的多数据源近似重复记录增量式识别方法存在执行时间较长、查准率、查全率较低等问题,提出了一种基于MapReduce编程模型的多数据源近似重复记录增量式识别... 展开更多; 关键词多数据源近似重复记录增量式识别方法; 下载PDF 职称材料

基于优先队列的增量式重复记录识别被引量：7: 5; 作者佘春红《计算机应用》 CSCD 北大核心 2003年第9期61-63,共3页; 介绍了优先队列方法(PriorityQueueStrategy,PQS),并以此为基础,研究了在数据模式与匹配模型不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IPQS(IncrementalPQS),最后给出了实验结果。; 关键词数据清理近似重复记录增量式识别特征记录; 下载PDF 职称材料

基于聚类分析技术的数据清洗研究被引量：11: 6; 作者刘芳何飞《计算机工程与科学》 CSCD 2005年第6期70-71,77,共3页; 数据清洗是建立数据仓库及进行数据挖掘的一个重要步骤。数据清洗的核心是检测近似重复记录,而聚类是将相似度高的数据对象聚集到一个类中的分析方法。本文描述的数据清洗过程就基于聚类分析,它将基于密度的改进聚类算法ICAD应用到数据... 展开更多; 关键词数据清洗近似重复记录聚类 ICAD; 下载PDF 职称材料

面向演化数据的代表性记录构建方法: 7; 作者高广尚《系统工程》北大核心 2022年第3期137-148,共12页; 对如何在不断快速演化的数据集中构建出规范的代表性记录,以确保Web应用的前端、后端能对数据集进行高效的比较分析开展了研究。论文首先分析记录之间的相似合并策略,具体包括记录间相似性策略、记录间合并策略和相似与合并组合策略,然... 展开更多; 关键词近似重复记录演化数据代表性记录实体解析; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部