期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
相空间重构与改进SMA优化SVR的网络流量预测
1
作者 董洁 韩子扬 《计算机工程与设计》 北大核心 2024年第9期2796-2804,共9页
为提高网络流量预测精度,提出结合相空间重构与改进黏菌优化支持向量回归的预测模型。为解决黏菌算法收敛慢、易得局部最优的不足,引入3种形态对立学习对种群进行初始化,提高种群多样性;利用非线性反馈因子更新机制,均衡全局搜索与局部... 为提高网络流量预测精度,提出结合相空间重构与改进黏菌优化支持向量回归的预测模型。为解决黏菌算法收敛慢、易得局部最优的不足,引入3种形态对立学习对种群进行初始化,提高种群多样性;利用非线性反馈因子更新机制,均衡全局搜索与局部开发;设计柯西-高斯混合变异对最优解变异,扩展搜索空间,避免陷入局部最优。利用改进黏菌算法对支持向量回归优化调参,有效解决超参初值敏感缺陷,提高学习精度和收敛速度,以此构建网络流量预测模型。实验结果表明,改进模型预测误差更小,能够实现高精度和实时性预测要求。 展开更多
关键词 网络流量预测 黏菌算法 支持向量机 对立学习 混合变异 相空间重构 预测误差
下载PDF
一种改进的小波阈值去噪方法 被引量:7
2
作者 韩子扬 杜利明 +1 位作者 王鑫 陈楠 《现代电子技术》 北大核心 2016年第17期20-22,25,共4页
在原有的小波阈值去噪方法的基础上,提出了一种改进的图像去噪方法 Fast ICA-MPSO-WTD。该方法将快速独立主元分析(Fast ICA)和WTD相结合进行图像去噪,为了使小波阈值去噪效果更好,使用改进粒子群算法(MPSO)优化小波阈值参数。为了证明... 在原有的小波阈值去噪方法的基础上,提出了一种改进的图像去噪方法 Fast ICA-MPSO-WTD。该方法将快速独立主元分析(Fast ICA)和WTD相结合进行图像去噪,为了使小波阈值去噪效果更好,使用改进粒子群算法(MPSO)优化小波阈值参数。为了证明该方法的有效性,选择测试图像进行去噪对比实验,实验使用峰值信噪比(PSNR)评价去噪效果,实验结果表明改进方法 Fast ICA-MPSO-WTD能够有效地提高去噪效果。 展开更多
关键词 图像去噪 FASTICA MPSO 小波阈值
下载PDF
基于二维码技术的展馆自助导览系统研究
3
作者 韩子扬 陈楠 丁慧 《电脑知识与技术》 2015年第2X期71-72,共2页
二维码使用方便,应用广泛,特别是在移动设备实现URL链接网站方面,系统基于二维码技术,利用智能移动终端为对象的二维码读取功能,结合WLAN无线网络和Web建设技术,实现游客在展馆中进行自助访问,避免在导游和其他设备在助游方面带来的不... 二维码使用方便,应用广泛,特别是在移动设备实现URL链接网站方面,系统基于二维码技术,利用智能移动终端为对象的二维码读取功能,结合WLAN无线网络和Web建设技术,实现游客在展馆中进行自助访问,避免在导游和其他设备在助游方面带来的不必要步骤,通过扫描二维码下载展品相关信息,提升游客游览体验,并可通过对游客的行为分析和挖掘,改善展馆的服务质量,提升管理水平。 展开更多
关键词 二维码 导览系统 WLAN 服务提升
下载PDF
基于张量分解的个性化标签推荐算法 被引量:18
4
作者 李贵 王爽 +3 位作者 李征宇 韩子扬 孙平 孙焕良 《计算机科学》 CSCD 北大核心 2015年第2期267-273,共7页
基于互联网的社会标签推荐系统为广大用户提供了一个信息共享平台,让用户以"标签"的形式为其浏览的物品标注信息。标签既描述了物品语义,又反映了用户偏好。标签系统的最大优势在于可以发挥群体的智能,获得用户对物品比较准... 基于互联网的社会标签推荐系统为广大用户提供了一个信息共享平台,让用户以"标签"的形式为其浏览的物品标注信息。标签既描述了物品语义,又反映了用户偏好。标签系统的最大优势在于可以发挥群体的智能,获得用户对物品比较准确的关键词描述,而准确的标签信息是提升个性化推荐系统性能的重要资源。然而,现存的标签推荐系统面临的问题是:由于兴趣的不同,不同的用户对于同一物品可能会打不同的标签,或者是同一标签对于不同用户可能会蕴含不同的语义。因此如何有效获取用户、物品、标签3者之间潜在的语义关联成为标签推荐系统需要解决的主要问题。为此引入三维张量模型,利用三维张量的3个维度来分别描述社会标签推荐系统中3种类型的实体:用户、物品、标签。在基于历史标签数据(标签元数据)构建初始张量的基础上,应用高阶奇异值分解(HOSVD)方法降低张量维度,同时实现3种类型实体之间潜在的语义关联分析,从而进一步提高标签推荐系统的准确性。实验结果表明,该方法较当前两种典型的标签推荐算法(FolkRank和PR)在准确率和召回率性能指标上有明显提升。 展开更多
关键词 社会标签 标签推荐 张量分解 高阶奇异值分解(HOSVD)
下载PDF
基于谱聚类群组发现的协同过滤推荐算法 被引量:4
5
作者 李贵 陈召新 +3 位作者 李征宇 韩子扬 孙平 孙焕良 《计算机科学》 CSCD 北大核心 2014年第B11期354-358,共5页
推荐系统中,基于聚类的协同过滤推荐算法利用K-means等算法对用户和物品进行聚类,聚类结果里用户或物品只能属于一个类别,然而在实际应用中,一个用户可以有多种兴趣,一个物品也可以属于多个类别。针对上述问题,提出了一种基于谱聚类群... 推荐系统中,基于聚类的协同过滤推荐算法利用K-means等算法对用户和物品进行聚类,聚类结果里用户或物品只能属于一个类别,然而在实际应用中,一个用户可以有多种兴趣,一个物品也可以属于多个类别。针对上述问题,提出了一种基于谱聚类群组发现的算法,该算法通过谱聚类和C-means聚类得到用户和物品相似度较高的群组以及用户和物品归属于群组的隶属度矩阵,而且用户或物品可以属于多个群组。通过计算用户在各个群组中对物品的偏好值,并结合用户和物品在群组里相应的隶属度来预测用户对物品最终的偏好值,生成对用户的Top-N推荐结果。实验结果表明,与以往推荐算法相比,本方法在降低了数据稀疏性的同时提高了推荐结果的准确率和召回率。 展开更多
关键词 推荐系统 协同过滤 谱聚类 C-means算法 群组
下载PDF
基于标签路径的Web结构化数据自动抽取 被引量:3
6
作者 李贵 陈成 +3 位作者 李征宇 韩子扬 孙平 孙焕良 《计算机科学》 CSCD 北大核心 2013年第06A期141-144,165,共5页
提出了一种基于标签路径的Web结构化数据自动抽取方法。该方法通过对网页DOM树的解析获取完整标签路径集合,并依据路径相似度测量方法来聚类标签路径,实现目标数据区域的定位,然后通过标签节点坐标位置的特性来分离各个数据项,过滤冗余... 提出了一种基于标签路径的Web结构化数据自动抽取方法。该方法通过对网页DOM树的解析获取完整标签路径集合,并依据路径相似度测量方法来聚类标签路径,实现目标数据区域的定位,然后通过标签节点坐标位置的特性来分离各个数据项,过滤冗余数据,最终完成数据抽取。实验结果表明,与MDR方法相比,该方法在处理拥有结构化数据的网页时,有更高的查全率和查准率。 展开更多
关键词 标签路径 结构化数据抽取 聚类
下载PDF
基于时间加权三部图的分众分类标签推荐算法 被引量:2
7
作者 李贵 王爽 +3 位作者 李征宇 韩子扬 孙平 孙焕良 《小型微型计算机系统》 CSCD 北大核心 2016年第2期269-274,共6页
分众分类作为一种公众对网络信息分类组织的方法,会随着新用户的增加生成大量的基于分众分类的标签元数据,传统的基于三部图的分众分类标签推荐算法没有考虑时间对用户偏好的影响,从而影响了标签推荐的准确性,提出一种基于时间加权三部... 分众分类作为一种公众对网络信息分类组织的方法,会随着新用户的增加生成大量的基于分众分类的标签元数据,传统的基于三部图的分众分类标签推荐算法没有考虑时间对用户偏好的影响,从而影响了标签推荐的准确性,提出一种基于时间加权三部图的分众分类标签推荐算法,将分众分类转化为一个加权无向三部图,应用BM25加权方案并结合标签的时间加权因子计算三部图的边权,并生成基于三部图的分众分类邻接矩阵.最后通过Katz值计算来预测标签节点与用户物品节点之间所有可能的路径权重之和,并依据路径权重来决定用户-物品对的个性化标签推荐排名.实验结果表明该方法较以往的标签推荐算法在准确率和召回率等性能指标上有明显提升. 展开更多
关键词 分众分类 三部图 时间加权 标签推荐
下载PDF
对象互操作的层次模型 被引量:2
8
作者 李贵 冯季昉 +2 位作者 韩子扬 郑新录 王国仁 《计算机科学》 CSCD 北大核心 2008年第11期251-254,共4页
在分析传统面向过程互操作的基础上,针对大规模环境下对象互操作问题,首先提出了一种对象互操作的分层结构模型,将对象互操作分为说明层、接口层和通信层互操作。针对每层互操作,提出了各自的机制与方法,为对象互操作提供了不同层次的... 在分析传统面向过程互操作的基础上,针对大规模环境下对象互操作问题,首先提出了一种对象互操作的分层结构模型,将对象互操作分为说明层、接口层和通信层互操作。针对每层互操作,提出了各自的机制与方法,为对象互操作提供了不同层次的透明性支持。 展开更多
关键词 对象互操作 类型匹配 操作捆绑 对象映射
下载PDF
面向领域的Web数据抽取与集成 被引量:1
9
作者 李贵 李征宇 +3 位作者 陈韶刚 韩子扬 孙平 孙焕良 《计算机科学》 CSCD 北大核心 2013年第06A期157-159,175,共4页
面向领域的Web数据挖掘包括领域Web数据抽取和领域Web数据集成。针对领域数据抽取,提出了Web结构数据模型和Web表模式,给出了Web表定位和数据记录抽取的算法,针对领域Web数据集成,提出了基于领域模型的数据集成算法。结合行业领域的实... 面向领域的Web数据挖掘包括领域Web数据抽取和领域Web数据集成。针对领域数据抽取,提出了Web结构数据模型和Web表模式,给出了Web表定位和数据记录抽取的算法,针对领域Web数据集成,提出了基于领域模型的数据集成算法。结合行业领域的实际需求,验证了模型和算法的有效性。 展开更多
关键词 Web结构数据模型 Web表模式 领域模型 领域数据抽取与集成
下载PDF
基于Web的实例扩展与属性值扩充方法 被引量:1
10
作者 李贵 陈韶刚 +3 位作者 韩子扬 李征宇 孙平 孙焕良 《计算机科学》 CSCD 北大核心 2014年第B11期411-418,共8页
实例扩展与属性值扩充是Web抽取与集成领域中的一个重要研究课题,将Web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数最大,且扩展集合不再更新来实现实例的扩展。同时,为了完善扩... 实例扩展与属性值扩充是Web抽取与集成领域中的一个重要研究课题,将Web数据列表和实例建模成二分图,根据扩展实例的质量分数,对扩展集合进行迭代更新直到扩展集合的质量分数最大,且扩展集合不再更新来实现实例的扩展。同时,为了完善扩展实例的属性信息,对结构化数值属性或离散属性进行抽取,提出了基于整数线性规划的属性值扩充方法。实验表明,与以前的方法相比,本方法能更好地处理含有噪声数据的Web网页,并提高了抽取的准确率和召回率。 展开更多
关键词 实例扩展 属性值扩充 整数线性规划
下载PDF
2009至2012年血培养阳性结果分析及耐药性监测 被引量:1
11
作者 何梦博 蔡婧 +2 位作者 孙绍华 韩子扬 邱广斌 《微生物学杂志》 CAS CSCD 2013年第4期93-97,共5页
了解解放军202医院2009至2012年血培养阳性病原菌分布及耐药性监测,为临床合理选用抗菌药物提供依据。使用全自动血培养仪进行血液培养,用VITEK-2全自动微生物鉴定系统进行菌株鉴定和药敏试验。从453例血培养阳性标本中共分离出462株病... 了解解放军202医院2009至2012年血培养阳性病原菌分布及耐药性监测,为临床合理选用抗菌药物提供依据。使用全自动血培养仪进行血液培养,用VITEK-2全自动微生物鉴定系统进行菌株鉴定和药敏试验。从453例血培养阳性标本中共分离出462株病原菌,其中革兰阴性杆菌274株,占59.30%;革兰阳性球菌167株,占36.14%;革兰阳性杆菌1株,占0.22%;真菌20株,占4.32%。最常见的感染菌分别为金黄色葡萄球菌、大肠埃希菌、肺炎克雷伯菌、凝固酶阴性葡萄球菌。89株金黄色葡萄球菌中检出MRSA 9株,46株凝固酶阴性葡萄球菌中检出MRCoN 6株,对青霉素耐药率分别达81.35%和85.00%,革兰阳性球菌中未发现对利奈唑胺和万古霉素耐药的菌株。鲍曼不动杆菌对美罗培南耐药率高达51.7%。解放军202医院血液感染以葡萄球菌和大肠埃希菌为主,且耐药率高,应对血液细菌进行长期的耐药性监测,为临床合理使用抗生素提供理论依据。 展开更多
关键词 血液培养 病原菌分布 耐药性监测
下载PDF
纳米位置控制系统自适应滤波器设计 被引量:1
12
作者 侯静 刘涛 +1 位作者 刘金鑫 韩子扬 《控制工程》 CSCD 北大核心 2019年第6期1153-1157,共5页
纳米位置控制系统由于其控制精度达到纳米级,因此合理选择数字滤波器类型,正确设计数字滤波器算法是保证纳米控制系统定位精度的重要因素,但现有用于纳米位置控制系统的噪声滤波器采用传统的带阻滤波器,其参数固定。一旦纳米位置控制系... 纳米位置控制系统由于其控制精度达到纳米级,因此合理选择数字滤波器类型,正确设计数字滤波器算法是保证纳米控制系统定位精度的重要因素,但现有用于纳米位置控制系统的噪声滤波器采用传统的带阻滤波器,其参数固定。一旦纳米位置控制系统发生移动或者改变负载,噪声特性将随之发生变化,因此,常规定常数的滤波器难以有效滤除系统噪声。针对该问题,采用文化算法和案例推理技术,提出了纳米位置控制系统带阻滤波器参数自适应整定方法。实验结果证明提出的数字带阻滤波器的能够有效滤除纳米位置控制系统中的系统机械结构噪声,有效保证了系统的稳定性。 展开更多
关键词 滤波器 纳米位置控制 文化算法 案例推理
下载PDF
人工智能在数据结构智能教学系统中的应用 被引量:1
13
作者 李征宇 韩子扬 +1 位作者 孙平 孙晓娟 《教育教学论坛》 2013年第12期260-261,共2页
智能教学系统(ITS)是人工智能与教育结合的主要形式,本文针对数据结构智能教学系统(DataStructure Intelligent Tutoring System,简称DSITS)的构成进行分析,讨论了人工智能的技术方法在DSITS构建中的应用以及对于教学效果的改善。
关键词 ITS DSITS 人工智能
下载PDF
嵌套数据记录列表页的Web信息抽取
14
作者 李贵 张琪 +2 位作者 郑新录 韩子扬 李征宇 《郑州大学学报(理学版)》 CAS 北大核心 2011年第2期20-23,共4页
在已有嵌套数据挖掘算法的基础上,加入了数据区域挖掘算法,根据构造出的嵌套数据列表页的标签树,找出所有的数据区域,再对数据区域进行统一处理,对所有子树应用部分树对齐算法进行匹配,生成全局模式,进而抽取出所有数据记录.与原算法相... 在已有嵌套数据挖掘算法的基础上,加入了数据区域挖掘算法,根据构造出的嵌套数据列表页的标签树,找出所有的数据区域,再对数据区域进行统一处理,对所有子树应用部分树对齐算法进行匹配,生成全局模式,进而抽取出所有数据记录.与原算法相比,改进后的算法在确保准确性的基础上,有效地提高了原算法在处理多数据区域时的效率. 展开更多
关键词 嵌套数据 列表页 标签树 数据区域 全局模式
下载PDF
基于领域模式的Web数据抽取与集成系统研究与实现
15
作者 李贵 耿传杰 +1 位作者 韩子扬 李征宇 《计算机科学与应用》 2016年第4期203-215,共13页
提供面向领域的信息增值服务是Web数据挖掘的目标之一,面向领域的Web数据抽取与集成是提供领域信息增值服务的基础,也是Web数据挖掘领域的一个主要研究方向,结合领域需求,本文提出一种面向领域的Web数据抽取与集成架构,在给出Web数据模... 提供面向领域的信息增值服务是Web数据挖掘的目标之一,面向领域的Web数据抽取与集成是提供领域信息增值服务的基础,也是Web数据挖掘领域的一个主要研究方向,结合领域需求,本文提出一种面向领域的Web数据抽取与集成架构,在给出Web数据模型与Web数据模式、领域数据模型和领域数据模式等相关概念基础上,提出Web数据模式与领域数据模式的映射方法和数据层次上的集成方法,用于解决集成过程中的模式层次和数据层次的冲突问题,并讨论了web数据抽取和领域增值服务的实现方法。结合实际需求开发了房地产信息平台及综合应用系统,验证了模型和算法的有效性。 展开更多
关键词 Web数据模型与模式 领域数据模型与模式 领域数据抽取与集成 领域增值服务
下载PDF
一种基于标签的Top-N个性化推荐算法 被引量:9
16
作者 马闻锴 李贵 +2 位作者 李征宇 韩子扬 曹科研 《计算机科学》 CSCD 北大核心 2019年第S11期224-229,共6页
随着Web2.0的发展,UGC标签系统受到越来越多的关注,标签既能反映用户的兴趣又能描述物品的本身特征。现有的标签推荐算法没有考虑用户的连续行为所产生的影响,而传统的基于马尔可夫链(Markov Chain)的推荐算法虽然侧重于研究用户的连续... 随着Web2.0的发展,UGC标签系统受到越来越多的关注,标签既能反映用户的兴趣又能描述物品的本身特征。现有的标签推荐算法没有考虑用户的连续行为所产生的影响,而传统的基于马尔可夫链(Markov Chain)的推荐算法虽然侧重于研究用户的连续行为来产生推荐,但它是直接作用于用户与物品的二维关系,并不适用于基于UGC的标签推荐。因此,通过结合马尔可夫链和协同过滤的思想,提出了一种基于标签的个性化推荐算法。该算法将〈用户-标签-物品〉的三维关系拆分为〈用户-标签〉和〈标签-物品〉两个二维关系。首先通过马尔可夫链模型计算用户对标签的兴趣度,再通过推荐标签集来匹配与其相对应的物品。为了提高推荐的精准率,该算法利用标签之间的影响,并基于匹配物品中所含标签间存在的关联关系对物品进行满意度建模,该模型是一种概率模型。在计算用户-标签和用户-物品之间的兴趣度和满意度时使用了协同过滤的思想来补全稀疏值。在公开的数据集中,与现有算法相比,该算法在精准率、召回率上均有明显提高。 展开更多
关键词 推荐系统 标签 马尔可夫链(MC) 满意度模型 协同过滤(CF)
下载PDF
基于时域产品模型的居住物业批量评估系统研究
17
作者 李征宇 孙平 韩子扬 《电脑知识与技术》 2015年第8X期119-120,共2页
居住物业在我国房地产市场中具有重要的作用,构建适宜地、自动化的居住物业批量评估系统,为客观、公正、科学、高效的房地产批量评估提供技术支持已成为房地产信息化发展的一个重要方向。本文在介绍时域产品模型的基础上,采用B/S与C/S... 居住物业在我国房地产市场中具有重要的作用,构建适宜地、自动化的居住物业批量评估系统,为客观、公正、科学、高效的房地产批量评估提供技术支持已成为房地产信息化发展的一个重要方向。本文在介绍时域产品模型的基础上,采用B/S与C/S混合的网络架构,利用My Eclipse7.0+Struts+Sql Server 2008+Ajax+Jsp.net等平台工具,设计并实现了居住物业批量评估系统。实际应用证实,该系统可以实现居住物业的批量评估,相对于基于传统自动估价模型(AVM)的批量评估系统,具有更好的适应性、工作效率和精准性。 展开更多
关键词 居住物业 批量评估 时域产品
下载PDF
Web数据转换模式映射优化方法 被引量:1
18
作者 纪宇航 李贵 +2 位作者 李征宇 韩子扬 曹科研 《数据挖掘》 2020年第1期76-89,共14页
Web数据转换是Web异构数据源集成的重要研究之一,通常分为实例层和模式层两方面进行。本文的研究主要针对模式层,由于给定的源到目标模式映射通常使数据转换结果包含大量冗余,为了生成不含冗余的数据作为数据转换核解,本文设计了一种基... Web数据转换是Web异构数据源集成的重要研究之一,通常分为实例层和模式层两方面进行。本文的研究主要针对模式层,由于给定的源到目标模式映射通常使数据转换结果包含大量冗余,为了生成不含冗余的数据作为数据转换核解,本文设计了一种基于同态关系的模式映射设计与优化方法。该方法首先引入模式映射之间的同态关系作为模式映射重写方法基础,通过对模式映射进行分解,定义不同规则生成的数据冗余的大小程度,确定需要重写的规则。最后将给定的模式映射重写为能够直接生成核解的核模式映射,并将其转换为可执行的SQL语句来计算核解。本文实验使用来自中国土地市场网的数据验证本文方法的有效性。 展开更多
关键词 Web大数据 数据转换 模式映射 核解 同态关系
下载PDF
一种基于属性显著度的实体解析算法 被引量:1
19
作者 褚良旭 李贵 +2 位作者 李征宇 韩子扬 曹科研 《数据挖掘》 2021年第2期27-37,共11页
实体解析(ER)是数据集成和数据清洗的一个重要步骤。在领域数据清洗与集成中,实体中不同的属性通常能表现出不同的区分能力,计算并利用属性的区分能力能够提高记录相似度的精确度。目前实体解析的方法有采用基于字符串的记录相似度算法... 实体解析(ER)是数据集成和数据清洗的一个重要步骤。在领域数据清洗与集成中,实体中不同的属性通常能表现出不同的区分能力,计算并利用属性的区分能力能够提高记录相似度的精确度。目前实体解析的方法有采用基于字符串的记录相似度算法以及基于机器学习的算法等方法来计算记录相似度,缺少考虑不同属性的重要程度。因此本文利用SimRank和PageRank算法的思想并结合随机抽样得到的属性显著度提出了一种基于属性显著度的计算记录相似度算法。首先,构造一个加权的属性记录对二部图来表示属性与记录对之间的关系;其次,根据属性显著度结合图论相似度算法提出了基于属性显著度的计算记录相似度的迭代算法。最后,构造一个记录图来表示记录对之间的匹配概率(二部图中的权值 w(ri,rj)),并使用改进的随机游走算法估计记录对匹配的概率。再将记录对的匹配概率反馈给加权的属性记录对二部图,并对基于属性显著度的计算记录相似度算法中的权值w(ri,rj) 进行修正,直到收敛。利用房地产领域数据集进行了实验评估,结果表明,本文提出的基于属性显著度的实体解析算法与主流方法相比,具有较高的精确度。 展开更多
关键词 实体解析 属性显著度 二部图 随机游走
下载PDF
半结构化实体解析算法 被引量:1
20
作者 韦海浪 李贵 +2 位作者 李征宇 韩子扬 曹科研 《数据挖掘》 2020年第1期1-15,共15页
实体解析是指识别一个或多个数据集中的相似或相同的记录。该文主要针对模式未知的半结构化数据,提出了一种基于字符串相似度的实体解析算法,将记录分成多个子字符串,采用编辑相似度计算子字符串之间关联度,在此基础上引入二分图最大加... 实体解析是指识别一个或多个数据集中的相似或相同的记录。该文主要针对模式未知的半结构化数据,提出了一种基于字符串相似度的实体解析算法,将记录分成多个子字符串,采用编辑相似度计算子字符串之间关联度,在此基础上引入二分图最大加权匹配算法度量记录之间的关联度。由于该方法的计算时间复杂度比较高,对于Web大数据集实体解析来说,所需的时间成本较大,因此,该文还提出了一种基于集合相似度的实体解析算法,将记录看作所有属性值的集合,每个属性值作为集合中的元素,用一个标记数组来表示每个元素,根据这些标记数组为每个记录创建一个签名,找出与签名相匹配的其他相似记录。并且采用优化后的最大匹配算法来选出真正相似的记录。最后,该文采用实际数据集进行实验验证了上述方法比传统方法更有效。 展开更多
关键词 实体解析 编辑相似度 集合相似度 二分图最大加权匹配
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部