期刊文献+
共找到33篇文章
< 1 2 >
每页显示 20 50 100
学习型过滤器综述
1
作者 李猛 戴海鹏 +2 位作者 眭永熙 顾荣 陈贵海 《计算机科学》 CSCD 北大核心 2024年第1期41-49,共9页
作为一种高效的概率性结构,过滤器可以高效地解决近似集合成员查询问题。近年来,随着机器学习技术的发展,一些学习型过滤器表现出色,超越了传统的过滤器。这些学习型过滤器考虑数据分布信息,将集合成员查询问题视为二分类问题,实现了超... 作为一种高效的概率性结构,过滤器可以高效地解决近似集合成员查询问题。近年来,随着机器学习技术的发展,一些学习型过滤器表现出色,超越了传统的过滤器。这些学习型过滤器考虑数据分布信息,将集合成员查询问题视为二分类问题,实现了超越传统过滤器的性能。受此启发,学习型过滤器研究领域迅速发展,出现了多个变种。然而,目前还缺乏对近些年相关工作的系统性回顾和比较。为了填补上述空缺,文中全面回顾了近年来的学习型过滤器相关工作,并展望了未来的发展方向。 展开更多
关键词 近似成员资格查询 机器学习 BLOOM过滤器 学习型过滤器 假阳率
下载PDF
基于查询语义和NI-LPA的知识图谱划分研究
2
作者 徐航 刘宇 《计算机与数字工程》 2024年第6期1727-1732,1738,共7页
当前未考虑语义知识的图谱划分方法会导致知识图谱划分后查询通信量增大、查询执行效率降低。鉴于常用查询语句中的语义知识可用于聚合关联度高的子图结构,且NI-LPA(Node Importance-Label Propagation Algorithm)具有支持多标签、时间... 当前未考虑语义知识的图谱划分方法会导致知识图谱划分后查询通信量增大、查询执行效率降低。鉴于常用查询语句中的语义知识可用于聚合关联度高的子图结构,且NI-LPA(Node Importance-Label Propagation Algorithm)具有支持多标签、时间复杂度低和划分质量高的特点,提出了基于查询语义和NI-LPA的知识图谱划分方法。该方法对常用SPARQL查询集进行语义分析,利用分析结果计算知识图谱中节点间的语义关联度,并将关联度与NI-LPA中代表结构特征的节点重要度相结合,从而得到节点间的传播力度,使重要节点与其语义相关度高的节点更易具有相同的标签。实验结果表明,相较于COPRA和NI-LPA算法,该方法不仅能减少边割率和通信量,而且能在保证冗余度较低的情况下有效地提升查询同区率。 展开更多
关键词 知识图谱划分 多标签传播算法 语义 通信量 查询同区率
下载PDF
基于Skyline Query的高声誉用户识别方法研究 被引量:2
3
作者 刘晓露 贾书伟 +1 位作者 刘建国 王建民 《复杂系统与复杂性科学》 EI CSCD 2018年第2期62-70,共9页
用户声誉的研究对于互联网金融和电子商务的健康发展具有重要意义,是在线用户行为分析中一个重要的研究方向。在线用户评分系统中研究学者提出了许多声誉度量算法,然而不同方法度量用户声誉的思想和角度是不同的。为了在海量数据中对用... 用户声誉的研究对于互联网金融和电子商务的健康发展具有重要意义,是在线用户行为分析中一个重要的研究方向。在线用户评分系统中研究学者提出了许多声誉度量算法,然而不同方法度量用户声誉的思想和角度是不同的。为了在海量数据中对用户声誉有一个总体的认识,提出一种基于Skyline Query的高声誉用户识别方法。将已有的几种声誉度量方法进行分类,综合选取代表性的算法得到的用户声誉用Skyline查询方法找到的集合Skyline中不被其他用户所支配的用户,即为高声誉用户。同时分析不同时间段上得到的集合Skyline中高声誉用户的规律。本文综合多种声誉度量方法从定性角度对声誉进行应用研究,拓宽了用户声誉研究的广度。 展开更多
关键词 在线评分系统 用户声誉 SKYLINE query 高声誉用户
下载PDF
基于XML的分布式异构数据同步系统设计 被引量:3
4
作者 唐良运 邹文景 +1 位作者 甘莹 孙刚 《电子设计工程》 2023年第18期46-50,共5页
为解决分布式数据传输丢包率过高的问题,建立更加稳定的异构信息同步共享环境,设计基于XML的分布式异构数据同步系统。借助数据转化模块,制定必要的XML生成与解析语句,利用异构模式提取模块,将分布式信息转存至数据库主机中,完成同步系... 为解决分布式数据传输丢包率过高的问题,建立更加稳定的异构信息同步共享环境,设计基于XML的分布式异构数据同步系统。借助数据转化模块,制定必要的XML生成与解析语句,利用异构模式提取模块,将分布式信息转存至数据库主机中,完成同步系统硬件执行环境的搭建。在此基础上,定义异构数据的分布型格式,根据已知的异构参数设定标准,建立同步性查询规则,完成系统软件执行环境的搭建,结合相关硬件设备结构,实现基于XML的分布式异构数据同步系统设计与应用。实验结果显示,与FPGA多通道型系统相比,基于XML语言的处理系统在面对传输分布式数据时,明显具备更低的丢包率水平,符合维护稳定性异构信息同步共享环境的实际应用需求。 展开更多
关键词 XML语言 异构数据 模式提取 分布型格式 同步查询 传输丢包率
下载PDF
基于MySQL的数据库服务器性能测试 被引量:22
5
作者 李现艳 赵书俊 初元萍 《核电子学与探测技术》 CAS CSCD 北大核心 2011年第1期48-52,共5页
中国散裂中子源(CSNS)谱仪靶站控制系统计划使用MySQL数据库作为备份数据库。利用PC-Farm集群环境对特定的数据库服务器做了性能测试,着重测试了查询速度、插入速度与连接线程数的关系,以及数据量大小对查询速度和插入速度的影响。主要... 中国散裂中子源(CSNS)谱仪靶站控制系统计划使用MySQL数据库作为备份数据库。利用PC-Farm集群环境对特定的数据库服务器做了性能测试,着重测试了查询速度、插入速度与连接线程数的关系,以及数据量大小对查询速度和插入速度的影响。主要介绍了测试的硬件环境、软件环境和测试方法步骤,并对测试得到的数据进行了数据处理和结果分析。测试方法和结果为CSNS谱仪靶站数据库服务器的选型和数据库系统的设计提供了重要的参考。 展开更多
关键词 MYSQL 数据库服务器 查询速度 插入速度 连接线程数
下载PDF
无结构覆盖网络中面向搜索范围最小化的副本分布 被引量:7
6
作者 冯国富 李文中 +2 位作者 张金城 陆桑璐 陈道蓄 《计算机学报》 EI CSCD 北大核心 2011年第4期628-635,共8页
复制技术常用于无结构覆盖网络,用以提高系统性能.在复制技术中有一个基础性问题经常被论及:给定访问频率和存储空间,系统该为每个数据保留多少副本?平方根分布在过去通常被认为最优,即当每个数据的副本数量正比于数据大小和访问频率的... 复制技术常用于无结构覆盖网络,用以提高系统性能.在复制技术中有一个基础性问题经常被论及:给定访问频率和存储空间,系统该为每个数据保留多少副本?平方根分布在过去通常被认为最优,即当每个数据的副本数量正比于数据大小和访问频率的平方根时,系统在搜索过程中转发的消息数量最少.但文中工作表明,该观点并非总是正确的.首先,我们认为,为了达到理论最优,每个数据的副本数量应该反比于数据大小的平方根.其次,在现实环境中,当TTL较小或副本密度较小时,平方根分布并非最优.文中首先对问题进行形式化描述和建模,给出理论答案,然后用模拟实验验证了提出的观点,并分析了文中结论与平方根分布不一致的原因.尽管文中结论是以P2P背景得出的,但它同样适用于那些以应用层无结构覆盖网络管理资源的分布式系统. 展开更多
关键词 无结构覆盖网络 副本数量分布 搜索范围 访问频率 数据大小
下载PDF
轨迹数据压缩综述 被引量:19
7
作者 江俊文 王晓玲 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第5期61-76,共16页
移动终端的普及和全球定位系统(Global Positioning System,GPS)的发展,产生了海量的移动轨迹数据.许多基于位置服务(Location-Based Services,LBS)利用这些轨迹数据为用户提供服务.但是轨迹数据的日益增多也带来了许多挑战:数据量巨大... 移动终端的普及和全球定位系统(Global Positioning System,GPS)的发展,产生了海量的移动轨迹数据.许多基于位置服务(Location-Based Services,LBS)利用这些轨迹数据为用户提供服务.但是轨迹数据的日益增多也带来了许多挑战:数据量巨大、查询延时增长、数据冗余.因此,轨迹压缩对于提供更好的服务是非常有必要的.轨迹压缩的目标是在满足压缩轨迹与原始轨迹之间的相似度条件下,尽可能减小轨迹数据量.本文回顾了已有的轨迹压缩工作,包括线段简化压缩方法、基于路网的压缩方法和语义压缩方法,并介绍了基于压缩轨迹的查询处理和轨迹管理系统. 展开更多
关键词 轨迹数据 压缩 查询 管理 压缩率
下载PDF
可信数据库环境下面向服务的自适应密文数据查询方法 被引量:10
8
作者 宋伟 彭智勇 +3 位作者 程芳权 李文海 胡文斌 任毅 《计算机学报》 EI CSCD 北大核心 2010年第8期1324-1338,共15页
实现加密数据的高效安全查询是保证可信数据库安全性和实用性的关键.与目前加密数据查询采用的静态密文分段方法不同,论文基于加密数据的分布和用户查询类型、分布规律,提出了一种自适应加密索引AEI(Adaptive Encrypted Index),实现面... 实现加密数据的高效安全查询是保证可信数据库安全性和实用性的关键.与目前加密数据查询采用的静态密文分段方法不同,论文基于加密数据的分布和用户查询类型、分布规律,提出了一种自适应加密索引AEI(Adaptive Encrypted Index),实现面向服务的加密数据查询.AEI通过分析查询服务对查询性能的影响,根据承载服务特性、密文数据分布、用户查询分布采用自适应的加密索引划分策略,获得更好的加密数据查询性能.基于AEI方法可在可信数据库环境下实现密文数据查询,并通过了相关性能测试.实验数据表明,与其它加密数据查询方法相比,AEI方法具有更好的适应性和更高的加密数据查询效率. 展开更多
关键词 自适应加密索引 DAS模型 可信数据库 密文数据查询 查询假阳性率
下载PDF
基于最佳桶划分策略的密文索引技术 被引量:6
9
作者 王迪 刘国华 于醒兵 《小型微型计算机系统》 CSCD 北大核心 2008年第4期649-652,共4页
在过去的几十年中,人们一直为寻求适用于数据库系统且安全高效的数据加密方法而努力,取得了一些研究成果,但到目前为止仍然没有解决加密后秘密查询命中率低、后处理代价大和密文索引安全性差的问题.本文将视图安全的判定条件k-匿名引入... 在过去的几十年中,人们一直为寻求适用于数据库系统且安全高效的数据加密方法而努力,取得了一些研究成果,但到目前为止仍然没有解决加密后秘密查询命中率低、后处理代价大和密文索引安全性差的问题.本文将视图安全的判定条件k-匿名引入到了对密文索引列安全性的判定中,并针对由于构建密文索引而造成的信息泄露问题,提出了通过构造哈希函数和对多敏感属性统一进行桶划分并建立密文索引两种解决方案.最后提出了一种最佳桶划分策略,在桶划分子区间数目根据安全要求被限定的情况下,利用该桶划分算法建立密文索引可获得最优的查询命中率,从而平衡了密文索引的安全性和查询效率的问题. 展开更多
关键词 数据库加密 密文索引 信息泄露 查询命中率 最佳桶划分
下载PDF
基于信息熵的DNS拒绝服务攻击的检测研究 被引量:6
10
作者 严芬 丁超 殷新春 《计算机科学》 CSCD 北大核心 2015年第3期140-143,共4页
DNS服务器在Internet中具有至关重要的作用,对它进行攻击会影响网络向用户提供正常的服务。DNS Query Flood攻击是最为常见的一种攻击方式,它向DNS服务器发送大量伪造的域名解析请求,消耗DNS服务器的资源,造成拒绝服务。及时检测到此类... DNS服务器在Internet中具有至关重要的作用,对它进行攻击会影响网络向用户提供正常的服务。DNS Query Flood攻击是最为常见的一种攻击方式,它向DNS服务器发送大量伪造的域名解析请求,消耗DNS服务器的资源,造成拒绝服务。及时检测到此类攻击的存在至关重要。在研究DNS解析过程的基础上,总结DNS Query Flood攻击的特点;根据攻击的特点,结合信息熵来判断网络是否出现异常;利用滑动窗口机制来确定是否存在攻击。 展开更多
关键词 DNS query Flood 拒绝服务 域名解析成功率 信息熵 滑动窗口
下载PDF
无线传感器网络多频率查询的节能优化 被引量:1
11
作者 陈颖文 徐明 虞万荣 《电子学报》 EI CAS CSCD 北大核心 2008年第4期701-708,共8页
在多频率查询的无线传感器网络中,多个接收节点以不同的查询频率请求同一个数据源节点的数据.由于查询频率的不同,如何共享传输链路以降低能耗成为一个新的研究问题.考虑数据序列之间的数据相关性,本文提出了一种节能优化方法,通过在共... 在多频率查询的无线传感器网络中,多个接收节点以不同的查询频率请求同一个数据源节点的数据.由于查询频率的不同,如何共享传输链路以降低能耗成为一个新的研究问题.考虑数据序列之间的数据相关性,本文提出了一种节能优化方法,通过在共享链路上广播整合频率的数据序列,再根据需要重构出与查询请求相对应的数据序列.理论分析和模拟实验均表明,在可容忍的平均相对误差下,该方法能够节省能量的消耗. 展开更多
关键词 传感器网络 数据查询 多频率
下载PDF
对位置信息服务的连续查询攻击算法 被引量:1
12
作者 杨琼 俞立峰 《计算机应用》 CSCD 北大核心 2014年第1期95-98,170,共5页
为了解决连续查询攻击算法给位置信息服务(LBS)带来的安全隐患,基于已有的k-匿名化Cloaking算法提出了一种新的连续查询攻击算法——CQACA。该算法首先利用熵和查询匿名度量定义了查询识别率的目标函数,并结合元胞蚁群给出了目标函数的... 为了解决连续查询攻击算法给位置信息服务(LBS)带来的安全隐患,基于已有的k-匿名化Cloaking算法提出了一种新的连续查询攻击算法——CQACA。该算法首先利用熵和查询匿名度量定义了查询识别率的目标函数,并结合元胞蚁群给出了目标函数的求解算法。最后,利用移动对象数据生成器进行实验,深入研究了影响CQACA的关键因素,同时对比分析了该算法与Cloaking算法的性能差异:CQACA与实际数据的误差为13.27%,而Cloaking算法则为17.35%。结果表明CQACA具有一定的有效性。 展开更多
关键词 位置信息服务 连续查询攻击算法 查询匿名度量 查询识别率 元胞蚁群
下载PDF
个人信用报告查询中的风险分析与防范 被引量:6
13
作者 曾晨明 《征信》 北大核心 2014年第2期19-22,共4页
近年来,随着征信知识的普及,个人信用报告逐渐成为人们生活中的经济"身份证"。然而,个人信用报告违规查询的事件频频曝光,个人信用信息外泄的案件层出不穷,严重侵犯了信息主体的合法权益。通过现实案例,对个人信用报告查询中... 近年来,随着征信知识的普及,个人信用报告逐渐成为人们生活中的经济"身份证"。然而,个人信用报告违规查询的事件频频曝光,个人信用信息外泄的案件层出不穷,严重侵犯了信息主体的合法权益。通过现实案例,对个人信用报告查询中的三大环节进行剖析,分析个人信用报告查询中的风险隐患,并提出防范应对措施,以更好地维护信息主体权益。 展开更多
关键词 征信系统 个人信用报告 查询风险 防范措施
下载PDF
射频识别系统多标签防碰撞算法 被引量:1
14
作者 张继荣 江驰 刘亚丽 《西安邮电大学学报》 2015年第6期28-32,共5页
为提升射频识别(RFID)系统中单阅读器多标签环境的识别效率,给出一种在标签编码前缀相同条件下使用的混合算法。先通过Q算法调整帧长,使之与待识别标签总数近似相等,以达到最大识别效率,并给未识别的碰撞标签标记分组号,再对已分组的碰... 为提升射频识别(RFID)系统中单阅读器多标签环境的识别效率,给出一种在标签编码前缀相同条件下使用的混合算法。先通过Q算法调整帧长,使之与待识别标签总数近似相等,以达到最大识别效率,并给未识别的碰撞标签标记分组号,再对已分组的碰撞标签使用反向查询树算法(QTR)一一识别。根据EPC C1G1标准,在单阅读器多标签的系统环境下,选取标签编码长度为96位,分别在标签编码完全随机与标签编码前60位相同两种情况下进行仿真,结果表明在标签编码前缀相同时,较之QT算法、Q算法,混合算法可提高系统吞吐率,降低阅读器发送总时隙数。 展开更多
关键词 多标签防碰撞 混合算法 反向查询树 吞吐率
下载PDF
基于4 bit-CRC反馈网络的高速LVDS传输优化设计 被引量:3
15
作者 文丰 张宇 吴瑞华 《兵器装备工程学报》 CAS 北大核心 2019年第9期108-113,共6页
针对低压差分信号在恶劣环境中高速度、长距离传输链路中的丢数与误码问题,硬件关键电路设计采用高速LVDS芯片搭建,并增加发送端信号预加重与接收端均衡器处理;逻辑上,应用Verilog HDL构建了一种简单、实用的向前纠错反馈编解码方法,数... 针对低压差分信号在恶劣环境中高速度、长距离传输链路中的丢数与误码问题,硬件关键电路设计采用高速LVDS芯片搭建,并增加发送端信号预加重与接收端均衡器处理;逻辑上,应用Verilog HDL构建了一种简单、实用的向前纠错反馈编解码方法,数据收发端以每包数据8 KB采用4bit-CRC生成校验结果,接收端判断校验结果一致与否发送重传与非重传RS-422指令,配合收发端使用乒乓缓存,保证数据可靠高效传输。经验证,系统在长度94 m LVDS专用屏蔽双绞电缆中实现了240 Mbit/s零误码传输。 展开更多
关键词 低压差分信号传输 CRC校验 自动重传请求 零误码率
下载PDF
一种基于差分隐私保护的skyline查询方法
16
作者 张丽平 杨玉 +2 位作者 金飞虎 李松 郝忠孝 《西南交通大学学报》 EI CSCD 北大核心 2022年第5期982-989,共8页
为了解决差分隐私保护机制中重复攻击会泄露用户隐私的问题,提出了一种基于动态页敏感度调节的skyline查询方法.首先,提出了依据最优主导页的计算页敏感度方法,提高页敏感度计算的效率;其次,为了合理设置隐私预算值,提出了基于置信率的... 为了解决差分隐私保护机制中重复攻击会泄露用户隐私的问题,提出了一种基于动态页敏感度调节的skyline查询方法.首先,提出了依据最优主导页的计算页敏感度方法,提高页敏感度计算的效率;其次,为了合理设置隐私预算值,提出了基于置信率的隐私预算值调节方法;最后,基于隐私预算值动态更新查询次数的上界,实现了基于差分隐私保护的skyline查询方法.实验结果表明:所提出方法在隐私预算值设定小于0.8时,隐私数据的泄露数由787个降低到423个. 展开更多
关键词 SKYLINE查询 页敏感度 置信率 动态隐私预算 最大范围查询
下载PDF
基于三维分档布鲁姆过滤器的Top-k查询算法
17
作者 邹志文 寇爱军 +2 位作者 鞠时光 陈继明 王政辉 《江苏大学学报(自然科学版)》 EI CAS 北大核心 2012年第5期555-560,共6页
针对NRA算法和BPA算法查询效率不高、重复访问数据的问题,提出了一种基于三维分档布鲁姆过滤器表(TF)的Top-k查询算法(TKBFP).该算法使用TF对数据进行处理,以较低的误判率获得较高的访问效率并降低了内存消耗,利用最优位置索引策略,避... 针对NRA算法和BPA算法查询效率不高、重复访问数据的问题,提出了一种基于三维分档布鲁姆过滤器表(TF)的Top-k查询算法(TKBFP).该算法使用TF对数据进行处理,以较低的误判率获得较高的访问效率并降低了内存消耗,利用最优位置索引策略,避免重复访问数据对象.对TKBFP算法进行了严格的语义定义,推导出每一维BF中需要的哈希函数个数;以自主开发的Java程序为仿真平台,对TKBFP算法进行了试验,并对算法执行效率和存储性能进行评价.试验结果表明,该算法能够避免重复访问数据对象,并能以较低的误判率实现大规模数据的高效查询处理.与NRA和BPA相比,当属性列表超过4个时,开销明显降低,适合面向大规模数据的查询处理应用. 展开更多
关键词 过滤器 查询 索引 聚合 访问 误判率 TOP-K
下载PDF
以访问频率为路由方向感的无结构P2P搜索
18
作者 冯国富 张金城 +2 位作者 李文中 陆桑璐 陈道蓄 《计算机科学》 CSCD 北大核心 2011年第3期47-50,共4页
在全分布无结构P2P中,节点通常组织成为覆盖网络,通过查询消息在网络中广泛转发实现盲目搜索。由于数据存放位置独立于数据内容,一个节点并不清楚哪些节点更容易命中查询,因此发现路由方向感,提高查询消息转发有效性,对全分布无结构P2P... 在全分布无结构P2P中,节点通常组织成为覆盖网络,通过查询消息在网络中广泛转发实现盲目搜索。由于数据存放位置独立于数据内容,一个节点并不清楚哪些节点更容易命中查询,因此发现路由方向感,提高查询消息转发有效性,对全分布无结构P2P搜索具有重要意义。在相关工作中,主要从用户兴趣、本体论等语义角度聚类用户,减小搜索范围。但当前语义获取和语义描述等工作还不甚成熟,因此这些方法并没有得到广泛采用。提出了一种以访问频率为路由方向感的新型搜索方法QRRO。在QRRO中,每个节点被分配一权重标识;节点仅仅为访问频率与节点权重接近的数据建立索引;基于访问频率建立存储内容和存储位置之间的耦合关系,形成路由方向感。模拟实验表明,QRRO在提高搜索成功率、降低搜索路径长度方面是有效的。而且,由于访问频率是每个文件都具有的非语义属性,因此QRRO具有通用性。 展开更多
关键词 无结构P2P 路由方向感 访问频率 索引机制
下载PDF
动态无线传感网中数据查询技术的研究进展
19
作者 梁俊斌 马方强 蒋婵 《计算机科学》 CSCD 北大核心 2019年第11期41-48,共8页
无线传感器网络(Wireless Sensor Networks,WSN)是由大量通信、计算及存储能力有限的传感器节点通过自组织方式构成的网络,可以部署在恶劣环境中执行长期的监测任务。数据查询是WSN中最基础的操作之一,主要指用户通过特定节点向网络分... 无线传感器网络(Wireless Sensor Networks,WSN)是由大量通信、计算及存储能力有限的传感器节点通过自组织方式构成的网络,可以部署在恶劣环境中执行长期的监测任务。数据查询是WSN中最基础的操作之一,主要指用户通过特定节点向网络分发查询请求,而网络中满足要求的节点再将数据返回给用户。在查询过程中,由于网络存在动态性(如:节点由于受到外力破坏而损毁、移动或睡眠,导致网络拓扑及连通性发生变化;通信链路不可靠等),使得数据传输出现延迟大、能耗高甚至数据丢失等情况,导致查询成功率低。目前有很多学者对该问题进行了研究,并取得了一定的进展,但实际应用中依然有很多问题仍待解决。为了进一步推进动态无线传感网中数据查询技术的深入研究,对近年来的典型工作进行了分析、归纳和总结,并对比了它们的优缺点;然后讨论了该领域亟需解决的关键问题,并指出了下一步的研究方向。 展开更多
关键词 无线传感器网络 数据查询 动态性 数据传输 查询成功率
下载PDF
数字式图书馆海量文献数据查询优化仿真
20
作者 谢燕 《计算机仿真》 北大核心 2019年第6期426-429,共4页
探究有效的海量文献数据查询优化方法,能够提高数据查询的运行速度,加快响应时间,增强查全率,在使用过程中具有重要的现实意义。为了解决查询海量数据时存在响应时间较长、运行速度较慢、准确率较低等问题,提出基于改进遗传算法的数据... 探究有效的海量文献数据查询优化方法,能够提高数据查询的运行速度,加快响应时间,增强查全率,在使用过程中具有重要的现实意义。为了解决查询海量数据时存在响应时间较长、运行速度较慢、准确率较低等问题,提出基于改进遗传算法的数据查询优化方法,利用稀疏表示哈希算法构建海量文献数据模型,获取抽象空间中文献和文本信息的特征表示,计算二者隐藏在语义空间的相关近似值,得到海量文献数据目标函数。运用梯度将目标函数转换成新的适应度函数,利用函数值变化机率优化适应度函数,将十进制实数编码加入遗传算法中,根据概率选取染色体具有最小函数值时,由该值获取最优查询结果。仿真结果证明,所提方法在保证较短的平均响应时间和平均查询速度的基础上,提高查询的平均准确率和查全率。 展开更多
关键词 文献数据 查询优化 查询速度 平均准确率 查全率
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部