期刊文献+
共找到437篇文章
< 1 2 22 >
每页显示 20 50 100
薄盘工件加工过程中的不平衡量分析及去重方法研究
1
作者 万国良 张仕海 +1 位作者 屈重年 张宗艺 《现代制造工程》 CSCD 北大核心 2024年第4期123-128,共6页
薄盘工件是转子机构上常见的零/部件,在装配调试前通常需要进行动平衡测试与校正。目前常用的不平衡校正方法存在加工与校正分离、平衡工艺复杂,以及效率低等问题。基于该问题提出在薄盘工件加工过程中不平衡量校正的方法,结合复合数控... 薄盘工件是转子机构上常见的零/部件,在装配调试前通常需要进行动平衡测试与校正。目前常用的不平衡校正方法存在加工与校正分离、平衡工艺复杂,以及效率低等问题。基于该问题提出在薄盘工件加工过程中不平衡量校正的方法,结合复合数控机床的主轴准停、刀具定位及去重控制等功能,进行薄盘工件不平衡量在线去重校正。同时,为了提高薄盘工件不平衡量在线去重校正精度,提出一种附加去重率的迭代控制方法,并从理论上证明了该方法的稳定性。通过仿真计算讨论了附加去重率的迭代控制方法优势,探讨了理想去重率的选取问题。研究内容可以在无动平衡机的情况下实现薄盘工件不平衡量在线去重校正,对创新性解决薄片工件平衡成本高、效率低等问题以及提高工件加工精度等方面具有重要的意义。 展开更多
关键词 薄盘工件 不平衡量 去重建模 迭代去重 去重
下载PDF
基于模糊广义去重的图像轻量安全云存储方法
2
作者 陈海欣 唐鑫 +2 位作者 金路超 付耀文 周艺腾 《应用科学学报》 CAS CSCD 北大核心 2024年第5期769-781,共13页
广义去重是实现云数据安全去重的一种重要手段。现有的广义去重方法仅支持精确去重,且无法与图像加密技术有机结合。而图像加密技术本身也将给用户带来巨大的计算开销。针对以上挑战,本文提出一种基于模糊广义去重的图像轻量级安全云存... 广义去重是实现云数据安全去重的一种重要手段。现有的广义去重方法仅支持精确去重,且无法与图像加密技术有机结合。而图像加密技术本身也将给用户带来巨大的计算开销。针对以上挑战,本文提出一种基于模糊广义去重的图像轻量级安全云存储方法。首先对图像数据开展整数小波变换并提取低频分量作为基,高频分量作为偏移量,通过提出一种基于异或的轻量级加密算法,把图像的机密性保护方法与广义去重技术有机结合。此外,本文还对偏移量进行云端模糊去重,使得云端仅保存高度相似的偏移量数据的单个副本,实现了图像云数据的模糊广义去重。在相关的图像数据集上开展实验,结果表明在实现安全性的前提下,本文所提方法在改善通信效率和存储效率上有显著效果。 展开更多
关键词 图像去重 侧信道攻击 云存储 模糊去重 图像加密
下载PDF
自定义密钥的加密去重云存储访问控制方案
3
作者 谷博伦 徐子凯 +1 位作者 李卫海 俞能海 《网络与信息安全学报》 2024年第4期85-97,共13页
随着互联网的高速发展和应用,传统的存储资源难以满足日益增长的海量数据存储的需求,越来越多的用户尝试将他们的数据上传到第三方云服务器进行统一存储。如何在云上同时实现高效的加密重复数据删除和安全的文件共享已成为迫切需要解决... 随着互联网的高速发展和应用,传统的存储资源难以满足日益增长的海量数据存储的需求,越来越多的用户尝试将他们的数据上传到第三方云服务器进行统一存储。如何在云上同时实现高效的加密重复数据删除和安全的文件共享已成为迫切需要解决的问题。并且,用户总是喜欢自己设定密码对文件进行加解密,而在有需要时才对加密文件进行共享。据此,设计了一个确定性分步加密算法,当两步加密的密钥满足一定关系时,两步加密可以等效为一次加密。在此基础上提出了一个支持动态访问控制的云存储加密重复数据删除方案,使用确定性分步加密算法对文件进行加密,使用密文策略的属性基加密算法对文件密钥进行加密。这不仅使持有相同文件的不同用户均可以灵活地自定义各自的加解密密钥,而且还可以通过动态的访问控制机制确保安全的文件共享。此外,访问控制部分能够兼容大多数现有的密文策略属性基加密方案,甚至允许在不同的属性组中使用不同的密文策略属性基加密方案。安全性分析结果显示,该方案能够达到当前加密去重范式下的最高安全性。实验和分析结果表明,该方案能够较好地满足云服务商和用户的实际需求,具有良好的算法执行效率。 展开更多
关键词 加密去重 自定义密钥 访问控制 分步椭圆曲线加密 确定性改进型最优非对称加密填充
下载PDF
基于区块链智能合约的异构服务器安全去重方法
4
作者 江粼 李嘉兴 武继刚 《郑州大学学报(工学版)》 CAS 北大核心 2024年第5期95-102,142,共9页
针对大数据时代用户数据在云服务器存储中面临的可靠性提升与重复数据删除策略之间的冲突,提出了一种基于区块链智能合约的异构服务器数据安全去重方法,利用区块链的去中心化、不可篡改和公开透明等特性,以及智能合约的自动化执行能力,... 针对大数据时代用户数据在云服务器存储中面临的可靠性提升与重复数据删除策略之间的冲突,提出了一种基于区块链智能合约的异构服务器数据安全去重方法,利用区块链的去中心化、不可篡改和公开透明等特性,以及智能合约的自动化执行能力,实现了数据存储的安全性、可靠性和隐私保护。具体而言,方法结合了秘密共享和区块链智能合约技术,设计了安全高效的云存储数据去重服务。同时,通过区块链取代集中式第三方实体的功能,消除了潜在的安全隐患,并通过智能合约脚本缓解了服务器之间的异构性。实验结果表明:研究方法在相同文件大小、不同文件块数量的情况下的平均计算开销比对比方法低65.42%~115.77%,平均储存开销降低7.94%~19.50%。同时,在不同异构存储服务器数量下,平均计算开销与存储开销分别降低了67.27%~177.89%、34.01%~72.89%。研究方法在安全性、计算开销及存储开销方面优于现有的两个基于区块链的数据去重方法。 展开更多
关键词 区块链 云存储 智能合约 秘密共享方法 数据去重 安全性
下载PDF
云环境下改进自回归模型的网络数据去重仿真
5
作者 胡艳华 张春玉 +1 位作者 崔亚楠 倪志平 《计算机仿真》 2024年第1期443-446,536,共5页
云环境网络数据去重过程中,若不能及时对网络数据实施噪声抑制,会直接降低数据的去重效果,为提升数据去重精度,提出基于自回归模型的云环境中网络数据去重算法。建立云环境弹性空间模型,确定网络数据的空间自相关度量值完成数据去噪,基... 云环境网络数据去重过程中,若不能及时对网络数据实施噪声抑制,会直接降低数据的去重效果,为提升数据去重精度,提出基于自回归模型的云环境中网络数据去重算法。建立云环境弹性空间模型,确定网络数据的空间自相关度量值完成数据去噪,基于去噪结果详细分析云环境中网络数据属性特征;根据提取的属性特征对云环境中网络数据聚类处理,结合自回归模型建立网络冗余数据预测模型,精准预测出云环境中的网络冗余数据,并对其进行剔除处理,实现网络数据的精准去重。实验结果表明,使用该方法开展数据去重时能够有效去除网络数据中的冗余数据,去重效果较好。 展开更多
关键词 自回归模型 云环境 网络数据 去重算法 冗余数据预测模型
下载PDF
基于特征迭代的电力物资供应链数据去重研究 被引量:1
6
作者 王艳艳 金义 +1 位作者 钱诚 许晓艺 《微型电脑应用》 2024年第4期144-148,共5页
现有的电力物资供应链数据去重方法均出现去重不完全或删除正常数据的情况,为了加强数据去重效率,有效提高去重性能,提出基于特征迭代的电力物资供应链数据去重研究方法。该方法在特征迭代的帮助下对电力物资供应链数据展开特征提取以... 现有的电力物资供应链数据去重方法均出现去重不完全或删除正常数据的情况,为了加强数据去重效率,有效提高去重性能,提出基于特征迭代的电力物资供应链数据去重研究方法。该方法在特征迭代的帮助下对电力物资供应链数据展开特征提取以及特征分类的预处理,提前简化数据量,降低去重难度和计算量,计算预处理后的数据之间的相似度,利用Counting Bloom Filter算法,计算出符合删除操作的相似度数据,并对其删除,实现电力物资供应链数据去重。实验结果表明,所提方法的存储空间使用量小、去重能力好以及数据去重所需时间短。 展开更多
关键词 特征迭代 预处理 数据去重 相似度计算 特征提取
下载PDF
基于聚类分析和缓存优化的数据去重策略
7
作者 裴世豪 刘颖 +1 位作者 李佳阳 郝欣哲 《计算机应用文摘》 2024年第18期114-118,共5页
针对传统去重算法无法兼顾去重率和吞吐量的问题,设计了一种相似聚类重复数据删除算法。该算法基于数据相似性理论定义数据项间的相似度,将相似的数据项进行分类和标记,然后在缓存中保留每个聚类中的部分特征数据。当新数据录入时,算法... 针对传统去重算法无法兼顾去重率和吞吐量的问题,设计了一种相似聚类重复数据删除算法。该算法基于数据相似性理论定义数据项间的相似度,将相似的数据项进行分类和标记,然后在缓存中保留每个聚类中的部分特征数据。当新数据录入时,算法根据数据特征选择合适的聚类进行数据去重。此外,为高效利用有限的缓存,提出了一种基于随机森林算法的缓存优化方法,用于优化去重过程中使用的指纹缓存,以提高缓存指纹的命中率。该缓存模型基于传统的随机森林分类器,并使用改进的烟花算法(ELU函数优化)对随机森林的超参数进行优化,能够有效应对数据量过大、指纹过多以及缓存利用有限的问题。实验验证表明,与基于数据相似原理的RMD和Shingle方法相比,所提算法在去重率和吞吐量方面均提高了10%~15%。 展开更多
关键词 数据去重 灾难备份 数据相似性 烟花算法 随机森林
下载PDF
面向云存储的数据流行度去重方案
8
作者 何欣枫 杨琴琴 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第1期187-200,共14页
随着云计算的发展,企业和个人倾向于把数据外包给云存储服务器来缓解本地存储压力,导致云端存储压力成为一个日益突出的问题。为了提高云存储效率,降低通信成本,数据去重技术得到了广泛应用。现有的数据去重技术主要包括基于哈希表的相... 随着云计算的发展,企业和个人倾向于把数据外包给云存储服务器来缓解本地存储压力,导致云端存储压力成为一个日益突出的问题。为了提高云存储效率,降低通信成本,数据去重技术得到了广泛应用。现有的数据去重技术主要包括基于哈希表的相同数据去重和基于布隆过滤器的相似数据去重,但都很少考虑数据流行度的影响。实际应用中,用户外包给云服务器的数据分布是不均匀的,根据访问频率可以划分为流行数据和非流行数据。流行数据访问频繁,在云服务器中会存在大量的副本和相似数据,需要执行高精度的数据去重;而非流行数据访问频率低,云存储服务器中的副本数量和相似数据较少,低精度的去重即可满足要求。针对上述问题,将数据流行度和布隆过滤器相结合,提出一种基于数据流行度的动态布隆过滤器;同时,提出一种基于数据流行度的动态布隆过滤器的数据去重方案,可以根据数据流行度动态调整去重精度。仿真结果表明,该方案在时间消耗、空间消耗和误判率之间取得了良好的平衡。 展开更多
关键词 云计算 云存储 数据去重 数据流行度 布隆过滤器
下载PDF
基于图像云数据去重的高性能隐蔽通信方案
9
作者 陈阳辉 唐鑫 +2 位作者 郑婷婷 常瀚之 周艺腾 《应用科学学报》 CAS CSCD 北大核心 2024年第3期457-468,共12页
提出了一种基于图像云数据去重的高性能隐蔽通信方案。首先,以图像作为消息载体,利用图像区域的灰度均值差异实现一个文件同时映射到多个比特的效果,增强了通信的隐蔽性;然后,设计了一套基于分组的基础图像库,库内图像按指定顺序排列,... 提出了一种基于图像云数据去重的高性能隐蔽通信方案。首先,以图像作为消息载体,利用图像区域的灰度均值差异实现一个文件同时映射到多个比特的效果,增强了通信的隐蔽性;然后,设计了一套基于分组的基础图像库,库内图像按指定顺序排列,通过动态确定库内区间实现消息载体的随机化选择,并采用最低有效位算法嵌入与消息内容无关的辅助标记信息,保证了通信的安全性与可靠性;最后,提出了基于时间戳对齐区间的同步化机制,并引入多轮遍历策略和空数据分组概念对图像库进行高效利用,提高了通信的传输效率。实验结果证明,对比其他基于跨用户去重实现秘密信息隐蔽传输的研究,所提方案优化了文件上传次数与消息长度的关联性,有效提升了综合传输速率,进一步增强了通信的安全性和隐蔽性。 展开更多
关键词 隐蔽通信 跨用户去重 信息隐藏 云存储 同步
下载PDF
面向去中心化存储的数据流行度去重模型
10
作者 汪彩梅 闻琪略 +3 位作者 周子健 卢建豪 张琛 吴志泽 《计算机应用研究》 CSCD 北大核心 2024年第5期1544-1553,共10页
数据流行度去重方案中存在检测机构不诚实、数据存储不可靠等问题,提出一种面向去中心化存储的数据流行度去重模型。针对检测机构不诚实,模型结合区块链的不可窜改性与智能合约的不可抵赖性,将智能合约作为检测机构执行数据的重复性检... 数据流行度去重方案中存在检测机构不诚实、数据存储不可靠等问题,提出一种面向去中心化存储的数据流行度去重模型。针对检测机构不诚实,模型结合区块链的不可窜改性与智能合约的不可抵赖性,将智能合约作为检测机构执行数据的重复性检测和流行度检测,保障了检测结果的真实性。针对数据存储不可靠问题,提出一种文件链存储结构。该结构满足数据流行度去重的要求,并通过添加辅助信息的方式,建立分布在不同存储节点中实现物理/逻辑上传的分片之间的逻辑关系,为流行度数据去中心化网络存储提供基础;同时,在数据块信息中添加备份标识,借助备份标识将存储网络划分为两个虚拟存储空间,分别实现数据和备份数据的检测与存储,满足了用户备份需求。安全性分析和性能分析表明,该方案具有可行性,保障了检测结果的真实性,并提高了数据存储的可靠性。 展开更多
关键词 数据去重 数据流行度 去中心化 区块链 存储可靠性
下载PDF
上下文语义嵌入的变粒度云存储相似数据去重技术
11
作者 阳智欢 田纹龙 +2 位作者 何婷婷 叶旭明 唐佳 《计算机技术与发展》 2024年第4期16-23,共8页
针对云存储环境下现有相似数据去重技术效果不佳以及元数据开销大等问题,提出了上下文语义嵌入的变粒度云存储相似数据去重技术。该技术采用基于子块重组的特征提取算法,对数据块内容内部结构进行初步特征提取,并利用BP(Back Propagati... 针对云存储环境下现有相似数据去重技术效果不佳以及元数据开销大等问题,提出了上下文语义嵌入的变粒度云存储相似数据去重技术。该技术采用基于子块重组的特征提取算法,对数据块内容内部结构进行初步特征提取,并利用BP(Back Propagation)神经网络上下文感知模型将数据块上下文特征信息嵌入到初始特征中,实现了具有上下文语义嵌入的变粒度数据块。通过控制数据块大小,动态地合并相邻相似数据块或非冗余数据块,减少元数据开销,并对位于相似数据块和非冗余数据块之间过渡区域进行分割,从而获得更好的相似数据块表示形式。最后,为了评估其性能,实现了一个变粒度相似数据检测算法原型rCARD并在真实世界的数据集进行了实验,实验结果表明,与最新相似性检测去重技术Finesse相比,rCARD在实现更高重复数据删除率的同时,显著降低了元数据的大小,并且加速相似性检测速度高达11.07倍。 展开更多
关键词 相似数据去重 数据块语义 变粒度 云存储 元数据
下载PDF
转子动平衡去重技术对电机振动负面影响研究
12
作者 钟义旭 《微特电机》 2024年第8期44-47,共4页
为研究转子去重平衡工艺对电机振动的负面影响,以某款4极10槽有刷直流电机作为研究对象,对比去重平衡和加重平衡电机振动水平和齿槽转矩,发现采用去重平衡工艺电机的4阶切向振动、齿槽转矩显著变化。采用有限元方法分析去重工艺对电机... 为研究转子去重平衡工艺对电机振动的负面影响,以某款4极10槽有刷直流电机作为研究对象,对比去重平衡和加重平衡电机振动水平和齿槽转矩,发现采用去重平衡工艺电机的4阶切向振动、齿槽转矩显著变化。采用有限元方法分析去重工艺对电机齿槽转矩影响机理,不同去重切削量、切削位置对齿槽转矩的影响,提出均衡绕线分布的方式降低转子初始不平衡量,从而减小转子平衡校正去质量,进而减少对电机磁场、振动的负面影响。 展开更多
关键词 有刷直流电机 动平衡去重技术 电磁振动 齿槽转矩 绕线分布
下载PDF
基于音形码的地名地址数据相似度计算与去重方法
13
作者 严海峰 简梓红 江秀明 《北京测绘》 2024年第9期1271-1276,共6页
重复数据的处理是地名地址数据治理时一项重要的任务。本文针对广东省地名地址数据库存在的重复数据的问题,提出了一种基于音形码汉字相似度的计算方法,介绍了基于音形码地名地址去重的原理、流程和方法,并结合相关原理开发地名地址数... 重复数据的处理是地名地址数据治理时一项重要的任务。本文针对广东省地名地址数据库存在的重复数据的问题,提出了一种基于音形码汉字相似度的计算方法,介绍了基于音形码地名地址去重的原理、流程和方法,并结合相关原理开发地名地址数据去重软件。以荔湾区地名地址数据为实验数据,通过软件计算荔湾区地名地址数据库中数据的相似度,结合去重规则和距离的差异进行数据判断,解决地名地址数据库重复的问题,保证数据库的准确性。实验结果表明,该软件对重复数据的匹配程度较高,地名地址数据重复的问题可以通过音形码和距离双驱动方法得到有效解决,为其他区域地名地址数据治理提供可靠的解决方案。 展开更多
关键词 地名地址 音形码 相似度 距离 去重
下载PDF
基于Merkle哈希树的电力扰动数据安全去重方法
14
作者 李世明 卢建刚 +2 位作者 余志文 郭文鑫 汤健东 《计算技术与自动化》 2024年第3期135-140,共6页
针对当前去重方法存在伪基和伪偏移量问题,导致去重效果不佳,提出了基于Merkle哈希树的电力扰动数据安全去重方法。使用收敛加密方法,有效解决数据加密和去重矛盾,应用Merkle哈希树得到电力扰动数据块指纹,以此标记待去重电力扰动数据... 针对当前去重方法存在伪基和伪偏移量问题,导致去重效果不佳,提出了基于Merkle哈希树的电力扰动数据安全去重方法。使用收敛加密方法,有效解决数据加密和去重矛盾,应用Merkle哈希树得到电力扰动数据块指纹,以此标记待去重电力扰动数据。利用POW协议证明拥有权检测重复数据块。使用扰动状态似然代替对数似然,避免电力异常扰动状态在去重标识过程中重复,实现安全去重。由实验结果可知,该方法最大基提取为3000 B、最大偏移量为6000 B,均未超过实验设定阈值,说明所提方法去重效果较好。 展开更多
关键词 Merkle哈希树 电力扰动 数据安全去重 概率误差
下载PDF
基于增量定位与标记去重的云数据灾备技术
15
作者 杜岩冰 王晓锋 《网络空间安全科学学报》 2024年第2期66-75,共10页
通过云备份服务和威胁情报的结合,可以显著提升网络安全态势感知与响应能力。随着云网基础设施的不断拓展,数据量呈指数级增长,对云数据采取备份恢复措施成为威胁防御的重要环节。针对虚拟机快照备份等技术存在数据冗余严重、难以适应... 通过云备份服务和威胁情报的结合,可以显著提升网络安全态势感知与响应能力。随着云网基础设施的不断拓展,数据量呈指数级增长,对云数据采取备份恢复措施成为威胁防御的重要环节。针对虚拟机快照备份等技术存在数据冗余严重、难以适应分布式体系的问题,面向典型的OpenStack与Kubernetes分布式云平台设计了一种基于增量云数据去重的灾备技术。首先,设计了云数据灾备防御体系,以实现对差异性数据类型的覆盖性保护。其次,设计了增量云数据去重技术,提升了备份效率并实现了对备份数据的分布式与分离管理。实验证明,在数据的定期备份中相较于基于Backy2与Duplicacy的云备份方案,基于增量去重的云数据灾备技术在备份时间上分别平均节约了46.57%和41.73%,遭遇威胁进行灾难恢复的时间平均节约了7.23%与43.73%。 展开更多
关键词 云数据 增量定位 标记去重 威胁情报 数据安全
下载PDF
基于平衡二叉树的数控机床数据去重备份算法
16
作者 秦金祥 杨萌 《计算机仿真》 北大核心 2023年第1期548-552,共5页
针对传统数据备份算法无法有效剔除备份过程中所产生的冗余数据,导致数据存储空间利用率下降,提出基于平衡二叉树的数控机床数据去重备份算法。通过编辑距离算法计算数控机床数据的属性集,得到数据间的相似度,依靠Canopy算法获取数据的... 针对传统数据备份算法无法有效剔除备份过程中所产生的冗余数据,导致数据存储空间利用率下降,提出基于平衡二叉树的数控机床数据去重备份算法。通过编辑距离算法计算数控机床数据的属性集,得到数据间的相似度,依靠Canopy算法获取数据的关键属性,并结合数据相似度剔除存在重复记录的数据,最后将需要备份的机床元数据以时间戳作为基础,使用平衡二叉树算法对数据进行备份,并结合数据冗余挖掘模型,剔除在数据备份与恢复过程中所产生的冗余数据,实现数据去重备份。实验证明,所提方法可以有效避免因重复数据传输量提升而引起的带宽瓶颈效应,提升数据存储空间利用率。 展开更多
关键词 平衡二叉树 数控机床 数据去重 数据备份 数据挖掘
下载PDF
基于属性加密的块级云数据去重方案
17
作者 葛文婷 李卫海 俞能海 《网络与信息安全学报》 2023年第5期106-115,共10页
针对已有的云数据去重方案主要集中在文件级去重。提出了一种基于属性加密的支持数据块级去重的方案,对文件级和数据块级做双粒度去重,并由属性加密实现数据共享。在混合云架构上设计算法,私有云根据文件标签和数据块标签进行重复性检... 针对已有的云数据去重方案主要集中在文件级去重。提出了一种基于属性加密的支持数据块级去重的方案,对文件级和数据块级做双粒度去重,并由属性加密实现数据共享。在混合云架构上设计算法,私有云根据文件标签和数据块标签进行重复性检测和一致性检测,并由块级标签建立默克尔树,支持对用户进行所有权证明。用户上传密文,私有云应用线性秘密共享技术,向密文添加访问结构和辅助信息,并为新的拥有权限的用户更新整体的密文信息。由私有云做代理重加密和代理解密,在无法获得明文的情况下承担大部分计算,减轻用户的计算时间开销。处理好的密文和标签存入公有云中,由私有云进行存取。安全性分析表明,所提方案在私有云可达到PRV-CDA(privacy chosen-distribution attacks)安全。分别对固定分块大小改变属性个数和固定属性个数改变分块大小两种情况进行仿真实验,应用4种椭圆曲线加密测试密钥生成、加密和解密计算时间,结果符合线性秘密共享的特性。仿真实验和开销分析表明所提方案可提升去重效率,并降低计算时间开销。 展开更多
关键词 数据去重 云存储 属性加密 所有权证明 线性访问结构
下载PDF
基于事件异构图表示的文本去重算法 被引量:2
18
作者 艾玮 许佳 +1 位作者 谢灿豪 孟涛 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第2期74-85,共12页
基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过... 基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过事件异构图表示新闻文本的全局语义与结构信息,然后提出双标签图核算法表征事件异构图,实现深度表征图的结构及语义信息.实验结果表明,该研究提出的去重算法比现有的基于图结构的文本表示去重方法在F1-score指标上提升了10%.最后,该算法能提高新闻文本的去重效果. 展开更多
关键词 图核算法 事件异构图 新闻文本 文本表示 文本去重
下载PDF
薄盘工件不平衡量在线测算及去重试验研究
19
作者 张仕海 朱冶诚 《航空制造技术》 CSCD 北大核心 2023年第11期102-106,共5页
基于薄盘类零件具有较大径厚比,且不平衡量可以看作分布在一个平面内的特点,提出一种基于夹载工件前后机床主轴不平衡振动信号的变化而间接、在线测算薄盘类工件不平衡量的方法。基于附加不平衡振动检测系统、复合数控机床的主轴准停、... 基于薄盘类零件具有较大径厚比,且不平衡量可以看作分布在一个平面内的特点,提出一种基于夹载工件前后机床主轴不平衡振动信号的变化而间接、在线测算薄盘类工件不平衡量的方法。基于附加不平衡振动检测系统、复合数控机床的主轴准停、刀具定位及去重控制等功能,提出薄盘工件不平衡量在线去重校正的理念。通过试验证实了工件不平衡量在线测算及校正的可行性。本研究可以在无动平衡机的条件下实现薄盘工件不平衡量的在线测算与去重校正,在节省工件平衡成本、提高工件平衡效率与加工精度等方面具有参考价值。 展开更多
关键词 薄盘工件 不平衡量 在线测算 在线去重 机床主轴
下载PDF
基于关键词图表示的文本语义去重算法
20
作者 汪锦云 向阳 《计算机应用》 CSCD 北大核心 2023年第10期3070-3076,共7页
网络中存在大量语义相同或者相似的冗余文本,而文本去重能够解决冗余文本浪费存储空间的问题,并能为信息抽取任务减少不必要的消耗。传统的文本去重算法依赖文字重合度信息,而没有较好地利用文本语义信息,同时也无法捕捉长文本中距离较... 网络中存在大量语义相同或者相似的冗余文本,而文本去重能够解决冗余文本浪费存储空间的问题,并能为信息抽取任务减少不必要的消耗。传统的文本去重算法依赖文字重合度信息,而没有较好地利用文本语义信息,同时也无法捕捉长文本中距离较远句子之间的交互信息,去重效果不理想。针对文本语义去重问题,提出一种基于关键词图表示的长文本去重算法。首先,通过抽取文本对中的语义关键词短语,将文本对表示为以关键词短语为节点的图;其次,通过多种方式对节点进行编码,并利用图注意力网络(GAT)学习节点之间的关系,从而得到文本对图的向量表示,并判断文本对是否语义相似;最后,根据文本对的语义相似度进行去重处理。与传统算法相比,所提算法能有效利用文本的语义信息,并能通过图结构将长文本中距离较远的句子用关键词短语的共现关系连接起来,从而增加不同句子之间的语义交互。实验结果表明,所提算法在两个公开数据集CNSE(Chinese News Same Event)和CNSS(Chinese News Same Story)上都取得了比Simhash、BERT(Bidirectional Encoder Representations from Transformers)微调、概念交互图(CIG)等传统算法更好的表现。具体地,所提算法在CNSE数据集上的F1值达到84.65%,在CNSS数据集上的F1值达到90.76%,说明所提算法可以有效提升文本去重任务的效果。 展开更多
关键词 文本语义去重 关键词抽取 文本匹配 图表示 图注意力网络
下载PDF
上一页 1 2 22 下一页 到第
使用帮助 返回顶部