期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于机器视觉的文件扫描机器人缺失数据填补
1
作者 李智诚 张云翔 《自动化技术与应用》 2024年第5期106-109,共4页
由于扫描环境噪声过高,导致机器人扫描文件图像内部分信息无法识别读取,为此,提出一种基于机器视觉的文件扫描机器人缺失数据填补方法。采集机器人的历史扫描缺失数据,划分不完备数据集及容差属性数据集,利用对数非自然函数识别数据集... 由于扫描环境噪声过高,导致机器人扫描文件图像内部分信息无法识别读取,为此,提出一种基于机器视觉的文件扫描机器人缺失数据填补方法。采集机器人的历史扫描缺失数据,划分不完备数据集及容差属性数据集,利用对数非自然函数识别数据集内的缺失数据,自适应函数值越大的数据,估计缺失的概率越高。采用机器视觉技术结合扫描机器人激光映射特点,根据扫描点的时间序列关系,提取扫描区域内的中心值。根据中心值判定邻近范围内的数据是否存在噪声影响,采用收敛模型实现填补。仿真实验证明,所提方法填补效果极佳、缺失数据识别率较高。 展开更多
关键词 缺失数据识别 数据填补算法 数据估计模型 不完备数据集数 文件扫描机器人
下载PDF
基于空间分布优选初始聚类中心的改进K-均值聚类算法 被引量:11
2
作者 宋仁旺 苏小杰 石慧 《科学技术与工程》 北大核心 2021年第19期8094-8100,共7页
针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法。该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心... 针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数据考虑初始聚类中心点选择的聚类算法。该算法首先采用冒泡排序法对数据集进行排序,获取数据集的各维中心值组成第一个初始聚类中心点。其次,通过计算与第一个初始聚类中心点的欧式距离,对剩余候选初始聚类中心点进行优化选择,保证所有的聚类中心点均匀地分布在数据集密度较大的空间上,以此减少聚类过程中的迭代次数和提高聚类算法效率。最后,基于UCI(University of California,Irvine)中多个数据集,进行聚类算法对比实验。结果表明,在不降低聚类效果的前提下,该聚类算法的迭代次数平均降低到50%,所需的时间降低平均达10%,由实验结果还能推出,当点集的数目越多时,该算法就能表现出越明显的聚类优势效果。 展开更多
关键词 海量数据集 优化选择 数据集密度 迭代次数
下载PDF
影响卫星数据文件地面传输效率的因素 被引量:2
3
作者 张箐 《遥感信息》 CSCD 北大核心 2017年第2期15-20,共6页
针对在互联网络环境下传输大数据量文件时传输效率低下的问题,提出了一种基于传输文件数量及传输线程数量的优化方法。通过改变文件数和线程数的取值进行了大量传输试验获取平均传输时间,并对3种不同变量值组合条件下的文件传输效率进... 针对在互联网络环境下传输大数据量文件时传输效率低下的问题,提出了一种基于传输文件数量及传输线程数量的优化方法。通过改变文件数和线程数的取值进行了大量传输试验获取平均传输时间,并对3种不同变量值组合条件下的文件传输效率进行比较分析。结果显示,利用单文件多线程的变量组合时传输效率较好。进而对线程数量的选择进行了深入研究,在50ms的网络延时的试验环境中,传输数据文件采用3或4个线程所需的传输时间相对较短,证明了传输文件的线程数量需要根据具体的网络环境进行试验而确定。 展开更多
关键词 卫星数据 文件数量 线程数量 传输时间 传输效率
下载PDF
数据挖掘中一种增强的Apriori算法分析 被引量:16
4
作者 胡雪 封化民 +1 位作者 李明伟 丁钊 《信息网络安全》 2015年第11期77-83,共7页
在当今这个信息极度发达的社会,网络数据急剧膨胀,激增的数据背后隐藏着许多重要的信息,所以对大量数据进行分析是必要的。Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖... 在当今这个信息极度发达的社会,网络数据急剧膨胀,激增的数据背后隐藏着许多重要的信息,所以对大量数据进行分析是必要的。Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。可能产生大量的候选集,以及可能需要重复扫描数据库是Apriori算法的两大缺点。文中提出了一种需要更少的扫描时间的Apriori算法,在剪枝候选项集的同时也在消除冗余的子项集的产生。改进的Apriori算法通过消除数据库中不需要记录的传输有效减少了I/O所花费的时间,Apriori算法的效率得到了极大的优化。文章给出了算法实现思想及证明,并对传统的和改进的Apriori算法进行比较和分析。 展开更多
关键词 数据挖掘 关联规则 频繁项集 事务数 支持计数
下载PDF
基于集对分析理论的大型沉井基础施工动态风险评估 被引量:2
5
作者 施洲 纪锋 +1 位作者 余万庆 李冰 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第3期419-425,共7页
为研究大型桥梁沉井基础施工过程中的动态风险评估,将风险分析与施工监测相结合,提出基于监测数据的风险评估指标体系.引入集对分析理论,结合层次分析法确定的指标权重,建立以五元联系数主值为指标的动态风险评估模型,并以五峰山长江大... 为研究大型桥梁沉井基础施工过程中的动态风险评估,将风险分析与施工监测相结合,提出基于监测数据的风险评估指标体系.引入集对分析理论,结合层次分析法确定的指标权重,建立以五元联系数主值为指标的动态风险评估模型,并以五峰山长江大桥大型沉井基础为例开展动态风险评估.结果表明,二级动态风险指标中,混凝土应力指数在第102天降低至-0.47,说明沉井混凝土受力复杂且开裂风险较高.下沉系数和四角高差指数在102 d后出现低值,表明沉井出现小规模滞沉、突沉等风险.一级指标中,结构应力指数及控制参数指数的低值反映了混凝土受力复杂、风险增大的实际情况.总体指数在90 d后波动显著,最低值为-0.09,说明沉井整体处于中等风险状态. 展开更多
关键词 沉井基础 动态风险评估 监测数据 集对分析 联系数
下载PDF
集对分析方法在数据挖掘中的应用 被引量:7
6
作者 王万军 《甘肃联合大学学报(自然科学版)》 2006年第6期65-67,共3页
集对分析是处理不确定问题的一种新方法,近几年来在工程应用、决策支持系统等应用中取得了较好的成果.本文试图利用集对分析理论的基本思想,提出了一种基于集对分析的数据挖掘方法,并通过实例证实了该方法的有效性.
关键词 同异反 数据挖掘 集对分析 联系数
下载PDF
基于不平衡数据集的文本分类技术研究 被引量:1
7
作者 白凤凤 《电脑编程技巧与维护》 2010年第6期21-22,29,共3页
文本自动分类是数据挖掘和信息检索的核心技术,也是研究热点。在实际的应用中,时常会出现文本数据量很大,但是对人们有用的信息仅占一小部分,这种某类样本数量明显少于其他类样本数量的数据就是不平衡数据集。不平衡数据集可以分类为少... 文本自动分类是数据挖掘和信息检索的核心技术,也是研究热点。在实际的应用中,时常会出现文本数据量很大,但是对人们有用的信息仅占一小部分,这种某类样本数量明显少于其他类样本数量的数据就是不平衡数据集。不平衡数据集可以分类为少数类和多数类。传统方法对少数类的识别率比较低,如何有效地提高少数类的分类性能成为了模式识别和机器学习必须解决的问题。就提高不平衡数据集的少数类文本的分类性能问题,从数据层面处理角度对数据进行了重抽样,采用随机抽样的办法来提高分类器在不平衡数据集的泛化性能。 展开更多
关键词 文本自动分类 不平衡数据集 少数类
下载PDF
区间值属性决策表的数据挖掘
8
作者 王珏 刘三阳 张杰 《计算机科学》 CSCD 北大核心 2003年第8期121-123,共3页
Data mining in incomplete information systems is a hard problem but inevitable in uncertain decision. In thispaper ,an extended rough set model based on dominance relation is combined with fuzzy set theory for data mi... Data mining in incomplete information systems is a hard problem but inevitable in uncertain decision. In thispaper ,an extended rough set model based on dominance relation is combined with fuzzy set theory for data mining ininterval valued decision table ,then decision rules can be obtained from the decision table. Simulation results show thatthe method is effective. 展开更多
关键词 数据挖掘 区间值属性 决策表 数据库 数据分析
下载PDF
模糊决策表的数据挖掘
9
作者 王珏 刘三阳 张杰 《计算机工程与应用》 CSCD 北大核心 2003年第14期73-74,85,共3页
论文利用基于优势-等价关系的扩展粗糙集模型,结合三角模糊数基于可能度的序关系,给出了一种模糊决策表的数据挖掘方法,该方法能有效地挖掘出决策系统的决策规则。实验分析表明了该方法的有效性。
关键词 数据挖掘 粗糙集 优势关系 三角模糊数
下载PDF
基于多重测点数目标函数族的结构损伤识别方法
10
作者 张立涛 李兆霞 费庆国 《地震工程与工程振动》 CSCD 北大核心 2008年第6期68-73,共6页
基于加速度时域测试数据进行结构损伤识别计算时,所用测试数据的点数必须足够多才能够使识别有效,但往往又容易出现收敛到局部极小解的情况。为解决这一问题,本文提出了基于多重测点数目标函数族的结构损伤识别方法;所谓多重测点数目标... 基于加速度时域测试数据进行结构损伤识别计算时,所用测试数据的点数必须足够多才能够使识别有效,但往往又容易出现收敛到局部极小解的情况。为解决这一问题,本文提出了基于多重测点数目标函数族的结构损伤识别方法;所谓多重测点数目标函数族,即由不同点数的测试数据出发构造一族目标函数,以取代传统的基于单一点数的目标函数;迭代计算时采用了Tikhonov正则化技术以抑制解答的病态性。以Benchmark结构为算例,分析了两种基于单一点数的损伤识别计算难以收敛到正确解答的原因;并考证了文中提出的方法。计算结果表明:基于多重测点数目标函数族的结构损伤识别方法,使得识别计算易于收敛到正确解答;从而证明了本文提出的方法是有效的。 展开更多
关键词 结构损伤识别 时域方法 多重测点数目标函数族 TIKHONOV正则化 数值仿真
下载PDF
基于控制集合的电力通信不确定大数据查询优化
11
作者 庄志惠 岑健 +2 位作者 刘娟 赵晓 王艺璇 《实验室研究与探索》 CAS 北大核心 2018年第2期124-127,共4页
提高元组数目特别大下的不确定数据查询的准确高效特性,采用Top-k查询算法改进设计,通过数据查询操作设计及PT-k查询算法控制集合改进,结果验证有:对城市负荷预测的不确定数据应用预测得出设计算法实现了数据估计及收敛速度快的优点;对j... 提高元组数目特别大下的不确定数据查询的准确高效特性,采用Top-k查询算法改进设计,通过数据查询操作设计及PT-k查询算法控制集合改进,结果验证有:对城市负荷预测的不确定数据应用预测得出设计算法实现了数据估计及收敛速度快的优点;对java中随机生成的实验数据得出控制集合以外的元组成为查询结果的可能性为0即控制集合较小时,算法优势明显,数据量较大元组更新时对不确定数据查询结果的影响概率明显降低;设计控制集合的方法查询算法远小于现有需要计算的元组方法处理的元组数目。这一研究对于大元组不确定的数据管理具有显著的理论和实践价值。 展开更多
关键词 元组数目 不确定 数据查询 控制集合 概率
下载PDF
2-Flou数的因素值离散化算法 被引量:1
12
作者 蒲凌杰 曾繁慧 郭嗣琮 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2019年第6期573-576,共4页
针对等区间离散化方法的刚性划分问题,提出一种具有柔性的2-Flou数因素值离散化算法.利用提出的2-Flou数理论及其连接算法,采用双参数调节策略和四元组表示策略,对给定连续型数据进行柔性离散化.以iris数据集为例进行离散化实验,实验过... 针对等区间离散化方法的刚性划分问题,提出一种具有柔性的2-Flou数因素值离散化算法.利用提出的2-Flou数理论及其连接算法,采用双参数调节策略和四元组表示策略,对给定连续型数据进行柔性离散化.以iris数据集为例进行离散化实验,实验过程简单、结果符合预期.结果表明:2-Fou数的离散化方法比经典等区间离散化法更有柔性,比模糊区间离散化法表达更简单,是一种更有效的离散化方法. 展开更多
关键词 Flou数 离散化 连续型因素 Flou集 数据挖掘
下载PDF
基于Tensorflow框架的生产线零件编号分类算法研究 被引量:3
13
作者 刘欣 李佩娟 盛云龙 《南京工程学院学报(自然科学版)》 2019年第4期31-37,共7页
针对由手工提取特征不充分引起生产线零件编号分类效率和准确率低等问题,提出深度卷积神经网络零件编号分类算法.理论分析了神经网络各层数学原理,在Tensorflow框架下搭建11层卷积神经网络,引入弃权技术,消弱各神经元间联合适应性,防止... 针对由手工提取特征不充分引起生产线零件编号分类效率和准确率低等问题,提出深度卷积神经网络零件编号分类算法.理论分析了神经网络各层数学原理,在Tensorflow框架下搭建11层卷积神经网络,引入弃权技术,消弱各神经元间联合适应性,防止网络过拟合,反向传播中采用基于指数衰减的批量梯度优化算法.由于采集的生产线现场零件编号图像有限,引入Chars74K数据集以增加数据集规模.样本数据集中80%用于训练、20%用于测试.研究结果表明,本文算法准确率达87.91%,但仍不理想.经分析,数据集中易混淆字符影响算法性能,尝试优化数据集,将数据集中易混淆字符进行删减或合并,算法准确率达到94.1%,性能获得显著提升.本文提出的生产线零件编号分类算法不需要人工特征提取等预处理操作,算法速度快、准确率高. 展开更多
关键词 Tensorflow 深度卷积神经网络 数据集 零件编号分类
下载PDF
华云公司中心站软件CAWS AnyWhere Server 2010使用心得 被引量:6
14
作者 汪贵彬 《电脑知识与技术(过刊)》 2013年第11X期7168-7172,共5页
随着自动气象站在气象业务中越来越广泛的应用,接收其数据的中心站软件的使用也越来越多,在业务使用过程中对中心站软件的功能要求的也逐渐增高。但在业务运行过程中,很多功能并没有在其用户使用手册中加以介绍,所以就需要对中心站软件... 随着自动气象站在气象业务中越来越广泛的应用,接收其数据的中心站软件的使用也越来越多,在业务使用过程中对中心站软件的功能要求的也逐渐增高。但在业务运行过程中,很多功能并没有在其用户使用手册中加以介绍,所以就需要对中心站软件进行更为深入的研究与实验以便可以使其适用气象业务的需要。根据对中国华云技术开发公司的中心站软件CAWS AnyWhere Server 2010的研究与实验,得到了一些适应气象业务需要的功能的设置方法。 展开更多
关键词 CAWS AnyWhere Server 2010 站点设置 Z文件收集 传送数据 区站号转换
下载PDF
简谈GSM-R网络数据编号方案中短号码设置原则及方法
15
作者 狄彩虹 《铁路通信信号工程技术》 2021年第10期44-47,62,共5页
通过铁路实际运用中GSM-R网络数据编号短号码设置案例,研究铁路GSM-R网络数据编号方案中短号码设置的基本原则,深入探讨特殊场景下短号码设置方法,为铁路运输生产提供及时准确的通信保障。
关键词 GSM-R网络数据 编号方案 短号码设置
下载PDF
一种用于移动计算的约束频繁邻近类别集挖掘算法
16
作者 方刚 袁刚 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第3期265-270,共6页
在移动计算中挖掘满足用户需求的长频繁邻近类别集时,为了避免产生冗余候选项和减少重复计算量,提出一种基于幂集数递减的约束频繁邻近类别集挖掘算法,其能够提取包含约束条件的长频繁邻近类别集;该算法用幂集数递减序列来产生候选频繁... 在移动计算中挖掘满足用户需求的长频繁邻近类别集时,为了避免产生冗余候选项和减少重复计算量,提出一种基于幂集数递减的约束频繁邻近类别集挖掘算法,其能够提取包含约束条件的长频繁邻近类别集;该算法用幂集数递减序列来产生候选频繁邻近类别集,有效地删除了不满足用户需求的冗余候选项和减少了重复扫描空间实例的计算量.实验表明在挖掘满足用户需求的长频繁邻近类别集时,该算法比现有算法更快速. 展开更多
关键词 空间数据挖掘 频繁邻近类别集 幂集数 递减序列 移动计算
原文传递
基于随机森林的风洞马赫数预测模型 被引量:3
17
作者 王晓军 袁平 +1 位作者 毛志忠 杜宁 《航空学报》 EI CAS CSCD 北大核心 2016年第5期1494-1505,共12页
在风洞试验中,马赫数的稳定性和快速性对风洞流场品质有着重要影响。为了实现马赫数的精确控制,必须对马赫数进行快速、准确的预测。风洞试验积累了大量数据,大数据集包含了更多的有益信息,为实现马赫数的精确预测提拱了可能性,但也增... 在风洞试验中,马赫数的稳定性和快速性对风洞流场品质有着重要影响。为了实现马赫数的精确控制,必须对马赫数进行快速、准确的预测。风洞试验积累了大量数据,大数据集包含了更多的有益信息,为实现马赫数的精确预测提拱了可能性,但也增加了建模的复杂度。通常高度复杂的模型会加重其在实际使用时的计算负担。针对大数据集问题,本文将随机森林方法应用于风洞马赫数建模。随机森林是一种集成模型建模方法,它从3方面降低模型的复杂度:产生多个样本子集,减少了子模型的训练样本个数;具有并行集成结构,子模型可在不同的CPU上运行,提高了运行速度;以简单学习算法回归树作为基学习机,降低了子模型的复杂度。试验证明基于随机森林的马赫数预测模型能够有效利用试验积累的大数据,满足工程上预测速度及精度的要求。 展开更多
关键词 风洞试验 马赫数 大数据集 随机森林 回归树
原文传递
土壤质量评价中少量样本最小数据集的构建——以内蒙古杭锦旗黄河南岸灌区典型地块为例 被引量:6
18
作者 周文涛 兰天 +3 位作者 潘岳 公衍丽 高云悦 李品芳 《中国农业大学学报》 CAS CSCD 北大核心 2022年第6期225-235,共11页
为研究土壤质量评价过程中样本容量较少情况下最小数据集的构建方法。采集并测定内蒙古杭锦旗黄河南岸灌区典型地块的12个土壤理化指标,利用聚类分析、相关分析和主成分分析等探讨了少量样本最小数据集的构建方法。结果表明:1)通过聚类... 为研究土壤质量评价过程中样本容量较少情况下最小数据集的构建方法。采集并测定内蒙古杭锦旗黄河南岸灌区典型地块的12个土壤理化指标,利用聚类分析、相关分析和主成分分析等探讨了少量样本最小数据集的构建方法。结果表明:1)通过聚类分析、相关分析和主成分分析所构建的最小数据集中的指标包括土壤容重、饱和含水量、土壤电导率、阳离子交换量、硝态氮、速效钾、速效磷;2)全体数据集与最小数据集的土壤质量指数呈显著正相关,R^(2)达到了0.735,Nash有效系数为0.917,偏差系数为0.057;3)基于全体数据集和最小数据集计算得出的土壤质量指数变化范围分别是0.47~0.73和0.37~0.75,平均值为0.56和0.53,表明研究地块土壤呈现中等质量水平。研究发现,在黄河南岸灌区典型地块基于少量样本进行土壤质量评价的过程中,使用聚类分析、相关分析、主成分分析3种分析方法可以构建最小数据集,且检验精度较高。 展开更多
关键词 土壤质量 少量样本 最小数据集 主成分分析 聚类分析 黄河南岸灌区
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部