期刊文献+
共找到1,188篇文章
< 1 2 60 >
每页显示 20 50 100
A Study of EM Algorithm as an Imputation Method: A Model-Based Simulation Study with Application to a Synthetic Compositional Data
1
作者 Yisa Adeniyi Abolade Yichuan Zhao 《Open Journal of Modelling and Simulation》 2024年第2期33-42,共10页
Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear mode... Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear model is the most used technique for identifying hidden relationships between underlying random variables of interest. However, data quality is a significant challenge in machine learning, especially when missing data is present. The linear regression model is a commonly used statistical modeling technique used in various applications to find relationships between variables of interest. When estimating linear regression parameters which are useful for things like future prediction and partial effects analysis of independent variables, maximum likelihood estimation (MLE) is the method of choice. However, many datasets contain missing observations, which can lead to costly and time-consuming data recovery. To address this issue, the expectation-maximization (EM) algorithm has been suggested as a solution for situations including missing data. The EM algorithm repeatedly finds the best estimates of parameters in statistical models that depend on variables or data that have not been observed. This is called maximum likelihood or maximum a posteriori (MAP). Using the present estimate as input, the expectation (E) step constructs a log-likelihood function. Finding the parameters that maximize the anticipated log-likelihood, as determined in the E step, is the job of the maximization (M) phase. This study looked at how well the EM algorithm worked on a made-up compositional dataset with missing observations. It used both the robust least square version and ordinary least square regression techniques. The efficacy of the EM algorithm was compared with two alternative imputation techniques, k-Nearest Neighbor (k-NN) and mean imputation (), in terms of Aitchison distances and covariance. 展开更多
关键词 Compositional Data Linear Regression Model Least Square Method Robust Least Square Method Synthetic Data Aitchison Distance Maximum Likelihood Estimation Expectation-Maximization algorithm k-nearest Neighbor and Mean imputation
下载PDF
Nearest neighbor search algorithm based on multiple background grids for fluid simulation 被引量:1
2
作者 郑德群 武频 +1 位作者 尚伟烈 曹啸鹏 《Journal of Shanghai University(English Edition)》 CAS 2011年第5期405-408,共4页
The core of smoothed particle hydrodynamics (SPH) is the nearest neighbor search subroutine. In this paper, a nearest neighbor search algorithm which is based on multiple background grids and support variable smooth... The core of smoothed particle hydrodynamics (SPH) is the nearest neighbor search subroutine. In this paper, a nearest neighbor search algorithm which is based on multiple background grids and support variable smooth length is introduced. Through tested on lid driven cavity flow, it is clear that this method can provide high accuracy. Analysis and experiments have been made on its parallelism, and the results show that this method has better parallelism and with adding processors its accuracy become higher, thus it achieves that efficiency grows in pace with accuracy. 展开更多
关键词 multiple background grids smoothed particle hydrodynamics (SPH) nearest neighbor search algorithm parallel computing
下载PDF
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:1
3
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 Classification algorithms NON-PARAMETRIC K-nearest-Neighbor Neural Networks Random Forest Support Vector Machines
下载PDF
Nearest neighbor search algorithm for GBD tree spatial data structure
4
作者 Yutaka Ohsawa Takanobu Kurihara Ayaka Ohki 《重庆邮电大学学报(自然科学版)》 2007年第3期253-259,共7页
This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteris... This paper describes the nearest neighbor (NN) search algorithm on the GBD(generalized BD) tree. The GBD tree is a spatial data structure suitable for two-or three-dimensional data and has good performance characteristics with respect to the dynamic data environment. On GIS and CAD systems, the R-tree and its successors have been used. In addition, the NN search algorithm is also proposed in an attempt to obtain good performance from the R-tree. On the other hand, the GBD tree is superior to the R-tree with respect to exact match retrieval, because the GBD tree has auxiliary data that uniquely determines the position of the object in the structure. The proposed NN search algorithm depends on the property of the GBD tree described above. The NN search algorithm on the GBD tree was studied and the performance thereof was evaluated through experiments. 展开更多
关键词 邻居搜索算法 GBD树 空间数据结构 动态数据环境 地理信息系统 计算机辅助设计
下载PDF
基于遗传算法改进的NLM策略 被引量:1
5
作者 李宁 申盼盼 +1 位作者 肖子涵 李洁 《电力电子技术》 2024年第2期132-136,共5页
模块化多电平变换器(MMC)应用于高压直流输电等大功率场合时,脉宽调制中的正弦脉宽调制和空间矢量脉宽调制(SVPWM)策略由于控制变量的增多会变得十分复杂,特定次谐波消除脉宽调制(SHEPWM)策略也存在动态性能较差的问题。最近电平调制(N... 模块化多电平变换器(MMC)应用于高压直流输电等大功率场合时,脉宽调制中的正弦脉宽调制和空间矢量脉宽调制(SVPWM)策略由于控制变量的增多会变得十分复杂,特定次谐波消除脉宽调制(SHEPWM)策略也存在动态性能较差的问题。最近电平调制(NLM)简单并且适用于电平数较多的场合,可以使MMC具有良好的输出特性,但在电平数过低时存在误差较大的缺点。此处针对传统的NLM在电平数过低的分布式电网系统中会产生较大谐波的问题,引入遗传算法(GA)优化桥臂投入子模块数量取整函数,实现了电平数的增加及谐波含量的减少。仿真和实验验证了所提方法的有效性。 展开更多
关键词 模块化多电平变换器 最近电平调制 遗传算法
下载PDF
基于沙地猫群优化–最小二乘支持向量机的动态NOx排放预测 被引量:3
6
作者 金秀章 史德金 乔鹏 《中国电机工程学报》 EI CSCD 北大核心 2024年第1期182-190,I0015,共10页
针对火电机组频繁调峰导致机组燃烧状态不稳,进而导致锅炉出口NOx浓度波动范围大的问题,提出一种基于沙地猫群优化(sand cat sarm optimization,SCSO)的最小二乘支持向量机(leastsquaressupportvectormachine,LSSVM) NOx动态预测模型。... 针对火电机组频繁调峰导致机组燃烧状态不稳,进而导致锅炉出口NOx浓度波动范围大的问题,提出一种基于沙地猫群优化(sand cat sarm optimization,SCSO)的最小二乘支持向量机(leastsquaressupportvectormachine,LSSVM) NOx动态预测模型。首先利用k近邻互信息计算时间延迟的同时筛选辅助变量。然后,基于SCSO算法进行输入变量阶次的选择。使用包含辅助变量时间延迟和阶次的信息作为模型的输入,SCSO算法优化最小二乘支持向量机参数,建立动态NOx排放最小二乘支持向量机预测模型(SCSO-LSSVM动态软测量模型)。最后将模型与未加入迟延的LSSVM模型,加入迟延的LSSVM模型和粒子群优化算法(particle swarm optimization,PSO)优化最小二乘支持向量机参数的动态软测量模型进行对比验证。结果表明,相较于其他模型,该文建立SCSO-LSSVM动态软测量模型均方根误差、平均绝对误差、平均绝对误差最小,预测精度最高,而且在NOx浓度剧烈波动时也能够较好地预测NOx浓度,具有很好的动态特性。 展开更多
关键词 NOx浓度 k近邻互信息 沙地猫群优化算法 最小二乘支持向量机 软测量模型
下载PDF
基于加权实例推理的缓倾斜综采工作面液压支架选型研究 被引量:1
7
作者 吴悦 张志伟 +2 位作者 桑文龙 刘佳音 何龙龙 《煤炭技术》 CAS 2024年第1期207-210,共4页
为实现地质构造简单的缓倾斜综采工作面液压支架智能化选型,提出了一种基于加权实例推理的液压支架选型方法。首先,建立了液压支架选型实例库;其次,采用粗糙集理论和序关系分析法进行权重构造;另外,将液压支架的条件属性分为3种类型计... 为实现地质构造简单的缓倾斜综采工作面液压支架智能化选型,提出了一种基于加权实例推理的液压支架选型方法。首先,建立了液压支架选型实例库;其次,采用粗糙集理论和序关系分析法进行权重构造;另外,将液压支架的条件属性分为3种类型计算相似度;最后通过匹配实例选型。以某煤矿选型方案为例,并以50组液压支架的属性数据进行验证。结果表明,该方法的准确率为88%,能够为液压支架的智能化选型提供较好的参考依据。 展开更多
关键词 液压支架 实例推理 粗糙集 序关系分析法 最邻近算法
下载PDF
基于融合K-近邻算法的电压互感器在线监测方法
8
作者 李振华 崔九喜 +3 位作者 杨信强 吴海荣 杨诗豪 薛田良 《电网技术》 EI CSCD 北大核心 2024年第9期3938-3947,I0100,共11页
由于受工作时长和环境因素的影响,电容式电压互感器(capacitor voltage transformer,CVT)在运行过程中误差稳定性不高,易出现电能计量失准现象。为此,该文提出了一种基于融合K-近邻算法(fusion K-nearest neighbor algorithm,FKNN)的电... 由于受工作时长和环境因素的影响,电容式电压互感器(capacitor voltage transformer,CVT)在运行过程中误差稳定性不高,易出现电能计量失准现象。为此,该文提出了一种基于融合K-近邻算法(fusion K-nearest neighbor algorithm,FKNN)的电压互感器在线评估方法。该方法利用互感器的历史运行数据构建虚拟标准器,通过改进K-近邻算法对互感器实时状态进行监测,实现对异常情况的报警。同时,提出了一种加权移动时间窗的方法,自适应更新异常阈值,有效削弱电网不平衡波动的影响。实验结果表明,该文方法能够准确监测互感器的0.2级误差漂移。 展开更多
关键词 电压互感器 虚拟标准器 K-近邻算法 自适应更新
下载PDF
结合精英初始化和K近邻的蛇优化算法
9
作者 王丽娟 刘姝含 +1 位作者 王剑 田亚旗 《计算机应用研究》 CSCD 北大核心 2024年第9期2712-2721,共10页
蛇优化算法(SO)是一种受自然界中蛇生存行为启发产生的元启发式优化算法。原始蛇优化算法存在收敛速度慢、易陷入局部最优的问题,因此提出了一种结合精英初始化和K近邻的改进蛇优化算法(elite initia-lization and K-nearest neighbors ... 蛇优化算法(SO)是一种受自然界中蛇生存行为启发产生的元启发式优化算法。原始蛇优化算法存在收敛速度慢、易陷入局部最优的问题,因此提出了一种结合精英初始化和K近邻的改进蛇优化算法(elite initia-lization and K-nearest neighbors improved snake optimizer,EKISO)。首先,为了提高初始种群质量,在种群初始化阶段提出精英初始化的方法,根据种群精英个体产生优质初始种群个体;其次,通过振荡因子优化螺旋觅食策略扩大全局勘探阶段的搜索范围、提高算法的局部逃逸能力;最后,在局部开发阶段提出K近邻思想的位置更新方法,增强种群个体之间的信息交互能力,从而加快收敛速度、提高收敛精度。利用14个经典测试函数和4个CEC2017测试函数将该方法与其他7种优化算法进行对比,证明EKISO收敛速度更快、精度更高且不易陷入局部最优。为了进一步验证EKISO的实用性与可行性,将EKISO应用于压力容器设计问题中,通过实验对比分析可知,EKISO在处理实际优化问题上具有一定的优越性。 展开更多
关键词 蛇优化算法 精英初始化 K近邻 振荡因子 工程优化
下载PDF
ML组合的CYGNSS海面风速反演质量控制模型
10
作者 张云 赵星宇 +3 位作者 杨树瑚 孙聪 韩彦岭 尹继伟 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第1期20-29,共10页
卷积神经网络(CNN)可用于气旋全球导航卫星系统(CYGNSS)的海面风速反演。虽然在模型训练前设置了质量控制指标来检测和削弱CYGNSS的异常观测数据,但CYGNSS观测数据中仍存在异常值导致模型反演精度降低,甚至出现错误反演结果。因此,提出... 卷积神经网络(CNN)可用于气旋全球导航卫星系统(CYGNSS)的海面风速反演。虽然在模型训练前设置了质量控制指标来检测和削弱CYGNSS的异常观测数据,但CYGNSS观测数据中仍存在异常值导致模型反演精度降低,甚至出现错误反演结果。因此,提出一种基于机器学习(ML)组合的海面风速反演模型。在基于CNN回归模型的CYGNSS反演海面风速基础上,ML分类模型生成CNN回归结果的质量标志位,该标志位可以检测并删除CNN回归结果的异常值,进一步提高风速反演结果的数据质量,ML分类模型能够更好地考虑各种数据误差之间的相互作用,而不是单独使用每个条件的阈值,以达到更优的海面风速反演精度的效果。实验对比了Logistic回归(LR)、决策树(DT)、朴素贝叶斯模型、K最邻近(KNN)算法、神经网络(NN)模型、支持向量机(SVM)算法等6个分类模型,其中,基于KNN算法的分类模型对风速反演质量控制的效果最优。所提风速反演组合模型显著提高了反演结果的精度,在0~20 m/s区间内,异常样本过滤率为81.27%,在所有被过滤的数据中,过滤正确率为86.03%;风速反演误差的均方根误差从无ML分类模型的1.7 m/s降低到有ML分类模型的1.44 m/s,其中,训练样本为0~10 m/s的反演结果精度提升效果较为明显,证明了所提风速反演组合模型对风速质量控制的有效性。 展开更多
关键词 气旋全球导航卫星系统 风速反演 质量控制 机器学习组合模型 卷积神经网络 K最邻近算法
下载PDF
求解带容量约束车辆路径问题的改进遗传算法
11
作者 徐伟华 邱龙龙 +1 位作者 张根瑞 魏传祥 《计算机工程与设计》 北大核心 2024年第3期785-792,共8页
为解决传统遗传算法求解带容量约束的车辆路径问题时收敛速度慢和局部搜索能力差的问题,对传统遗传算法提出一种改进策略。使用基于贪婪策略的启发式交叉算子加强算法接近最优解的能力,加快算法收敛速度,在变异操作中,引入最近邻搜索算... 为解决传统遗传算法求解带容量约束的车辆路径问题时收敛速度慢和局部搜索能力差的问题,对传统遗传算法提出一种改进策略。使用基于贪婪策略的启发式交叉算子加强算法接近最优解的能力,加快算法收敛速度,在变异操作中,引入最近邻搜索算子,缩小基因变异范围,使用单点局部插入算子提高算法的局部优化能力。采用精英选择和轮盘赌法结合的选择策略,保持种群多样性以加强算法的全局搜索能力。实例计算测试表明,与传统遗传算法相比,所提算法求解平均偏差降低了70.25%,求解时间减少了87.41%;与ALNS和AGGWOA算法相比,有更高的求解质量和更好的稳定性。 展开更多
关键词 遗传算法 车辆路径问题 贪婪策略 交叉算子 最近邻搜索 局部优化 精英选择
下载PDF
零件加工隐性工艺知识获取方法研究
12
作者 张一鸣 刘金锋 +3 位作者 陈亚杰 瞿鹏飞 景旭文 刘晓军 《图学学报》 CSCD 北大核心 2024年第2期399-408,共10页
随着制造业数字化工艺的深入应用,如何高效利用积累的工艺知识,已成为提升工艺设计效率与质量的关键,然而隐性工艺知识却存在难以获取、描述与转化的技术瓶颈,严重阻碍智能化工艺设计模式推广。为此,提出了一种复杂零件加工的隐性工艺... 随着制造业数字化工艺的深入应用,如何高效利用积累的工艺知识,已成为提升工艺设计效率与质量的关键,然而隐性工艺知识却存在难以获取、描述与转化的技术瓶颈,严重阻碍智能化工艺设计模式推广。为此,提出了一种复杂零件加工的隐性工艺知识获取方法。首先,利用等宽法对结构化工艺数据进行离散化处理,构建基于文本挖掘的隐性工艺知识获取流程,并通过产生式规则对隐性工艺知识表达;然后,基于案例推理和规则推理融合的知识推理方法,并采用最近邻算法实现隐性工艺知识的识别;最后,以船用柴油机缸盖类复杂加工零件为验证对象,对加工隐性工艺知识获取方法进行了有效验证。 展开更多
关键词 隐性知识 产生式规则 文本挖掘 案例推理 规则推理 最近邻算法
下载PDF
水下声呐惯性系统定位研究
13
作者 王波 武建国 +2 位作者 王晓鸣 田奇睿 李鑫 《舰船科学技术》 北大核心 2024年第13期146-149,共4页
为应对传统声呐惯性系统在弱纹理水下环境中定位精度较低的问题,提出将声呐惯性滤波里程计应用于水下声呐惯性系统定位。依据声呐成像原理对声呐图像进行特征提取,运用迭代最近点算法(ICP)进行特征匹配。通过将点云匹配结果与IMU数据融... 为应对传统声呐惯性系统在弱纹理水下环境中定位精度较低的问题,提出将声呐惯性滤波里程计应用于水下声呐惯性系统定位。依据声呐成像原理对声呐图像进行特征提取,运用迭代最近点算法(ICP)进行特征匹配。通过将点云匹配结果与IMU数据融合,提升状态估计的稳定性。这种方法使用IMU数据进行状态预测,并以声呐ICP匹配结果作为观测进行状态更新。最后将该滤波里程计与ICP顺序匹配结果一起纳入图优化框架进行位姿优化。试验表明,相比于传统方法,该方法的定位精度更高,能适应弱纹理环境。 展开更多
关键词 声呐惯性定位 滤波里程计 迭代最近点算法 点云匹配
下载PDF
基于K-近邻算法改进粒子群-反向传播算法的织物质量预测技术
14
作者 孙长敏 戴宁 +5 位作者 沈春娅 徐开心 陈炜 胡旭东 袁嫣红 陈祖红 《纺织学报》 EI CAS CSCD 北大核心 2024年第7期72-77,共6页
为解决现有下机织物质量差异性较大且传统验布环节时间较长等问题,提出基于K-近邻(KNN)算法改进粒子群-反向传播(PSO-BP)算法的织物质量等级预测方法。首先分析织物质量预测模型,整理织物疵点类型与织物质量等级分类,并根据织物疵点特... 为解决现有下机织物质量差异性较大且传统验布环节时间较长等问题,提出基于K-近邻(KNN)算法改进粒子群-反向传播(PSO-BP)算法的织物质量等级预测方法。首先分析织物质量预测模型,整理织物疵点类型与织物质量等级分类,并根据织物疵点特征将疵点划分为6类;其次选取14种影响织物质量的因子作为模型输入量;然后详细介绍依据KNN与PSO原理进行织物质量预测流程;最后以浙江兰溪某纺织厂近3个月16186条织物生产数据为例,建立织物质量预测模型。结果显示:该技术对织物质量预测的准确率达到98.054%,且训练时长仅需4.8 s,在保证织物质量预测准确性的同时,极大缩短了检测时间,提高了织造车间生产效率。 展开更多
关键词 织布车间 织物质量 K-近邻算法 粒子群-反向传播神经网络算法 织物质量预测
下载PDF
基于多策略融合斑马优化算法的特征选择方法
15
作者 王震 王新春 +2 位作者 杨培宏 费鹏宇 郑学奎 《现代电子技术》 北大核心 2024年第18期149-155,共7页
针对传统斑马优化算法在求解复杂优化问题时精度低、收敛速度慢和易陷入局部最优的不足,提出一种多策略融合的改进斑马优化算法(IZOA)。首先,为解决斑马个体初始位置分布不均匀的问题,引入混沌映射来增加探索过程的种群多样性;其次,受... 针对传统斑马优化算法在求解复杂优化问题时精度低、收敛速度慢和易陷入局部最优的不足,提出一种多策略融合的改进斑马优化算法(IZOA)。首先,为解决斑马个体初始位置分布不均匀的问题,引入混沌映射来增加探索过程的种群多样性;其次,受自适应权重和黄金正弦算法思想启发,提出一种基于自适应递减权重和黄金正弦更新机制的位置更新策略,用于改进斑马算法的局部寻优与全局探索能力;然后,进行标准测试函数实验,验证了IZOA能够有效提升寻优精度和收敛速度;最后,将K近邻分类器作为待优化目标,选取UCI库的12个标准数据集进行特征选择实验,并利用改进后的算法在特征选择模型中进行最优特征子集搜寻。实验结果表明,相比传统算法,所提算法的平均分类准确率提升4.47%,平均适应度值降低2.5%,验证了该算法在特征选择领域的优越性。 展开更多
关键词 斑马优化算法 多策略融合 特征选择 混沌映射 自适应权重 黄金正弦算法 K近邻分类器
下载PDF
基于图像识别的公路隧道围岩智能动态分级研究
16
作者 周梦琳 陈强 +3 位作者 汪波 宋自愿 彭传阳 程黎 《隧道建设(中英文)》 CSCD 北大核心 2024年第6期1274-1282,共9页
针对勘察设计阶段判别的隧道围岩等级与施工过程中实际揭露的围岩情况不符的问题,提出一种以隧道施工期实际揭露的围岩为研究对象的智能动态分级方法。首先,依托甘肃省渭武高速公路木寨岭隧道工程,利用单反相机采集掌子面图像,基于深度... 针对勘察设计阶段判别的隧道围岩等级与施工过程中实际揭露的围岩情况不符的问题,提出一种以隧道施工期实际揭露的围岩为研究对象的智能动态分级方法。首先,依托甘肃省渭武高速公路木寨岭隧道工程,利用单反相机采集掌子面图像,基于深度学习Res Net18网络设计T-Res Net模型,进行掌子面围岩图像特征定性识别分类;然后,利用数字图像处理技术定量识别、提取节理裂隙特征参数,进而确定掌子面完整性指标;最后,结合岩石坚硬程度、岩体完整程度、主结构面产状、地下水发育状况、初始地应力、节理延展性6个指标建立围岩分级指标体系,并采用特征加权KNN(K-nearest neighbor)算法模型实现隧道围岩智能动态分级。研究结果表明:1)T-Res Net模型在节理裂隙测试集的准确率达到83.23%,在地下水测试集的准确率达到92.86%,可以实现围岩特征的有效识别与精确分类;2)使用机器视觉方法处理现场围岩图像,可快速提取岩体完整性系数和地下水发育情况,实现现场智能化高效分析;3)KNN智能动态分级方法在依托工程具有良好的适用性和较高的准确性,可有效实现隧道施工过程中的围岩动态分级。 展开更多
关键词 公路隧道 深度学习 数字图像处理 KNN算法 围岩分级
下载PDF
基于参数自适应DBSCAN算法的浮标位置数据异常检测
17
作者 章新亮 肖虹 周世波 《集美大学学报(自然科学版)》 CAS 2024年第1期24-31,共8页
针对遥测遥控系统采集浮标位置数据时易受外在因素的干扰,提出了一种K近邻优化的参数自适应DBSCAN算法,来检测浮标位置数据中的异常点。通过分析数据集的分布特性生成最优邻域距离值ε和邻域内样本点数量MinPts列表,引入卡林斯基-哈拉... 针对遥测遥控系统采集浮标位置数据时易受外在因素的干扰,提出了一种K近邻优化的参数自适应DBSCAN算法,来检测浮标位置数据中的异常点。通过分析数据集的分布特性生成最优邻域距离值ε和邻域内样本点数量MinPts列表,引入卡林斯基-哈拉巴斯指数对列表中的参数进行评分,将最高评分对应的参数作为最优参数,实现DBSCAN算法的自适应聚类。实验结果表明,新算法能够自适应选择最优参数,对浮标遥测位置数据的异常点进行有效检测。 展开更多
关键词 浮标位置 异常检测 遥测遥控系统 DBSCAN算法 K近邻算法 CH指数
下载PDF
具有混合策略的樽海鞘群特征选择算法
18
作者 余紫康 董红斌 《智能系统学报》 CSCD 北大核心 2024年第3期757-765,共9页
近年来,随着计算机和数据库技术的快速发展,大规模数据集迅速增长,利用特征选择技术来筛选信息量大的特征已经变得非常重要。本文提出了一种具有混合策略的樽海鞘群特征选择算法(salp swarm feature selection algorithm with hybrid st... 近年来,随着计算机和数据库技术的快速发展,大规模数据集迅速增长,利用特征选择技术来筛选信息量大的特征已经变得非常重要。本文提出了一种具有混合策略的樽海鞘群特征选择算法(salp swarm feature selection algorithm with hybrid strategy,HS-SSA)。首先,本文生成一张基于互信息的排序表,并由排序表提出了新的初始化策略。其次,提出一个新颖的并且有条件调用的动态搜索算法。最后在位置更新上结合瞬态搜索算法(transient search algorithm,TSO),改进勘探和开发步骤的效率,增加解空间的灵活性和多样性,从而使算法能够快速定位到全局最优位置。为了验证算法的性能,实验选取14个UCI的数据集,并且与樽海鞘群算法(SSA)以及近几年樽海鞘群的改进算法等多种优化算法进行比较,结果表明HS-SSA在特征选择上具有更强的竞争力。 展开更多
关键词 特征选择 樽海鞘群算法 瞬态搜索算法 启发式算法 互信息 动态搜索算法 秩和检验 K近邻
下载PDF
支持K-近邻搜索的区块链泛用型数据隐私保护方法
19
作者 王胜 潘正高 董全德 《辽宁大学学报(自然科学版)》 CAS 2024年第2期147-157,共11页
随着区块链泛用型数据应用场景的不断扩大,其涉及的数据隐私越来越多,数据隐私泄露可能导致个人信用受损,带来财产损失甚至身份盗用等.合理高效地进行用户身份信息及数据隐私保护是确保区块链泛用型数据安全的关键问题.为此,本文提出了... 随着区块链泛用型数据应用场景的不断扩大,其涉及的数据隐私越来越多,数据隐私泄露可能导致个人信用受损,带来财产损失甚至身份盗用等.合理高效地进行用户身份信息及数据隐私保护是确保区块链泛用型数据安全的关键问题.为此,本文提出了支持K-近邻搜索的区块链泛用型数据隐私保护方法,采集区块链泛用型数据,利用k-prototypes算法,聚类区块链泛用型数据,并控制分类属性和数值属性.在此基础上,本文支持K-近邻搜索,建立区块链泛用型数据系统模型,确定区块链泛用型数据敏感区域,实现区块链泛用型数据隐私保护.实验结果表明,本文所提方法具有较好的区块链泛用型数据隐私保护效果,能够有效提高区块链泛用型数据隐私保护安全性,缩短区块链泛用型数据隐私保护时间. 展开更多
关键词 K-近邻搜索 区块链 泛用型数据 k-prototypes算法 数据隐私保护
下载PDF
融合动态K近邻Slope_One的协同过滤推荐算法
20
作者 李灵慧 王逊 +1 位作者 王云沼 黄树成 《计算机与数字工程》 2024年第1期156-161,共6页
传统协同过滤推荐算法存在数据稀疏的问题,这会导致算法精确度不足。Slope_One算法简单高效,可以预测用户对某个物品的评分。因此,论文提出融合动态K近邻Slope_One的协同过滤推荐算法,提高推荐算法的精确度。首先利用改进余弦相似度公... 传统协同过滤推荐算法存在数据稀疏的问题,这会导致算法精确度不足。Slope_One算法简单高效,可以预测用户对某个物品的评分。因此,论文提出融合动态K近邻Slope_One的协同过滤推荐算法,提高推荐算法的精确度。首先利用改进余弦相似度公式计算用户相似度,筛选出K个近邻用户进行平均评分偏差计算,利用Slope_One算法预测相应的用户评分并对评分矩阵进行有效填充,然后在新的评分矩阵上,利用基于物品的协同过滤算法进行推荐。 展开更多
关键词 协同过滤 K近邻 Slope_One算法 数据稀疏
下载PDF
上一页 1 2 60 下一页 到第
使用帮助 返回顶部