期刊文献+
共找到256篇文章
< 1 2 13 >
每页显示 20 50 100
Financial Data Modeling by Using Asynchronous Parallel Evolutionary Algorithms
1
作者 Wang Chun, Li Qiao-yunSchool of Business, Huazhong University of Science and Technology , Wuhan 4300741 Hubei ChinaNetwork and Software Technology Center of America, Sony Corporation San Jose, CA, USA 《Wuhan University Journal of Natural Sciences》 CAS 2003年第S1期239-242,共4页
In this paper, the high-level knowledge of financial data modeled by ordinary differential equations (ODEs) is discovered in dynamic data by using an asynchronous parallel evolutionary modeling algorithm (APHEMA). A n... In this paper, the high-level knowledge of financial data modeled by ordinary differential equations (ODEs) is discovered in dynamic data by using an asynchronous parallel evolutionary modeling algorithm (APHEMA). A numerical example of Nasdaq index analysis is used to demonstrate the potential of APHEMA. The results show that the dynamic models automatically discovered in dynamic data by computer can be used to predict the financial trends. 展开更多
关键词 financial data mining asynchronous parallel algorithm knowledge discovery evolutionary modeling
下载PDF
Using Audiometric Data to Weigh and Prioritize Factors that Affect Workers’ Hearing Loss through Support Vector Machine (SVM) Algorithm 被引量:3
2
作者 Hossein ElahiShirvan MohammadReza Ghotbi-Ravandi +1 位作者 Sajad Zare Mostafa Ghazizadeh Ahsaee 《Sound & Vibration》 EI 2020年第2期99-112,共14页
Workers’exposure to excessive noise is a big universal work-related challenges.One of the major consequences of exposure to noise is permanent or transient hearing loss.The current study sought to utilize audiometric... Workers’exposure to excessive noise is a big universal work-related challenges.One of the major consequences of exposure to noise is permanent or transient hearing loss.The current study sought to utilize audiometric data to weigh and prioritize the factors affecting workers’hearing loss based using the Support Vector Machine(SVM)algorithm.This cross sectional-descriptive study was conducted in 2017 in a mining industry in southeast Iran.The participating workers(n=150)were divided into three groups of 50 based on the sound pressure level to which they were exposed(two experimental groups and one control group).Audiometric tests were carried out for all members of each group.The study generally entailed the following steps:(1)selecting predicting variables to weigh and prioritize factors affecting hearing loss;(2)conducting audiometric tests and assessing permanent hearing loss in each ear and then evaluating total hearing loss;(3)categorizing different types of hearing loss;(4)weighing and prioritizing factors that affect hearing loss based on the SVM algorithm;and(5)assessing the error rate and accuracy of the models.The collected data were fed into SPSS 18,followed by conducting linear regression and paired samples t-test.It was revealed that,in the first model(SPL<70 dBA),the frequency of 8 KHz had the greatest impact(with a weight of 33%),while noise had the smallest influence(with a weight of 5%).The accuracy of this model was 100%.In the second model(70<SPL<80 dBA),the frequency of 4 KHz had the most profound effect(with a weight of 21%),whereas the frequency of 250 Hz had the lowest impact(with a weight of 6%).The accuracy of this model was 100%too.In the third model(SPL>85 dBA),the frequency of 4 KHz had the highest impact(with a weight of 22%),while the frequency of 250 Hz had the smallest influence(with a weight of 3%).The accuracy of this model was 100%too.In the fourth model,the frequency of 4 KHz had the greatest effect(with a weight of 24%),while the frequency of 500 Hz had the smallest effect(with a weight of 4%).The accuracy of this model was found to be 94%.According to the modeling conducted using the SVM algorithm,the frequency of 4 KHz has the most profound effect on predicting changes in hearing loss.Given the high accuracy of the obtained model,this algorithm is an appropriate and powerful tool to predict and model hearing loss. 展开更多
关键词 Noise modeling hearing loss data mining support vector machine algorithm
下载PDF
The Books Recommend Service System Based on Improved Algorithm for Mining Association Rules
3
作者 王萍 《魅力中国》 2009年第29期164-166,共3页
The Apriori algorithm is a classical method of association rules mining.Based on analysis of this theory,the paper provides an improved Apriori algorithm.The paper puts foward with algorithm combines HASH table techni... The Apriori algorithm is a classical method of association rules mining.Based on analysis of this theory,the paper provides an improved Apriori algorithm.The paper puts foward with algorithm combines HASH table technique and reduction of candidate item sets to enhance the usage efficiency of resources as well as the individualized service of the data library. 展开更多
关键词 ASSOCIATION RULES data mining algorithm Recommend BOOKS SERVICE model
下载PDF
Using Optimized Distributional Parameters as Inputs in a Sequential Unsupervised and Supervised Modeling of Sunspots Data
4
作者 K. Mwitondi J. Bugrien K. Wang 《Journal of Software Engineering and Applications》 2013年第7期34-41,共8页
Detecting naturally arising structures in data is central to knowledge extraction from data. In most applications, the main challenge is in the choice of the appropriate model for exploring the data features. The choi... Detecting naturally arising structures in data is central to knowledge extraction from data. In most applications, the main challenge is in the choice of the appropriate model for exploring the data features. The choice is generally poorly understood and any tentative choice may be too restrictive. Growing volumes of data, disparate data sources and modelling techniques entail the need for model optimization via adaptability rather than comparability. We propose a novel two-stage algorithm to modelling continuous data consisting of an unsupervised stage whereby the algorithm searches through the data for optimal parameter values and a supervised stage that adapts the parameters for predictive modelling. The method is implemented on the sunspots data with inherently Gaussian distributional properties and assumed bi-modality. Optimal values separating high from lows cycles are obtained via multiple simulations. Early patterns for each recorded cycle reveal that the first 3 years provide a sufficient basis for predicting the peak. Multiple Support Vector Machine runs using repeatedly improved data parameters show that the approach yields greater accuracy and reliability than conventional approaches and provides a good basis for model selection. Model reliability is established via multiple simulations of this type. 展开更多
关键词 Clustering data mining Density Estimation EM algorithm SUNSPOTS Supervised modelLING Support Vector Machines UNSUPERVISED modelLING
下载PDF
Multi-step ahead soil temperature forecasting at different depths based on meteorological data:Integrating resampling algorithms and machine learning models 被引量:1
5
作者 Khabat KHOSRAVI Ali GOLKARIAN +5 位作者 Rahim BARZEGAR Mohammad T.AALAMI Salim HEDDAM Ebrahim OMIDVAR Saskia D.KEESSTRA Manuel LÓPEZ-VICENTE 《Pedosphere》 SCIE CAS CSCD 2023年第3期479-495,共17页
Direct soil temperature(ST)measurement is time-consuming and costly;thus,the use of simple and cost-effective machine learning(ML)tools is helpful.In this study,ML approaches,including KStar,instance-based K-nearest l... Direct soil temperature(ST)measurement is time-consuming and costly;thus,the use of simple and cost-effective machine learning(ML)tools is helpful.In this study,ML approaches,including KStar,instance-based K-nearest learning(IBK),and locally weighted learning(LWL),coupled with resampling algorithms of bagging(BA)and dagging(DA)(BA-IBK,BA-KStar,BA-LWL,DA-IBK,DA-KStar,and DA-LWL)were developed and tested for multi-step ahead(3,6,and 9 d ahead)ST forecasting.In addition,a linear regression(LR)model was used as a benchmark to evaluate the results.A dataset was established,with daily ST time-series at 5 and 50 cm soil depths in a farmland as models’output and meteorological data as models’input,including mean(T_(mean)),minimum(Tmin),and maximum(T_(max))air temperatures,evaporation(Eva),sunshine hours(SSH),and solar radiation(SR),which were collected at Isfahan Synoptic Station(Iran)for 13 years(1992–2005).Six different input combination scenarios were selected based on Pearson’s correlation coefficients between inputs and outputs and fed into the models.We used 70%of the data to train the models,with the remaining 30%used for model evaluation via multiple visual and quantitative metrics.Our?ndings showed that T_(mean)was the most effective input variable for ST forecasting in most of the developed models,while in some cases the combinations of variables,including T_(mean)and T_(max)and T_(mean),T_(max),Tmin,Eva,and SSH proved to be the best input combinations.Among the evaluated models,BA-KStar showed greater compatibility,while in most cases,BA-IBK and-LWL provided more accurate results,depending on soil depth.For the 5 cm soil depth,BA-KStar had superior performance(i.e.,Nash-Sutcliffe efficiency(NSE)=0.90,0.87,and 0.85 for 3,6,and 9 d ahead forecasting,respectively);for the 50 cm soil depth,DA-KStar outperformed the other models(i.e.,NSE=0.88,0.89,and 0.89 for 3,6,and 9 d ahead forecasting,respectively).The results con?rmed that all hybrid models had higher prediction capabilities than the LR model. 展开更多
关键词 bootstrap aggregating algorithm data mining disjoint aggregating algorithm ensemble modeling hybrid model
原文传递
基于改进SPRINT分类算法的数据挖掘模型
6
作者 林敏 王李杰 《信息技术》 2024年第3期170-174,187,共6页
为解决目前数据挖掘模型分类时间长、挖掘准确率不高的问题,提出基于改进决策树分类算法(SPRINT)的数据挖掘模型。先采用最大-最小规范化公式完成原始数据线性变换,利用改进后的SPRINT分类算法按照输入数据特性进行分类,使用协同过滤技... 为解决目前数据挖掘模型分类时间长、挖掘准确率不高的问题,提出基于改进决策树分类算法(SPRINT)的数据挖掘模型。先采用最大-最小规范化公式完成原始数据线性变换,利用改进后的SPRINT分类算法按照输入数据特性进行分类,使用协同过滤技术生成与数据相近的属性集,计算数据属性相似度,生成语义规则集,为用户提供更优的数据服务。选取某公司营销数据集作为样本进行对比实验,结果表明,与对比模型相比,所提出的数据挖掘模型分类时间更短,挖掘准确率更高,能为用户提供更优质的数据服务。 展开更多
关键词 决策树分类算法 协同过滤技术 语义规则集 数据挖掘模型 神经网络
下载PDF
基于隐结构模型和频繁项集的针刺治疗慢性前列腺炎辨证取穴规律
7
作者 胡创政 孙自学 +4 位作者 张宸铭 樊立鹏 华众 付晓君 门波 《世界中医药》 CAS 北大核心 2024年第8期1182-1187,共6页
目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢... 目的:探讨针刺治疗慢性前列腺炎的辨证取穴规律,为临床治疗慢性前列腺炎提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中文科技期刊数据库(CCD)等数据库中关于针刺辨证论治慢性前列腺炎的文献,构建包含症状、证型、穴位处方的慢性前列腺炎病历数据库,运用隐结构模型分析、频繁项集等方法,分析针刺治疗慢性前列腺炎的辨证取穴规律。结果:共纳入文献64篇,涉及穴位91个,症状248项。高频穴位如三阴交、中极等;高频症状包括舌体瘀点瘀斑、苔黄腻、滴白、尿急等;构建隐结构模型,得出慢性前列腺炎主要证型有湿热下注、肾阳不足等;挖掘出症状-穴位频繁项集、症状-证型-穴位频繁项集各4项。症状-穴位频繁项集如“尿急+滴白+阳痿+早泄+肾俞+足三里”,症状-证型-穴位频繁项集如“尿频+尿急+苔黄腻+滴白+舌体瘀点瘀斑+湿热瘀阻+三阴交+会阴”,提示治疗时可根据相应症状判定证型及选择对应穴位。结论:针刺治疗慢性前列腺炎多以三阴交、中极、关元等为主要穴位,穴位配伍依据临床情况辨证选穴,此可为临床治疗慢性前列腺炎提供参考。 展开更多
关键词 隐结构模型 频繁项集 慢性前列腺炎 数据挖掘 辨证取穴规律 针刺 穴位 APRIORI算法
下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律
8
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
下载PDF
学习路径规划方法
9
作者 罗中凯 张立波 《中国科学院大学学报(中英文)》 CSCD 北大核心 2024年第1期11-27,共17页
旨在通过对学习路径规划研究现状的分析,为未来学习路径规划领域相关研究的发展提供借鉴。具体而言,首先介绍学习路径规划的定义以及学习路径规划方法中常用参数;然后按照使用算法的类别的不同,对学习路径规划算法进行详细分类,总结各... 旨在通过对学习路径规划研究现状的分析,为未来学习路径规划领域相关研究的发展提供借鉴。具体而言,首先介绍学习路径规划的定义以及学习路径规划方法中常用参数;然后按照使用算法的类别的不同,对学习路径规划算法进行详细分类,总结各类学习路径规划方法的优缺点;接着,对学习路径规划方法使用的数据集与评估方法进行介绍;最后,总结学习路径规划方法面临的挑战并对其未来发展趋势进行预测。 展开更多
关键词 学习路径 进化算法 数据挖掘 知识图谱 神经网络
下载PDF
智慧图书馆用户画像图像处理算法模型设计与实现 被引量:1
10
作者 杜文龙 朱博文 柴源 《电子设计工程》 2024年第3期185-189,共5页
针对当前无法对智慧图书馆物联网空间系统中用户图像画像数据进行计算、处理并进行深层次数据挖掘的现状,研究和设计了一种用以画像图像处理的点操作算法模型。模型的底层算法采用适用于空间域增强过程的灰度变换算法。搭建包含算法转... 针对当前无法对智慧图书馆物联网空间系统中用户图像画像数据进行计算、处理并进行深层次数据挖掘的现状,研究和设计了一种用以画像图像处理的点操作算法模型。模型的底层算法采用适用于空间域增强过程的灰度变换算法。搭建包含算法转换、近似计算、增量更新、查找表和浮点计算等组成计算单元的模型的核心算子。对点操作算法模型的核心算子IP计算单元进行设计,实现了对计算单元的加速设计与实现,计算单元加速效果良好,算法模型合理有效,核心算子的简单像素流水数据能够实时得到流水像素结果输出。 展开更多
关键词 智慧图书馆 用户画像 图像处理 算法模型 数据挖掘
下载PDF
机器学习算法在渔船数据挖掘技术中的应用
11
作者 刘敏 《黄山学院学报》 2024年第3期13-16,共4页
本文基于PCA_Word2Vec的渔船数据挖掘技术展开研究,构建了PCA_Word2Vec渔船数据挖掘模型并对渔船轨迹数据进行挖掘,在此基础之上通过将LightGBM模型与其他经典模型分类效果进行比较,以及对PCA_Word2Vec数据挖掘模型挖掘前后的数据展开对... 本文基于PCA_Word2Vec的渔船数据挖掘技术展开研究,构建了PCA_Word2Vec渔船数据挖掘模型并对渔船轨迹数据进行挖掘,在此基础之上通过将LightGBM模型与其他经典模型分类效果进行比较,以及对PCA_Word2Vec数据挖掘模型挖掘前后的数据展开对比,验证了渔船数据挖掘技术的有效性和实用性。 展开更多
关键词 机器学习算法 PCA_Word2Vec数据挖掘模型 数据挖掘 渔船识别
下载PDF
基于乌鸦搜索算法的医疗数据填补方法
12
作者 甄珍 刘昱鑫 +2 位作者 陈斌 任海萍 刘亚芝 《现代仪器与医疗》 CAS 2024年第3期48-53,共6页
医疗数据的缺失会导致统计功效降低,进而严重影响诊断的准确性,甚至出现误诊。因此,对医疗问题中的各缺失数据选用有效的填补方法极为重要。为了在医疗数据存在缺失的情况下,对数据进行高效填补以提升医疗数据挖掘效果,本文提出了基于... 医疗数据的缺失会导致统计功效降低,进而严重影响诊断的准确性,甚至出现误诊。因此,对医疗问题中的各缺失数据选用有效的填补方法极为重要。为了在医疗数据存在缺失的情况下,对数据进行高效填补以提升医疗数据挖掘效果,本文提出了基于乌鸦搜索算法的医疗数据填补方法。设计了数据填补模型,在此基础上确定了算法个体编码与数据填补模型的映射方式,进而应用乌鸦搜索算法对填补模型进行迭代寻优,最后通过最优的填补模型构建完整医疗数据集。在4个医疗数据集上与2种传统填补方法[均值填补(Mean Imputation,MI)、K最近邻填补(K Nearest Neighbor Imputation,KNNI)]等进行了对比实验,人工构造不同缺失率的数据集,运用各填补方法对缺失数据集进行填补,并将分类算法在填补数据集上的准确率作为填补方法的效果评估指标,结果显示,相较于MI,所提方法使得分类算法在4个数据集上平均提高了3.7%、3.8%、11.1%和17.7%的准确率;相较于KNNI,所提方法平均提升了分类算法4%、14.8%、12.6%和21.7%的准确率。以上结果表明,本文所提基于乌鸦搜索算法的填补方法能够有效完成缺失数据的填补,提升数据挖掘算法的性能。 展开更多
关键词 进化算法 医疗数据 数据填补 乌鸦搜索算法 数据挖掘
下载PDF
数据挖掘聚类算法在电力系统中的应用
13
作者 赵瑞锋 李波 +3 位作者 卢建刚 李世明 曾坚永 郑文杰 《信息技术》 2024年第2期172-179,共8页
针对电力系统当前输出数据多、数据应用能力差等问题,提出一种新型的数据挖掘方法。构建改进型数据挖掘聚类算法模型,通过FCM聚类算法模型实现电力系统应用过程中不同状态数据分析、计算与应用;构建回归算法模型,实现分类后数据信息的预... 针对电力系统当前输出数据多、数据应用能力差等问题,提出一种新型的数据挖掘方法。构建改进型数据挖掘聚类算法模型,通过FCM聚类算法模型实现电力系统应用过程中不同状态数据分析、计算与应用;构建回归算法模型,实现分类后数据信息的预测;通过构建电力系统应用模型,将不同的数据信息融合后,实现了多种数据信息的挖掘与应用。实验证明,该研究方法分类能力强、预测精度高,可推广使用。 展开更多
关键词 数据挖掘 FCM聚类算法模型 回归算法模型 预测精度 电力系统
下载PDF
A Clustering Method Based on Brain Storm Optimization Algorithm
14
作者 Tianyu Wang Yu Xue +3 位作者 Yan Zhao Yuxiang Wang Yan Zhang Yuxiang He 《Journal of Information Hiding and Privacy Protection》 2020年第3期135-142,共8页
In the field of data mining and machine learning,clustering is a typical issue which has been widely studied by many researchers,and lots of effective algorithms have been proposed,including K-means,fuzzy c-means(FCM)... In the field of data mining and machine learning,clustering is a typical issue which has been widely studied by many researchers,and lots of effective algorithms have been proposed,including K-means,fuzzy c-means(FCM)and DBSCAN.However,the traditional clustering methods are easily trapped into local optimum.Thus,many evolutionary-based clustering methods have been investigated.Considering the effectiveness of brain storm optimization(BSO)in increasing the diversity while the diversity optimization is performed,in this paper,we propose a new clustering model based on BSO to use the global ability of BSO.In our experiment,we apply the novel binary model to solve the problem.During the period of processing data,BSO was mainly utilized for iteration.Also,in the process of K-means,we set the more appropriate parameters selected to match it greatly.Four datasets were used in our experiment.In our model,BSO was first introduced in solving the clustering problem.With the algorithm running on each dataset repeatedly,our experimental results have obtained good convergence and diversity.In addition,by comparing the results with other clustering models,the BSO clustering model also guarantees high accuracy.Therefore,from many aspects,the simulation results show that the model of this paper has good performance. 展开更多
关键词 Clustering method brain storm optimization algorithm(BSO) evolutionary clustering algorithm data mining
下载PDF
基于分布式数据流聚类的成绩层次化评估方法
15
作者 陈海英 陈华 《保定学院学报》 2024年第4期105-110,共6页
为提高成绩评估结果的准确率,针对成绩数据具有的多元化、容量大、分布式的特点,引入分布式数据流聚类算法,优化数据聚类精度和时效性,实现成绩层次化评价.首先,通过聚类特征指数直方图建立分布式数据流挖掘矩阵,提高成绩数据的聚类性能... 为提高成绩评估结果的准确率,针对成绩数据具有的多元化、容量大、分布式的特点,引入分布式数据流聚类算法,优化数据聚类精度和时效性,实现成绩层次化评价.首先,通过聚类特征指数直方图建立分布式数据流挖掘矩阵,提高成绩数据的聚类性能.将一阶线性微分方程结合分数阶累加,构建全局聚簇模型,保证聚类性能稳定.然后,采用层次分析法处理成绩数据,将成绩按照基础课程、专业课程及实训课程分类,确保层次化评估的精确率,再结合权重法得到成绩评估结果.实验结果表明,该方法有效实现对成绩数据的层次化评估,精确率、召回率、AUC值分别可以达到98.75%、86.67%、0.987,评估时长仅为488.4 ms,且该方法的收敛效果较优,数据流能耗较低. 展开更多
关键词 分布式数据流 聚类算法 成绩评估 直方图 挖掘矩阵 层次分析法 全局聚簇模型
下载PDF
高校学生全画像学业成绩预警模型分析
16
作者 郭召 张子涵 刘艺 《计算机应用文摘》 2024年第3期16-19,28,共5页
基于CatBoost算法,利用高校学生的全面画像数据,建立了学业成绩预警模型,可有效预防学生学业成绩的严重下滑。文章以江苏连云港一所高校的学生学业成绩数据为对象,采用机器学习算法CatBoost,并以学生的历史学业成绩数据为基础进行学业... 基于CatBoost算法,利用高校学生的全面画像数据,建立了学业成绩预警模型,可有效预防学生学业成绩的严重下滑。文章以江苏连云港一所高校的学生学业成绩数据为对象,采用机器学习算法CatBoost,并以学生的历史学业成绩数据为基础进行学业成绩的预测,其准确率达到了79.6%。 展开更多
关键词 数据挖掘 CatBoost算法 回归模型 学生全画像学业成绩预警
下载PDF
Evolutionary computation in China: A literature survey 被引量:1
17
作者 Maoguo Gong Shanfeng Wang +2 位作者 Wenfeng Liu Jianan Yan Licheng Jiao 《CAAI Transactions on Intelligence Technology》 2016年第4期334-354,共21页
关键词 电子商务 中国 发展现状 计算机技术
下载PDF
考虑模糊时间序列的高维大数据挖掘方法研究 被引量:4
18
作者 陈婷婷 赵世忠 《计算机仿真》 北大核心 2023年第3期467-470,475,共5页
高维空间的大数据维数越高,其高维索引结构的性能越差,无法通过数据之间的相似性度量完成挖掘。为此,提出基于模糊时间序列预测的高维大数据挖掘方法。对初始的高维大数据集求取各维度数据的属性信息熵,根据信息熵筛选数据,通过主成分... 高维空间的大数据维数越高,其高维索引结构的性能越差,无法通过数据之间的相似性度量完成挖掘。为此,提出基于模糊时间序列预测的高维大数据挖掘方法。对初始的高维大数据集求取各维度数据的属性信息熵,根据信息熵筛选数据,通过主成分分析备选集合中的数据属性,结合成分协方差与特征值,降低数据维度。采用K均值聚类算法二分聚类处理降维数据,取得粗聚类结果。利用支持向量机的最优超平面与决策树作细化分类。基于时间序列上的数据极值,明确数据集的论域个数与范围,根据模糊化处理的模糊集序数,建立模糊逻辑关系,建立模糊时间序列预测模型,对大数据去模糊化处理,完成高维大数据挖掘。选用UCI大数据库作为样本集设计对比测试实验。实验结果验证了研究方法的大数据挖掘精度更高,数据挖掘加速比高达0.9以上,说明所提方法的实时性较强,具备更好的应用性能。 展开更多
关键词 高维数据挖掘 模糊时间序列预测模型 主成分分析法 聚类算法 支持向量机
下载PDF
基于数据挖掘技术的“智慧旅游”文本研究分析 被引量:2
19
作者 白伟华 陈晓鑫 《肇庆学院学报》 2023年第2期45-54,共10页
在旅游景区的网络评论平台中,由于游客们的评论数量庞大且内容杂乱,依靠人工经验来处理评论文本的分类工作将会导致其分类效率低且差错率高等现象,而基于数据挖掘技术的文本分析将可以大大改善这一现象.为此,本文将基于数据挖掘技术来... 在旅游景区的网络评论平台中,由于游客们的评论数量庞大且内容杂乱,依靠人工经验来处理评论文本的分类工作将会导致其分类效率低且差错率高等现象,而基于数据挖掘技术的文本分析将可以大大改善这一现象.为此,本文将基于数据挖掘技术来对“智慧旅游”中景区及酒店网评文本数据进行研究分析,并分别完成景区及酒店的印象分析、景区及酒店的综合评价、网评文本的有效性分析和景区及酒店的特色分析这四项工作任务.经实验分析表明,数据挖掘技术在文本分析中表现出良好的性能,且本文所选用的模型算法在解决四项指定任务中也都得到较为良好的结果. 展开更多
关键词 分词提取 数据挖掘 情感分析 模型算法 误差评价
下载PDF
基于FA-ELM深度挖掘模型的电力工程预算控制技术
20
作者 徐宁 张文静 +2 位作者 周波 董振亮 陈志宾 《沈阳工业大学学报》 CAS 北大核心 2023年第6期637-642,共6页
针对现有预算控制方法存在目标单一,效果不理想等问题,提出了一种基于FA-ELM深度挖掘模型的电力工程预算控制技术。通过深入剖析电力工程费用的组成与影响因素,提出了工程进度与预算双目标的管控方式。利用萤火虫算法优化极限学习机网络... 针对现有预算控制方法存在目标单一,效果不理想等问题,提出了一种基于FA-ELM深度挖掘模型的电力工程预算控制技术。通过深入剖析电力工程费用的组成与影响因素,提出了工程进度与预算双目标的管控方式。利用萤火虫算法优化极限学习机网络,构建FA-ELM预测模型,将预处理后的电力数据输入FA-ELM模型中,可估计每个阶段的工程费用,便于管理人员采取相应的措施。在MATLAB仿真平台上对所提技术进行实验分析,结果表明:FA-ELM模型的预测误差均控制在6%以内,且工程总费用节约了14.09%,整体性能优于其他对比技术。 展开更多
关键词 电力工程 预算控制 极限学习机网络 数据挖掘 工程进度 萤火虫算法 FA-ELM模型
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部