期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向非平衡训练集分类的随机森林算法优化 被引量:13
1
作者 吴琼 李运田 郑献卫 《工业控制计算机》 2013年第7期89-90,共2页
数据挖掘是当今社会最活跃的研究方向之一,迄今为止数据挖掘技术已经广泛应用到各行各业中,然而在数据挖掘过程中往往会遇到很多非平衡训练集,采用传统的数据挖掘技术对非平衡训练集集进行处理不能得到理想的效果。主要是针对非平衡训练... 数据挖掘是当今社会最活跃的研究方向之一,迄今为止数据挖掘技术已经广泛应用到各行各业中,然而在数据挖掘过程中往往会遇到很多非平衡训练集,采用传统的数据挖掘技术对非平衡训练集集进行处理不能得到理想的效果。主要是针对非平衡训练集,对数据进行NCL(Neighborhood Cleaning Rule)技术处理并结合随机森林(Random Forest)算法进行分类,试验结果表明,改进后的随机森林算法分类效果更好。 展开更多
关键词 数据挖掘 非平衡训练集 随机森林 NCL
下载PDF
改进的TF-IDF模型在特征抽取中的应用 被引量:3
2
作者 李运田 吴琼 郑献卫 《工业控制计算机》 2014年第2期51-51,共1页
在TF-IDF的基础上,提出了一种利用N-gram方法提取特征值的方法,能够很好的从一系列文本中取出某篇文本的特征值,并且可以对分词出现错误的一些连续的词语进行合并得到正确的一组词语,减少了分词出现的错误率。
关键词 TF—IDF N—gram 特征值
下载PDF
基于组合预测模型的股票价格趋势预测 被引量:5
3
作者 郑献卫 张贺 《工业控制计算机》 2014年第6期121-122,125,共3页
针对股票市场高度非线性的特点,单一预测模型很难描述出股票价格趋势的整体特征,提出了一种金融时序预测的组合预测模型。首先,利用自回归移动模型(ARIMA)对股票价格线性趋势进行预测。然后,利用回归支持向量机(SVR)模型对非线性随机变... 针对股票市场高度非线性的特点,单一预测模型很难描述出股票价格趋势的整体特征,提出了一种金融时序预测的组合预测模型。首先,利用自回归移动模型(ARIMA)对股票价格线性趋势进行预测。然后,利用回归支持向量机(SVR)模型对非线性随机变化规律进行预测。最后,采用模糊时变权重方式对两种模型进行结合,得到一种综合考虑股票价格线性和非线性的预测模型。仿真结果显示,组合预测模型取得了令人满意的效果。 展开更多
关键词 股票价格 ARIMA SVR 组合预测
下载PDF
LDA主题抽取模型在互联网旅游评论的应用 被引量:2
4
作者 郑献卫 张贺 《工业控制计算机》 2014年第9期92-94,共3页
面对网络上日益丰富的评论信息资源,如何在海量的客户评论中快速有效的获取并使用其中的有效信息,成为人们日益关注的问题。研究目标是互联网上的旅游评论,通过使用数据挖掘算法分析获取评论中关于商品或服务的主题词,并提取所有评论中... 面对网络上日益丰富的评论信息资源,如何在海量的客户评论中快速有效的获取并使用其中的有效信息,成为人们日益关注的问题。研究目标是互联网上的旅游评论,通过使用数据挖掘算法分析获取评论中关于商品或服务的主题词,并提取所有评论中包含主题词的句子。使用主题抽取模型(LDA模型)进行半监督的聚类处理,建立景点评论的主题模型,实现了互联网旅游评论个性化的设置和查询。 展开更多
关键词 互联网旅游评论 LDA模型 网络文本 主题抽取
下载PDF
一种优化的模糊变权重组合预测在沪深300中的应用与研究
5
作者 李运田 吴琼 郑献卫 《工业控制计算机》 2013年第10期111-112,共2页
沪深300指数是沪深证券交易所联合发布的反映A股市场整体走势的指数。对沪深300指数的分析与研究可以帮助我们了解市场走势,同时也十分有利于投资者全面把握中国股票市场总体运行状况。针对股票市场的高度非线性与复杂性,本文首先利用... 沪深300指数是沪深证券交易所联合发布的反映A股市场整体走势的指数。对沪深300指数的分析与研究可以帮助我们了解市场走势,同时也十分有利于投资者全面把握中国股票市场总体运行状况。针对股票市场的高度非线性与复杂性,本文首先利用霍尔特指数平滑法(Holt)和最小二乘支持向量机(LSSVM)模型对沪深300指数进行预测,然后提出一种基于Holt与LSSVM的模糊变权重模型进行预测,取得了令人满意的效果。在设计过程中,我们利用R语言作为模型拟合与预测的软件,R语言是一款免费的良好的数据处理软件。 展开更多
关键词 沪深300指数 Holt LSSVM 模糊变权重 R语言
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部