期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于ERF和BO-SVC的交流接触器触头故障识别方法
1
作者 刘树鑫 祁新智 吕先锋 《电力工程技术》 北大核心 2024年第6期173-182,共10页
针对交流接触器各状态样本不均衡导致故障状态识别精度低和特征冗余度高的问题,文中提出一种基于嵌入式随机森林(embedded random forest,ERF)和贝叶斯优化非线性支持向量机(Bayesian optimization-support vector classification,BO-S... 针对交流接触器各状态样本不均衡导致故障状态识别精度低和特征冗余度高的问题,文中提出一种基于嵌入式随机森林(embedded random forest,ERF)和贝叶斯优化非线性支持向量机(Bayesian optimization-support vector classification,BO-SVC)的复合识别方法。首先,通过交流接触器全寿命试验平台提取接触器状态特征,并针对各状态样本间不均衡导致识别精度低现象,提出一种基于权重法的样本均衡处理策略。然后,使用ERF对均衡后样本进行特征选择和降维,提取最能表征触头状态变化规律的最优特征。最后,将最优特征输入到BO-SVC识别模型,与另外2种代表性模型作为对比,以精确率、召回率和F1-分数3个指标对各模型性能进行评估。在3个指标上,文中方法的结果分别达到95.22%、98.91%和97.01%,均高于对比模型。以F1-分数为指标,在4组样本上对各模型性能进行测试,结果表明文中方法的F1-分数平均高出对比模型0.56%和27.28%,验证文中研究有效解决了交流接触器特征冗余和故障识别精度低的问题。 展开更多
关键词 交流接触器 故障识别 样本不均衡 特征选择 嵌入式随机森林(erf) 贝叶斯优化非线性支持向量机(BO-SVC)
下载PDF
基于随机森林算法的科研项目经费计算方法评价分析
2
作者 黄琰 李士杰 谷裕 《科技管理研究》 CSSCI 2024年第11期173-180,共8页
通过收集来自电网项目的上千份经费数据,挖掘科研跨度和科技研发价值的特征因素,构建科技项目样本集。使用实体嵌入的方式,将离散变量向量化,再基于随机森林,通过迭代计算测定科技研发价值与科研项目金额的关联规律性,形成能反映科技研... 通过收集来自电网项目的上千份经费数据,挖掘科研跨度和科技研发价值的特征因素,构建科技项目样本集。使用实体嵌入的方式,将离散变量向量化,再基于随机森林,通过迭代计算测定科技研发价值与科研项目金额的关联规律性,形成能反映科技研发价值的科研项目经费计列方法。研究结果表明,随机森林在预测科技研发价值与科研项目金额关联方面具有显著优势。通过构建多棵决策树,减少单一模型的过拟合风险,提升预测的准确性和稳定性。在此基础上评估各特征变量的重要性,能够有效识别对科研经费预测影响较大的因素,从而为科研经费分配提供科学依据。 展开更多
关键词 随机森林 实体嵌入 科研项目金额 预测
下载PDF
基于随机树嵌入的随钻测井岩性识别方法
3
作者 王新领 祝新益 +2 位作者 张宏兵 孙博 许可欣 《吉林大学学报(地球科学版)》 CAS CSCD 北大核心 2024年第2期701-708,共8页
岩性识别是储层评价中的一项重要工作.随着机器学习方法的不断发展,岩性的智能识别也成为热门研究方向.随钻测井技术目前已经得到了广泛的应用,但是受限于高温高压的钻井作业条件,随钻测井仪器只能测得少量测井参数.由于随钻测井参数较... 岩性识别是储层评价中的一项重要工作.随着机器学习方法的不断发展,岩性的智能识别也成为热门研究方向.随钻测井技术目前已经得到了广泛的应用,但是受限于高温高压的钻井作业条件,随钻测井仪器只能测得少量测井参数.由于随钻测井参数较少,直接输入机器学习模型无法充分挖掘其中的信息.对此,本文将随机树嵌入引入随钻测井资料的岩性识别.该方法将低维随钻测井数据通过二叉树编码并转化为高维稀疏特征,利用升维后的数据进行训练从而提升机器学习模型的判别能力.对比实验结果表明,使用随机树嵌入的随机森林方法具有最佳的识别效果,准确率和F_(1)值较直接使用随机森林分别提升了3.16%和3.25%,且优于梯度提升树、极随机树和粒子群优化支持向量机算法. 展开更多
关键词 机器学习 随机树嵌入 随机森林 岩性识别 随钻测井
下载PDF
一种基于降维密度聚类的船舶异常轨迹识别方法 被引量:1
4
作者 李可欣 郭健 +3 位作者 王宇君 李宗明 缪坤 陈辉 《包装工程》 CAS 北大核心 2023年第11期284-292,共9页
目的有效分析和探索海洋船舶时空轨迹行为模式,提高船舶轨迹聚类的效率与质量,更好地检测真实船舶的异常行为。方法针对当前船舶轨迹数据研究中存在的对多维特征信息利用不足、检测效率不高、检测精度较差等问题,提出一种精确度高、能... 目的有效分析和探索海洋船舶时空轨迹行为模式,提高船舶轨迹聚类的效率与质量,更好地检测真实船舶的异常行为。方法针对当前船舶轨迹数据研究中存在的对多维特征信息利用不足、检测效率不高、检测精度较差等问题,提出一种精确度高、能自主识别分析多维特征的船舶异常轨迹识别方法。首先利用随机森林分类器评估多维特征重要性,构建轨迹特征的最优组合;然后提出一种降维密度聚类方法,将T–分布随机邻域嵌入(T–SNE)和自适应密度聚类(DBSCAN)模型结合,通过构建特征选择层和无监督聚类层实现对数据元素非线性关系的高效提取以及对聚类参数的智能选择;最后根据聚类结果构建类簇特征向量,计算距离阈值判别轨迹相似度,实现轨迹异常检测模型的构建。结果以UCI数据集为例,降维密度聚类方法对4、13、30、64维特征数据集的F1分数能达到0.9048、0.9534、0.8218、0.6627,多个聚类指标均优于DBSCAN、K–Means等常见聚类算法的。结论研究结果表明,降维密度聚类方法能有效提取数据多维特征结构,实现聚类参数自适应,弥补密度聚类中参数难以确定的问题,有效实现对多种类型船舶轨迹异常的识别。 展开更多
关键词 异常检测 时空轨迹 特征降维 密度聚类 参数自适应 T–分布随机邻域嵌入 随机森林
下载PDF
限定领域口语对话系统中超出领域话语的对话行为识别 被引量:3
5
作者 黄沛杰 王俊东 +1 位作者 柯子烜 林丕源 《中文信息学报》 CSCD 北大核心 2016年第6期182-189,200,共9页
由于领域外话语具有内容短小、表达多样性、开放性及口语化等特点,限定领域口语对话系统中超出领域话语的对话行为识别是一个挑战。该文提出了一种结合外部无标签微博数据的随机森林对话行为识别方法。该文采用的微博数据无需根据应用... 由于领域外话语具有内容短小、表达多样性、开放性及口语化等特点,限定领域口语对话系统中超出领域话语的对话行为识别是一个挑战。该文提出了一种结合外部无标签微博数据的随机森林对话行为识别方法。该文采用的微博数据无需根据应用领域特点专门收集和挑选,又与口语对话同样具有口语化和表达多样性的特点,其训练得到的词向量在超出领域话语出现超出词汇表字词时提供了有效的相似性扩展度量。随机森林模型具有较好的泛化能力,适合训练数据有限的分类任务。中文特定领域的口语对话语料库测试表明,该文提出的超出领域话语的对话行为识别方法取得了优于最大熵、卷积神经网络等短文本分类研究进展中的方法的效果。 展开更多
关键词 对话行为识别 超出领域话语 随机森林 词向量 口语对话系统
下载PDF
基于三维荧光光谱特征的中药药性模式识别研究 被引量:15
6
作者 樊凤杰 轩凤来 +1 位作者 白洋 纪会芳 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第6期1763-1768,共6页
由于三维荧光光谱技术选择性好、灵敏度高、测试快速等优点目前已在众多领域中被广泛应用。中药药性理论是中药的核心基础理论,是中药学的特色理论之一,中药药性的客观化判别是中医药现代化研究的关键问题。中药中大部分分子具备产生荧... 由于三维荧光光谱技术选择性好、灵敏度高、测试快速等优点目前已在众多领域中被广泛应用。中药药性理论是中药的核心基础理论,是中药学的特色理论之一,中药药性的客观化判别是中医药现代化研究的关键问题。中药中大部分分子具备产生荧光的能力,因而,针对中药三维荧光光谱特征,从中药药性的角度对中药进行分类识别研究。利用FS920型稳态荧光光谱仪测得5组不同浓度的23味寒温类中药溶液制剂的三维荧光光谱数据,获取样本的等高线图和三维荧光光谱图;分析不同样本不同激发波长和发射波长范围存在噪声的基础上,应用集合经验模态分解算法(EEMD)对光谱图进行降噪预处理;基于局部线性嵌入算法(LLE)对光谱数据进行特征提取,分析近邻点数k=12,本征维数d=7时得到的特征向量,结果表明不同浓度的寒性药在PC4和PC6的特征值变化明显,不同浓度的温性药在PC1,PC2,PC4和PC7的特征值变化明显,且浓度越高特征值都有下降趋势。将提取的特征向量输入到随机森林(RF)中,构建LLE-RF分类模型,分析不同参数时LLE-RF分类模型对寒温类中药荧光光谱数据的分类效果,设置RF分类器中训练集和测试集的样本比例分别为3∶1和2∶1,即训练集的比重r分别为3/4和2/3,分析LLE中近邻点数k取值为7~18,本征维数d分别取值为6,7,8,9和10时分类正确率。当近邻点数k=12,本征维数d=7时LLE-RF模型对中药药性的分类正确率最高,达到96.6%。最后比较同一比例r情况下,采用不同核函数构造SVM分类器对寒温类中药荧光光谱数据分类效果,当多层感知机作为核函数时,分类效果最差。当r=3/4,径向基作为核函数时,寒温类中药荧光光谱数据的分类效果最好,正确率达到82.1%。分析结果表明,通过荧光光谱技术与LLE-RF相结合的方法,能有效的将寒温类中药进行模式识别,并且分类效果比LLE-SVM更理想。 展开更多
关键词 三维荧光光谱 特征提取 中药药性 局部线性嵌入 随机森林
下载PDF
基于改进型深度LLE和随机森林的人脸检测算法 被引量:1
7
作者 宋全有 李万高 《电子器件》 CAS 北大核心 2014年第4期626-630,共5页
针对人脸检测问题的特点,提出一种基于改进型深度LLE(Locally Linear Embedding)算法和随机森林相结合的人脸检测算法。首先,通过采集图像的深度信息,结合图像的颜色信息,构建三维图像信息数据库,再通过改进的LLE算法得到最优降维结果,... 针对人脸检测问题的特点,提出一种基于改进型深度LLE(Locally Linear Embedding)算法和随机森林相结合的人脸检测算法。首先,通过采集图像的深度信息,结合图像的颜色信息,构建三维图像信息数据库,再通过改进的LLE算法得到最优降维结果,按一定比例选取训练集,输入随机森林算法建立数据分类器;最后,将测试集输入到训练完成的分类器中,实现人脸图像的检测。选取Yale,JAFFE 2类数据集与传统算法进行对比实验,验证算法的优越性和可行性。实验结果表明:所提出的算法可以有效地完成人脸检测,检测率高于传统算法7%左右。 展开更多
关键词 人脸检测 局部线性嵌入 深度 降维 随机森林
下载PDF
基于图像识别的高铁接触网紧固件开口销故障分类方法 被引量:2
8
作者 王健 罗隆福 +2 位作者 邹津海 朱胜蓝 叶威 《电气化铁道》 2020年第2期45-49,共5页
针对高铁接触网紧固件开口销缺失、松脱和安装不规范等现象,基于图像识别理论提出一种开口销故障等级划分方案和基于机器学习的开口销分类方法。在分类阶段,首先采用SSD算法对接触网4C系统的回图进行开口销定位与识别,并采用Deeplabv3+... 针对高铁接触网紧固件开口销缺失、松脱和安装不规范等现象,基于图像识别理论提出一种开口销故障等级划分方案和基于机器学习的开口销分类方法。在分类阶段,首先采用SSD算法对接触网4C系统的回图进行开口销定位与识别,并采用Deeplabv3+进行语义分割,最后采用SURF特征检测器对语义分割图片提取关键点,再利用视觉词袋模型BOVW生成视觉码本,利用视觉码本对极端随机森林ERF进行训练并生成模型。极端随机森林通过网格搜索和交叉验证(Gridsearch+CV)实现参数调优,使用ERF模型对开口销图片分类。采用该方法对实际线路的图片进行实验检测,准确率达到了93.2%,且节省人力,能有效保障高铁的供电安全。 展开更多
关键词 图像识别 开口销故障分类 语义分割 极端随机森林 SURF算法
下载PDF
基于局部线性嵌入的随机森林算法
9
作者 陈树娟 《科技通报》 北大核心 2013年第8期33-35,共3页
随机森林是一种优秀的分类算法,然而随机森林算法不能有效的判断冗余属性,因此影响了在含有冗余属性的数据集上的分类效果。针对这一问题,本文提出了一种基于局部线性嵌入的随机森林算法。该算法利用局部线性嵌入算法对冗余属性数据集... 随机森林是一种优秀的分类算法,然而随机森林算法不能有效的判断冗余属性,因此影响了在含有冗余属性的数据集上的分类效果。针对这一问题,本文提出了一种基于局部线性嵌入的随机森林算法。该算法利用局部线性嵌入算法对冗余属性数据集进行降维,然后利用随机森林算法进行分类学习。在UCI标准数据集上的仿真实验说明,本文算法是一种优秀的含冗余属性数据集分类算法。 展开更多
关键词 随机森林 分类算法 局部线性嵌入 降维
下载PDF
基于Attention深度随机森林的社区演化事件预测 被引量:5
10
作者 潘剑飞 曹燕 +2 位作者 董一鸿 陈华辉 钱江波 《电子学报》 EI CAS CSCD 北大核心 2019年第10期2050-2060,共11页
在网络结构不断变化的同时,社区结构也随之演化.社区结构在不同时间片的变化可定义为四种不同的演化事件:持续、分离、融合和消失.本文运用网络表示学习的方法,对网络进行图嵌入编码映射到低维向量空间中,研究动态社区演化事件的预测.... 在网络结构不断变化的同时,社区结构也随之演化.社区结构在不同时间片的变化可定义为四种不同的演化事件:持续、分离、融合和消失.本文运用网络表示学习的方法,对网络进行图嵌入编码映射到低维向量空间中,研究动态社区演化事件的预测.特征方面,在传统的社区内部属性特征、时间片间属性特性变化和前段时间片的社区演化事件的特征维度的基础上,引入潜在结构特征表征四种演化事件,运用随机游走和Softmax思想获取潜在的结构特征;模型方面,引入深度随机森林的策略,同时采用attention机制、蒙特卡洛特征采样策略进行特征融合和特征训练,克服了已有算法仅获取局部结构特征的缺陷.实验在DBLP、FACEBOOK和Bitcoin数据集上,对比SVM、XGBOOST和RIDGE模型训练,证实了新提出的算法模型对最终预测准确率有很大的提升. 展开更多
关键词 社区演化 图嵌入 网络表示学习 深度随机森林 attention机制
下载PDF
公益林生物量估算方法研究——以浙江省缙云县公益林为例 被引量:4
11
作者 陈蜀蓉 张超 +3 位作者 郑超超 张伟 伊力塔 余树全 《浙江林业科技》 北大核心 2015年第5期20-28,共9页
以缙云县公益林为例,利用2010年的117个公益林固定小班监测数据和Landsat5 TM遥感数据,选取遥感变量和地学变量等80个自变量,运用多元线性回归、偏最小二乘回归、随机森林回归和Erf-BP神经网络四种模型,对缙云县公益林生物量进行建模估... 以缙云县公益林为例,利用2010年的117个公益林固定小班监测数据和Landsat5 TM遥感数据,选取遥感变量和地学变量等80个自变量,运用多元线性回归、偏最小二乘回归、随机森林回归和Erf-BP神经网络四种模型,对缙云县公益林生物量进行建模估算,并比较四种方法的优缺点。结果表明:在R2、PRECISION和RMSE方面,随机森林回归优于其他方法,而在VR和BIAS方面,Erf-BP神经网络方法比其他方法更好,但从提高生物量精度和减少均方根误差综合评价,随机森林方法是较好的选择。 展开更多
关键词 生物量 多元线性回归 偏最小二乘回归 随机森林 erf-BP神经网络
下载PDF
基于词向量的检索扩展方法与农业领域实证
12
作者 吴蕾 梁晓贺 +1 位作者 乌吉斯古楞 王瑞 《农业大数据学报》 2019年第2期114-120,共7页
【目的】目前,科技文献大数据中存在着主题词不规范、不统一的情况,因此在构建检索式时很难既满足查全要求,又满足查准要求。针对这一问题,本文提出了一种基于词向量的检索扩展方法,并在“基于多组学大数据的功能基因挖掘与辅助育种技... 【目的】目前,科技文献大数据中存在着主题词不规范、不统一的情况,因此在构建检索式时很难既满足查全要求,又满足查准要求。针对这一问题,本文提出了一种基于词向量的检索扩展方法,并在“基于多组学大数据的功能基因挖掘与辅助育种技术”领域进行了实验验证。【方法】首先清洗数据集,并将文本映射成词向量,一篇文章可以用其所有词向量的平均向量表示;然后用训练集中文章的平均词向量训练随机森林分类器;最后在测试集中对文本进行分类,从而得到正例数据即检索数据集。【结果】针对“基于多组学大数据的功能基因挖掘与辅助育种技术”领域构建检索式,通过对比检索式所提取的小数据集、扩展检索式数据集和该方法提取的检索数据集的主题词云并对其进行主题共现聚类,结果发现相比小数据集和扩展检索式数据集,检索数据集能够表现另外两个数据集所体现的主题词和主题聚类,同时能够展现更多属于该主题领域的主题词和主题聚类。【结论】结果表明该方法具有较好的查全性和查准性,构建了满足分析的“基于多组学大数据的功能基因挖掘与辅助育种技术”领域数据集,同时在构建其他领域数据集时具有可扩展性,在未来研究中可以被应用到其他目标领域的数据集构建中。 展开更多
关键词 大数据 检索扩展 词向量 随机森林 数据挖掘 自然语言处理 机器学习 深度学习
下载PDF
一种基于深度特征和KNN随机森林的无失真图嵌入方法
13
作者 占善华 黄少丽 《现代计算机》 2020年第31期46-49,共4页
图像分类算法在各种计算机视觉问题(例如对象跟踪、图像标记和对象分割)中起着重要作用,很多专家也已经提出许多方法来解决这个问题。有一种被广泛采用的一种方法是基于图像的手工设计特征表征图像。不过,深度神经网络的最新研究进展表... 图像分类算法在各种计算机视觉问题(例如对象跟踪、图像标记和对象分割)中起着重要作用,很多专家也已经提出许多方法来解决这个问题。有一种被广泛采用的一种方法是基于图像的手工设计特征表征图像。不过,深度神经网络的最新研究进展表明其具有学习更多区分性和代表性特征的能力。因此,深层特征已成为手工设计特征替代方法之一。提出一种基于深度特征和KNN随机森林的无失真图嵌入的新颖框架。对于图像分类任务,该方法优于基于最新图形嵌入的图像分类方法。特别是,对于5类的ImageNet数据集,提出的框架获得96.1%的top-1图像分类精度,而对于10类的框架,则达到了92.3%。 展开更多
关键词 图嵌入 深度学习 图像分类 随机森林
下载PDF
随机森林手势识别算法的高效嵌入式软件实现 被引量:6
14
作者 郑小敏 李翔宇 《计算机工程》 CAS CSCD 北大核心 2021年第7期218-225,共8页
无接触手势识别技术作为一种自然的人机交互方式,可以应用于手机、平板和可穿戴设备。为了高效实现超声手势识别嵌入式系统中采用的"一对其余"多分类随机森林算法,提出一种其推理过程的嵌入式软件实现方案。设计更精简的模型... 无接触手势识别技术作为一种自然的人机交互方式,可以应用于手机、平板和可穿戴设备。为了高效实现超声手势识别嵌入式系统中采用的"一对其余"多分类随机森林算法,提出一种其推理过程的嵌入式软件实现方案。设计更精简的模型节点数据结构,以降低手势模型占用的存储空间。为节省系统能耗并缩短运行时间,利用分支定界的方法及时排除不可能产生正确解的手势类型,在保证识别率的条件下避免不必要的FLASH读取和决策树判定过程。实验结果表明,与传统的随机森林算法相比,该方案在FPGA上运行的实测时间缩短约60%,一次推理的平均判定次数低至243。 展开更多
关键词 随机森林 手势识别 嵌入式软件 分支定界 FLASH存储
下载PDF
面向嵌入式控制终端的水培生菜光调控目标值模型 被引量:2
15
作者 完香蓓 简丽蓉 +2 位作者 辛萍萍 单慧勇 胡瑾 《上海农业学报》 2019年第2期42-47,共6页
随着嵌入式系统的发展,如何在嵌入式控制终端上实现不同根温、气温、CO2浓度下光饱和点的动态获取,成为设施农业发展的重要问题。以水培生菜为试验材料,设计多因子嵌套试验方案,基于随机森林算法建立面向嵌入式控制终端的光调控目标值模... 随着嵌入式系统的发展,如何在嵌入式控制终端上实现不同根温、气温、CO2浓度下光饱和点的动态获取,成为设施农业发展的重要问题。以水培生菜为试验材料,设计多因子嵌套试验方案,基于随机森林算法建立面向嵌入式控制终端的光调控目标值模型,研究随机森林算法参数对模型的影响,并对模型进行验证分析。结果表明:该模型可实现基于嵌入式控制终端的光饱和点的动态获取,模型决定系数为0. 9955,均方根误差为5. 677,平均绝对误差为5. 3475,可为面向嵌入式系统的光环境高效精准调控提供理论依据。 展开更多
关键词 光饱和点 水培 随机森林算法 光调控 嵌入式系统
下载PDF
基于可见-近红外光谱及随机森林的鸡蛋产地溯源 被引量:4
16
作者 王彬 王巧华 +3 位作者 肖壮 马逸霄 李理 杨朋 《食品工业科技》 CAS CSCD 北大核心 2017年第24期243-247,共5页
为了研究快速无损鉴别鸡蛋产地的可行性,利用可见-近红外光谱技术,采集4种湖北不同产地鸡蛋的透射光谱(500~900 nm),利用中心化、归一化、标准正态变量(SNV)、Savitzky-Golay平滑滤波(SG)和多元散射校正(MSC)、直接正交信号校正(Direct ... 为了研究快速无损鉴别鸡蛋产地的可行性,利用可见-近红外光谱技术,采集4种湖北不同产地鸡蛋的透射光谱(500~900 nm),利用中心化、归一化、标准正态变量(SNV)、Savitzky-Golay平滑滤波(SG)和多元散射校正(MSC)、直接正交信号校正(Direct Orthogonal Signal Correction,DOSC)算法对光谱数据进行预处理,采用t分布式随机邻域嵌入(t-distributed stochastic neighbor embedding,t-SNE)、主成分分析(PCA)方法对预处理后的数据降维,并将降维后的数据分别输入极限学习机(extreme learning machine,ELM)和随机森林(random forest,RF),建立鸡蛋产地溯源模型。比较两种方法建立的模型,发现运用DOSC预处理及t-SNE提取的光谱特征信息建立的RF模型鉴别效果最好,训练集和预测集的鉴别正确率分别为100%和98.33%。研究结果表明基于可见-近红外光谱技术对鸡蛋产地溯源是可行的,为进一步研究与开发鸡蛋产地溯源便携式仪器提供技术支持。 展开更多
关键词 可见-近红外光谱 鸡蛋 产地溯源 t分布式随机邻域嵌入 随机森林
下载PDF
基于多粒度级联森林的骨质疏松性骨折预测研究 被引量:7
17
作者 徐辉煌 张海宇 林勇 《北京生物医学工程》 2019年第4期384-391,共8页
目的骨质疏松性骨折(osteoporotic fracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grained cascade forest,gcForest)并结合... 目的骨质疏松性骨折(osteoporotic fracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grained cascade forest,gcForest)并结合遗传因子来预测OF。方法首先基于 t 分布邻域嵌入( t -distributed stochastic neighbor embedding, t -SNE)算法对OF关联基因位点进行非线性降维,降维后的基因位点与临床因素构成特征组。然后构建gcForest模型对OF进行预测。最后通过10次十折分层交叉验证与logistic、梯度提升决策树、随机森林进行对比。结果基于gcForest的模型分类精度为0.892 7,AUC值为0.92±0.05,泛化性能最优。结论在考虑遗传因素的条件下,gcForest分类效果优于其他模型,验证了本文方法的高效性和实用性。 展开更多
关键词 机器学习 骨质疏松性骨折 t分布邻域嵌入 随机森林 多粒度级联森林
下载PDF
Suggestion Mining from Opinionated Text of Big Social Media Data 被引量:6
18
作者 Youseef Alotaibi Muhammad Noman Malik +4 位作者 Huma Hayat Khan Anab Batool Saif ul Islam Abdulmajeed Alsufyani Saleh Alghamdi 《Computers, Materials & Continua》 SCIE EI 2021年第9期3323-3338,共16页
:Social media data are rapidly increasing and constitute a source of user opinions and tips on a wide range of products and services.The increasing availability of such big data on biased reviews and blogs creates cha... :Social media data are rapidly increasing and constitute a source of user opinions and tips on a wide range of products and services.The increasing availability of such big data on biased reviews and blogs creates challenges for customers and businesses in reviewing all content in their decision-making process.To overcome this challenge,extracting suggestions from opinionated text is a possible solution.In this study,the characteristics of suggestions are analyzed and a suggestion mining extraction process is presented for classifying suggestive sentences from online customers’reviews.A classification using a word-embedding approach is used via the XGBoost classifier.The two datasets used in this experiment relate to online hotel reviews and Microsoft Windows App Studio discussion reviews.F1,precision,recall,and accuracy scores are calculated.The results demonstrated that the XGBoost classifier outperforms—with an accuracy of more than 80%.Moreover,the results revealed that suggestion keywords and phrases are the predominant features for suggestion extraction.Thus,this study contributes to knowledge and practice by comparing feature extraction classifiers and identifying XGBoost as a better suggestion mining process for identifying online reviews. 展开更多
关键词 Suggestion mining word embedding Naïve Bayes random forest XGBoost DATASET
下载PDF
基于TSMRFDE和随机森林的旋转机械故障诊断 被引量:3
19
作者 宋来建 王晓甜 吴彬彬 《组合机床与自动化加工技术》 北大核心 2022年第8期125-129,共5页
为高效检测旋转机械的故障类型和严重程度,提出了一种具有优异泛化性的旋转机械故障诊断方法。首先,基于反向波动散布熵和时移粗粒化处理,开发了一种新的测量时间序列复杂度的方法,称为时移多尺度反向波动散布熵(TSMRFDE);其次,采用t-... 为高效检测旋转机械的故障类型和严重程度,提出了一种具有优异泛化性的旋转机械故障诊断方法。首先,基于反向波动散布熵和时移粗粒化处理,开发了一种新的测量时间序列复杂度的方法,称为时移多尺度反向波动散布熵(TSMRFDE);其次,采用t-随机领域嵌入(t-SNE)对TSMRFDE进行流形降维,减小特征的冗余;最后,将低维故障特征输入至随机森林(RF)分类器进行故障识别。实验结果表明,TSMRFDE-t-SNE-RF在不同平台的实验中都取得了优异的故障识别结果,平均识别准确率分别达到了100%和97.9%,验证了该方法的泛化性和稳定性。 展开更多
关键词 时移多尺度反向波动散布熵 t-SNE 随机森林 旋转机械 故障诊断
下载PDF
方向字典子图的初始邻域嵌入重构
20
作者 黄堂森 王结太 刘鹏 《北京邮电大学学报》 EI CAS CSCD 北大核心 2016年第6期104-109,共6页
邻域嵌入超分辨率重构算法在空间邻域选取过程中,细节特征易被大幅度特征分量淹没,为此,提出了基于方向字典子图的初始邻域嵌入重构算法.对输入图像及邻域利用方向字典进行稀疏分解,从大、小幅值表示系数中分别重构大、小幅度特征子图,... 邻域嵌入超分辨率重构算法在空间邻域选取过程中,细节特征易被大幅度特征分量淹没,为此,提出了基于方向字典子图的初始邻域嵌入重构算法.对输入图像及邻域利用方向字典进行稀疏分解,从大、小幅值表示系数中分别重构大、小幅度特征子图,保护邻域计算中的小幅度特征;同时,为降低多子图重构的运算量,通过随机森林机制,将输入图像在分类树森林中对应叶子节点图像子库的并集作为初始邻域,减小实际参与运算的图像库大小.实验结果表明,相对于邻域嵌入超分辨率算法,基于方向字典子图的初始邻域嵌入重构的峰值信噪比值平均提升了1.095 9 d B,有效改善了重构效果;重构时间仅为邻域嵌入超分辨率的13.3%,降低了重构复杂度. 展开更多
关键词 超分辨率重构 邻域嵌入 方向字典 随机森林
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部