期刊文献+
共找到1,645篇文章
< 1 2 83 >
每页显示 20 50 100
基于荧光光镊与机器学习的单细胞血液分类方法
1
作者 周哲海 熊涛 +2 位作者 赵爽 张帆 朱桂贤 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第4期1081-1087,共7页
利用物种间血液成分的差异来识别物种,对生物医学、医疗健康、海关、刑侦、食品安全、野生动物保护等工作十分重要。但目前的研究都是针对群体细胞展开,忽略了单细胞的异质性,开展基于单细胞的血液光谱分类方法研究非常迫切。在此提出... 利用物种间血液成分的差异来识别物种,对生物医学、医疗健康、海关、刑侦、食品安全、野生动物保护等工作十分重要。但目前的研究都是针对群体细胞展开,忽略了单细胞的异质性,开展基于单细胞的血液光谱分类方法研究非常迫切。在此提出了一种基于荧光光镊和机器学习的单细胞血液分类方法,利用光镊实现了单细胞捕获,通过荧光光谱检测系统获得了单细胞荧光光谱数据,并基于机器学习方法实现了准确分类。首先,设计并搭建了一套荧光光镊系统,实现了单细胞捕获和荧光光谱检测。然后,制备了马、猪、犬、鸡四种动物的红细胞稀释液,以440 nm激光作为荧光激发光源,获得了四个物种每种100条、共计400条荧光光谱数据,并进行了背景去除、平滑、归一化的预处理,消除了信号中的噪声干扰。随后,建立了随机森林分类模型,分析了当抽取特征数k=20时,模型中树的棵数与预测准确率之间的关系,当决策树m=500时,分类正确率趋于稳定,有很高的分类正确率和运行效率。进一步地,设定样本数据的30%作为测试集、70%为训练集,计算不同波长与特征重要性之间的关系,得到了10个分类准确率,并取平均值作为模型分类的准确率,测试集最终准确率达到93.1%,方差为0.31%。最后,计算了混淆矩阵,对模型预测精度进行了评价,鸡的分类正确率最高,马的分类正确率最低。分析表明,对分类有重要贡献的物质分别是卟啉类物质、血红素和黄素腺嘌呤二核苷酸。总之,研究表明,将荧光光镊与机器学习方法相结合,可实现单细胞水平的血液分类,较高的分类正确率验证了这种方法的可行性和有效性。同时,该方法不需要过多样品就能满足建模需求,避免了因浓度低带来的荧光自吸收强度过低等问题,具有快速、准确分类的优点,具有非常重要的潜在应用价值。 展开更多
关键词 血液分类 荧光光镊 机器学习 单细胞 随机森林分类模型
下载PDF
数字人文范式下机器学习文本分类应用于翻译研究的路径探索——以翻译汉语句法特征研究为例
2
作者 钟书能 杨立汝 《上海交通大学学报(哲学社会科学版)》 CSSCI 北大核心 2024年第8期1-17,共17页
文本分类等大数据挖掘技术的应用是数字人文范式下翻译研究的主要特征之一。翻译语言特征研究是翻译研究的基础领域。本研究提出机器学习文本分类应用于翻译语言特征研究的“五步法”研究路径,包含文本分类数据远观、贡献度排序特征中... 文本分类等大数据挖掘技术的应用是数字人文范式下翻译研究的主要特征之一。翻译语言特征研究是翻译研究的基础领域。本研究提出机器学习文本分类应用于翻译语言特征研究的“五步法”研究路径,包含文本分类数据远观、贡献度排序特征中观、随机选择文本细读、语言规律总结和规律成因阐释等五个步骤。本研究依循该路径考察了翻译汉语的句法特征,发现翻译汉语相比原创汉语的最显著特征是数词在“数词+作名词的量词”表名词短语、习语、“数词+量词+名词”表模糊义等范畴边缘成员上的负使用,其认知成因在于译者倾向于忽略语义网络中突显程度较低的范畴边缘成员。案例研究表明,引入机器学习文本分类算法能够提升语言宏观描写层面的全面性、客观性与科学性,基于数据结论随机选择文本开展语例细读则有助于深入挖掘形式数据背后隐含的更细颗粒度的语言规律。本研究旨在为数字人文范式下的翻译研究提供新的方法与思路。 展开更多
关键词 数字人文 机器学习 文本分类 翻译语言特征研究 五步法
下载PDF
XGBoost-SHAP机器学习可解释框架用于轻度认知障碍分类研究
3
作者 易付良 陈杜荣 +7 位作者 杨慧 秦瑶 韩红娟 崔靖 白文琳 马艺菲 张荣 余红梅 《中国卫生统计》 CSCD 北大核心 2024年第3期423-429,共7页
目的利用机器学习算法对轻度认知障碍(mild cognitive impairment,MCI)亚型分类有利于患者的个性化治疗,而复杂模型常因分类过程的内部机制不可洞察而饱受诟病,本研究借助可解释技术梳理模型的输出结果,以期为相关领域研究者的决策提供... 目的利用机器学习算法对轻度认知障碍(mild cognitive impairment,MCI)亚型分类有利于患者的个性化治疗,而复杂模型常因分类过程的内部机制不可洞察而饱受诟病,本研究借助可解释技术梳理模型的输出结果,以期为相关领域研究者的决策提供统计支持。方法本研究联合极限梯度提升(eXtreme Gradient Boosting,XGBoost)与沙普利可加性(SHapley Additive exPlanations,SHAP)构建可解释性框架,用于遗忘型MCI(amnestic MCI,aMCI)和非遗忘型MCI(non-amnestic naMCI)的分类,并根据联合框架输出结果进行解读。结果联合框架输出aMCI和naMCI的最佳分界值为0.51,XGBoost分类准确率、灵敏度、特异度、F1值、AUC分别为92.81%、94.94%、90.54%、0.93、0.96。SHAP个性化预测结果,7号和31号示例个体被预测为aMCI的概率分别为0.27和0.91;全局性解释结果,不同个体随着CEREALL、ORIENT、CDRSUM、LCMF、RSUPMAR、RMEDORBF、LPOSCENM等指标的shapley值增大,患aMCI的风险越大,上述指标可以解释为aMCI发生的危险因素,而RENT、MMSEORDA、CRAFTVRS等则相反,可以解释为aMCI发生的保护因素。结论XGBoost-SHAP联合框架用于MCI亚型分类效果较为理想,实现了特定个体不同特征预测效果的比较、不同个体给定特征预测能力的判断,为相关研究者打开了洞察复杂模型内在机制的大门。 展开更多
关键词 机器学习 可解释性 极限梯度提升-沙普利可加性 轻度认知障碍 分类
下载PDF
基于机器学习算法的扬州市冬小麦遥感分类提取
4
作者 陈雨欣 刘章鑫 +2 位作者 刘欣谊 刘涛 孙成明 《中国农机化学报》 北大核心 2024年第8期154-161,169,共9页
卫星遥感技术是目前较为常用的农作物监测与分类技术。为实现区域冬小麦精确分类和面积提取,以江苏省扬州市为例,以哨兵2号卫星数据及航天飞机雷达地形测量(SRTM)高程数据为数据源,利用分类与回归决策树(CART)、梯度提升决策树(GBDT)、... 卫星遥感技术是目前较为常用的农作物监测与分类技术。为实现区域冬小麦精确分类和面积提取,以江苏省扬州市为例,以哨兵2号卫星数据及航天飞机雷达地形测量(SRTM)高程数据为数据源,利用分类与回归决策树(CART)、梯度提升决策树(GBDT)、支持向量机(SVM)和随机森林(RF)4种机器学习算法建立分类模型。同时下载并调用2021年3月22日研究区的MSI多光谱影像,提取光谱、纹理、地形特征等参数,对研究区冬小麦进行分类提取,并分析4种模型的分类效果和精度。结果表明,RF和GBDT分类方法效果最好,总体精度最高,均为0.967,Kappa系数达0.960;SVM分类方法总体精度最低,为0.514,但用户精度最高,为0.972。上述方法可以实现区域农作物的精确分类和提取。 展开更多
关键词 冬小麦 机器学习 单时相 面积提取 遥感分类
下载PDF
基于机器学习的创伤伤员检伤分类预测模型构建及验证
5
作者 张睿智 罗瑞虹 +4 位作者 卢志林 李春平 卢兵 邢家溢 黎檀实 《解放军医学院学报》 CAS 2024年第3期223-229,共7页
背景创伤现场批量伤员的检伤分类是现场急救中的关键环节,探索如何更加高效准确地对伤员进行检伤分类具有重要意义。目的基于生命体征数据和机器学习算法建立并验证创伤伤员检伤分类预测模型。方法回顾性分析美国创伤数据库2017—2019... 背景创伤现场批量伤员的检伤分类是现场急救中的关键环节,探索如何更加高效准确地对伤员进行检伤分类具有重要意义。目的基于生命体征数据和机器学习算法建立并验证创伤伤员检伤分类预测模型。方法回顾性分析美国创伤数据库2017—2019年的院前急救创伤伤员数据,采用支持向量机(support vector machine,SVM)、随机森林(random forest,RF)、梯度提升决策树(gradient boosting decision tree,GBDT)、极端梯度提升(eXtreme gradient boosting,XGBoost)和多层感知机(multi-layer perceptron,MLP)5种机器学习算法开发创伤伤员检伤分类预测模型并验证。采用准确率、精准度、召回率、F1值和AUC值(ROC曲线下面积)进行结果评价,使用ROC曲线进行可视化,并在解放军总医院第一医学中心急诊创伤数据集中对最优模型结果进行验证。结果共选取伤员数据24948例,基于ISS分级标准分为轻伤9496例,中等伤9532例,重伤5496例,危重伤424例。ROC曲线分析显示,相较于其他四种模型,GBDT算法预测上述ISS分级的效能最好,准确率为82.63%,精确度为68.21%,召回率为60.92%,F1值为61.91%,AUC为90.38%。在解放军总医院第一医学中心急诊创伤数据集中验证GBDT模型,准确率为83.15%,精确度为77.38%,召回率为59.89%,F1值为55.26%,AUC为90.38%。结论本研究成功开发并验证了一组检伤分类机器学习预测模型,未来可应用于创伤伤员现场检伤分类辅助决策。 展开更多
关键词 创伤 机器学习 检伤分类 预测模型 急救医学
下载PDF
利用基因组标记和机器学习算法对中国牛品种的分类准确性研究
6
作者 梁卉 王雪 +1 位作者 司敬方 张毅 《遗传》 CAS CSCD 北大核心 2024年第7期530-539,共10页
品种分类是畜禽品种遗传资源保护和利用的基础,传统分类方法主要依赖于体型外貌特征判断,但因分类指标不易量化,故难以区分相似度较高的品种。机器学习算法在利用基因组信息进行品种分类方面显示出独特优势。为了探索最适合于中国牛品... 品种分类是畜禽品种遗传资源保护和利用的基础,传统分类方法主要依赖于体型外貌特征判断,但因分类指标不易量化,故难以区分相似度较高的品种。机器学习算法在利用基因组信息进行品种分类方面显示出独特优势。为了探索最适合于中国牛品种的分类方法,本研究使用7个地方品种共213头牛的基因组SNP数据,对比了F_(ST)值排序筛选、mRMR、Relief-F三种SNP选择方法和随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、朴素贝叶斯(Naive Byes,NB)三种不同机器学习算法对品种分类准确性的影响。结果表明:1)使用F_(ST)方法筛选1500个以上SNP,或使用mRMR算法筛选1000个以上SNP,SVM分类算法可以达到99.47%以上的分类准确率;2)分类效果最好的算法是SVM算法,其次是NB算法,而最好的SNP选择方法是F_(ST)和mRMR算法,其次是Relief-F;3)品种错误归类情况常出现在相似性较高的品种间。本研究显示机器学习分类模型结合基因组数据是对牛地方品种鉴别的有效方法,为我国牛品种的快速准确分类提供了技术依据。 展开更多
关键词 机器学习 品种分类 特征选择 支持向量机 F_(ST)
下载PDF
基于机器学习的甜味剂分类预测模型研究进展
7
作者 林凡超 徐守江 《中国食品添加剂》 CAS 2024年第1期287-295,共9页
甜味剂是一种赋予食品以甜味的物质,可分为天然甜味剂和人工合成甜味剂。在甜味剂开发过程中,基于机器学习的甜味剂分类预测模型可从大量的天然或合成分子中有效筛选出甜味剂分子,显著减少时间和资金成本。为了深入分析基于机器学习技... 甜味剂是一种赋予食品以甜味的物质,可分为天然甜味剂和人工合成甜味剂。在甜味剂开发过程中,基于机器学习的甜味剂分类预测模型可从大量的天然或合成分子中有效筛选出甜味剂分子,显著减少时间和资金成本。为了深入分析基于机器学习技术来驱动甜味剂研究发展的潜力与方向,本文从甜味剂分子表征数据集与机器学习技术相结合的新视角入手,分别从传统机器学习技术的甜味剂分类、深度学习技术的甜味剂分类和机器学习技术的甜度预测等方面总结与概括机器学习技术在甜味剂分类与预测中的最新研究成果。最后总结分析了食品甜味剂智能分类预测模型的发展趋势,如融合多模态分子表征数据形式的机器学习方法研究、多味型智能分类方法研究和不同规模数据集下深度学习方法研究。 展开更多
关键词 甜味剂 机器学习 深度学习 分类 预测
下载PDF
基于SDGSAT-1 TIS的机器学习算法岩性分类
8
作者 张昭 刘磊 《地质论评》 CAS CSCD 北大核心 2024年第S01期351-352,共2页
造岩矿物在热红外(TIR)大气窗口(7~14μm)中显示出特定的光谱特征为利用TIR影像进行岩性分类提供了理论基础(代晶晶等,2020)。然而,传统TIR遥感岩性分类数据源有限,且常用的基于光谱相似性和光谱特征的方法很难对类似的岩石类型进行分类... 造岩矿物在热红外(TIR)大气窗口(7~14μm)中显示出特定的光谱特征为利用TIR影像进行岩性分类提供了理论基础(代晶晶等,2020)。然而,传统TIR遥感岩性分类数据源有限,且常用的基于光谱相似性和光谱特征的方法很难对类似的岩石类型进行分类,光谱吸收位置特征很容易受到矿物复杂化学成分的影响。2021年发射的可持续发展科学卫星1号(SDGSAT-1)在TIR区域具有3个波段. 展开更多
关键词 热红外影像 机器学习算法(MLAs) 岩性分类
下载PDF
基于机器学习的深海多金属结核成因分类
9
作者 尹浩文 成秋明 《科学技术与工程》 北大核心 2024年第25期10605-10619,共15页
铁锰结核广泛分布于深海平原,储量巨大,具有商业开采潜力。利用1128个铁锰结核样本的地球化学数据和8种地质与海洋要素,采用随机森林机器学习方法,探讨结核成因分类。首先,基于Mn、Fe、Cu、Co、Ni、Mn/Fe和Fe/Co地球化学数据使用高斯混... 铁锰结核广泛分布于深海平原,储量巨大,具有商业开采潜力。利用1128个铁锰结核样本的地球化学数据和8种地质与海洋要素,采用随机森林机器学习方法,探讨结核成因分类。首先,基于Mn、Fe、Cu、Co、Ni、Mn/Fe和Fe/Co地球化学数据使用高斯混合模型聚类方法对1128个样本进行成因分类,并作为训练数据。其次,基于海底沉积速率、海水底部溶氧量和海水表面生物初级生产力等地质-海洋特征建立预测模型,将结核划分为水成型、成岩型和混合型,结果显示,模型对水成型和成岩型结核的分类精度分别为91%和66%,对混合型的分类精度较低,仅为23%。应用该模型对全球4119个铁锰结核进行成因分类,结果表明,水成型结核占71.8%,混合型占21.8%,成岩型占6.2%。水成型结核广泛分布于各大洋,而成岩型和混合型则集中在大洋中纬度地区,如东太平洋的克拉里昂-克里帕顿断裂带和东南太平洋的秘鲁海盆等。这些地区的沉积物速率、海底生物量和含氧量显著影响结核分布。尽管基于地球化学数据的分类方法更可靠,研究表明,利用地质和海洋要素及机器学习方法也可有效分类。 展开更多
关键词 海洋矿产资源 铁锰结核 成因分类 空间分布 机器学习
下载PDF
机器学习在地震事件自动分类中的应用
10
作者 刘甜甜 王禄军 张晖 《华北地震科学》 2024年第3期96-101,共6页
使用地震事件分类识别软件(SERS)对内蒙古地震台网2019—2022年编报的内蒙古东部地区20次分类存疑的地震事件进行类型识别,模型识别率为90.4%;通过对比其与人工编目结果发现,只有3次事件识别为天然地震,概率较低。对这3次地震事件记录... 使用地震事件分类识别软件(SERS)对内蒙古地震台网2019—2022年编报的内蒙古东部地区20次分类存疑的地震事件进行类型识别,模型识别率为90.4%;通过对比其与人工编目结果发现,只有3次事件识别为天然地震,概率较低。对这3次地震事件记录数据的振幅比和时频分析结果表明,震中距较近台站的波形记录具有明显的P波振幅大、能量高的特点,结合研究内蒙古东部地区地质构造及场地响应的相关文献,推测这些地震事件分类识别主要受场地影响,存在场地放大效应。 展开更多
关键词 机器学习 地震事件自动分类 SERS 场地放大效应
下载PDF
基于机器学习分类算法解析EIS数据的有机涂层性能评价方法
11
作者 纪皓迪 马小兵 《装备环境工程》 CAS 2024年第5期142-149,共8页
目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过... 目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过对比支持向量机(SVM)、k最近邻(k-NN)和随机森林(RF)3种不同的机器学习算法,以及多种输入特征集训练的涂层性能分类器模型的准确率,分析最适合用于涂层性能快速评估的机器学习算法和电化学特征。结果根据不同输入特征训练的k-NN和RF模型均表现出良好的预测效果,而SVM模型的预测效果相对较差。根据不同频率范围训练的分类器模型中,在低频区表现最佳,而在高频区表现较差。结论基于阻抗虚部、虚部+实部和阻抗模值3种输入特征训练的RF分类器模型的预测效果最准确。不同频率区间内,低频区的阻抗特征更能准确表征涂层性能。 展开更多
关键词 有机涂层 分类算法 机器学习 电化学阻抗谱 支持向量机 k最近邻 随机森林
下载PDF
基于机器学习的PCB缺陷检测与分类方法研究 被引量:1
12
作者 李娟 《印制电路信息》 2024年第3期57-59,共3页
印制电路板(PCB)在制造过程中难免会产生各种缺陷。为了提高生产效率和产品质量,针对PCB制造中常见的缺陷进行检测与分类。通过构建深度学习模型,采用图像处理技术,对PCB图像进行全面而高效的缺陷检测。通过大量的训练数据,模型能够学... 印制电路板(PCB)在制造过程中难免会产生各种缺陷。为了提高生产效率和产品质量,针对PCB制造中常见的缺陷进行检测与分类。通过构建深度学习模型,采用图像处理技术,对PCB图像进行全面而高效的缺陷检测。通过大量的训练数据,模型能够学习各类缺陷的特征,包括但不限于短路、断路、焊接不良等。使用举例说明和推导论证等方法对PCB缺陷进行分类研究,在深度学习模型的巧妙构建和分类算法的优化应用相辅相成的应用基础上,为提高生产效率和产品质量提供了可行的解决方案,推动了PCB制造业智能化方向的发展。 展开更多
关键词 机器学习 PCB缺陷检测 深度学习 分类算法
下载PDF
基于机器学习算法的数据分类与标准化方法研究 被引量:1
13
作者 张豹 《信息与电脑》 2024年第6期53-55,共3页
机器学习算法利用数学和统计学方法从大量数据中学习和提取有用信息,能够为决策提供支持。数据分类旨在将数据分组到预定义的类别中,而标准化方法则涉及对数据进行格式化和规范化处理,以提高算法的效率和准确性。为增强机器学习在数据... 机器学习算法利用数学和统计学方法从大量数据中学习和提取有用信息,能够为决策提供支持。数据分类旨在将数据分组到预定义的类别中,而标准化方法则涉及对数据进行格式化和规范化处理,以提高算法的效率和准确性。为增强机器学习在数据处理中的有效性和一致性,文章深入探讨了基于机器学习算法的数据分类与标准化方法。 展开更多
关键词 数据分类 机器学习算法 标准化 数据处理
下载PDF
基于机器学习的前列腺肿瘤患者分类预测研究
14
作者 李佳林 侯利明 黄俊 《现代信息科技》 2024年第17期73-77,共5页
针对临床中不能实时高效筛查前列腺患者并进行分类的难题,构建了基于BP神经网络、随机森林(RF)算法、径向基函数(RBF)和卷积神经网络(CNN)的4种机器学习模型,以快速鉴别不同类型的前列腺患者。利用参数和交叉验证不断优化模型,同时采用... 针对临床中不能实时高效筛查前列腺患者并进行分类的难题,构建了基于BP神经网络、随机森林(RF)算法、径向基函数(RBF)和卷积神经网络(CNN)的4种机器学习模型,以快速鉴别不同类型的前列腺患者。利用参数和交叉验证不断优化模型,同时采用准确率、精确率、召回率和两者的调和平均值4个指标来评价模型性能。结果发现,BP神经网络、RF算法、RBF和CNN的准确率分别为0.930、0.965、0.877、0.982,说明4种方法都能较好地完成对前列腺患者的分类预测,其中CNN分类预测效果最好,可以为前列腺癌的早期临床筛查提供参考。 展开更多
关键词 前列腺增生 前列腺腺癌 机器学习 分类预测 混淆矩阵
下载PDF
机器学习参与山区村落影像点云分类的研究
15
作者 李霞 杨正维 +2 位作者 黄俊伟 杨亚复 高莎 《激光技术》 CAS CSCD 北大核心 2024年第2期288-294,共7页
为了利用点云技术更好地获取地表信息,用无人机AA1300的内置光学镜头采集影像数据,构建2-D的数字正射影像地图(DOM),悬挂GS-1350N镜头采集3-D的激光雷达点云;通过k最近邻法(KNN)、支持向量机法(SVM)和随机森林法(RF)来实现DOM分类,用定... 为了利用点云技术更好地获取地表信息,用无人机AA1300的内置光学镜头采集影像数据,构建2-D的数字正射影像地图(DOM),悬挂GS-1350N镜头采集3-D的激光雷达点云;通过k最近邻法(KNN)、支持向量机法(SVM)和随机森林法(RF)来实现DOM分类,用定量分析中精度高的方法分类3-D点云,并进行了2-D和3-D的分类映射对比分析。结果表明,2-D的DOM分类中,相对于KNN和SVM,RF的kappa系数分别高3.74%和2.16%,全局精度分别高4.04%和2.88%;2-D的分类结果通过直接线性变换到3-D点云中,可实现2-D和3-D的点云分类,映射精度达94.15%;而在相同条件下,相对于2-D/3-D点云映射,直接3-D点云分类能更完整地呈现地物信息。3-D点云的精准分类对获取地表信息是有帮助的。 展开更多
关键词 激光技术 图像处理 机器学习 随机森林分类 高原山区乡村
下载PDF
基于不同机器学习算法的无人机高光谱影像树种分类研究
16
作者 刘康康 钟浩 林文树 《森林工程》 北大核心 2024年第4期98-108,共11页
机载高光谱数据能够反映树种光谱特征,可以对森林树种进行精确分类。应用不同机器学习分类算法对无人机高光谱影像进行树种分类研究。首先利用无人机完成黑龙江省帽儿山实验林场研究区的高光谱数据采集,对获取数据进行一系列预处理;然... 机载高光谱数据能够反映树种光谱特征,可以对森林树种进行精确分类。应用不同机器学习分类算法对无人机高光谱影像进行树种分类研究。首先利用无人机完成黑龙江省帽儿山实验林场研究区的高光谱数据采集,对获取数据进行一系列预处理;然后分别利用基于高斯核的支持向量机、随机森林、K-近邻3种不同机器学习分类算法建立基于全波段高光谱数据的树种分类模型,并基于不同波段选择方法(连续投影算法、竞争性自适应重加权法以及无信息变量消除法)对全波段高光谱数据降维后再进行树种分类模型构建;最后联合不同波段选择方法与高光谱图像纹理特征构建树种分类模型,并对不同处理方法结果进行比较。研究表明,对于全波段高光谱数据的树种分类模型中,基于高斯核的支持向量机分类准确率最高(87.55%)。不同波段选择后,随机森林稳定性是3种分类算法中最好的,准确率较高,而基于高斯核的支持向量机分类准确率随着特征维度的增加而提升。基于灰度共生矩阵提取纹理特征后结合波段选择建立的树种分类模型准确率高于单一的波段选择建立的模型,尤其是K-近邻分类算法的提升最大,说明具有明显划分的特征进行其建模可达到较好分类效果。该研究利用不同特征选择方式结合3种不同的机器学习分类算法实现了基于高光谱数据的优势树种分类,为波段选择方式与机器学习算法结合提供了技术参考,也对基于无人机高光谱数据的森林生物量反演和碳储量估测研究具有重要意义。 展开更多
关键词 无人机 高光谱 特征提取 机器学习 树种分类
下载PDF
基于机器学习的矿床描述文本多标签分类
17
作者 赵锴 叶丹 《中国矿业》 北大核心 2024年第10期153-161,共9页
为实现高效准确的矿床描述文本多标签分类,降低从大量文本中获取细粒度知识的难度,需要构建有针对性的标注数据集和机器学习模型。使用地理位置、成矿区带、矿体地质等17种内容标签,为《中国矿产地质志·典型矿床总述卷》中的13411... 为实现高效准确的矿床描述文本多标签分类,降低从大量文本中获取细粒度知识的难度,需要构建有针对性的标注数据集和机器学习模型。使用地理位置、成矿区带、矿体地质等17种内容标签,为《中国矿产地质志·典型矿床总述卷》中的13411个句子实施人工分类标注,构建了一个矿床描述文本多标签分类标注数据集。将多标签分类流程拆解为划分特征单元、文本向量化、分类计算三个步骤,在每个步骤分别采用不同方法,形成30种机器学习分类模型,在标注数据集上测试并比较了这些模型的分类性能。试验结果显示:微调BERT模型搭配FNN分类器时加权F1值可达到0.91,优于其他模型;TextCNN模型搭配K近邻分类器时加权F1值可达到0.80;TF-IDF词袋模型搭配FNN分类器时加权F1值可达到0.76;在其他步骤方法相同的情况下,按字符划分特征单元的模型加权F1值相对较高。基于微调BERT的机器学习模型可用于替代或辅助矿床描述文本多标签人工分类。使用TF-IDF词袋的机器学习模型可解释性较强,可用于优化人工分类方法。 展开更多
关键词 机器学习 自然语言处理 多标签分类 矿床学 知识工程
下载PDF
基于电子电离质谱数据和机器学习的新精神活性物质分类预测模型构建
18
作者 许情 吕敏 +3 位作者 邓虹霄 胡驰 向平 陈航 《质谱学报》 EI CAS CSCD 北大核心 2024年第5期640-646,共7页
新精神活性物质的结构变化快速,给基于标准物质和质谱数据库筛选和鉴定这些新物质带来了挑战。本研究使用机器学习方法为未知新精神活性物质的结构鉴定提供新策略。基于871个质谱数据集构建了最近邻、支持向量机、随机森林和人工神经网... 新精神活性物质的结构变化快速,给基于标准物质和质谱数据库筛选和鉴定这些新物质带来了挑战。本研究使用机器学习方法为未知新精神活性物质的结构鉴定提供新策略。基于871个质谱数据集构建了最近邻、支持向量机、随机森林和人工神经网络算法用于新精神活性物质的结构分类预测,采用5倍交叉验证的网格搜索对模型的超参数进行优化,使用混淆矩阵、准确度、精密度、召回率和f-分数评估4种分类预测模型的性能。结果表明,随机森林模型的预测能力最优,整体准确度可达89.27%,可以很好地对未知化合物结构类别进行预测,从而为未知化合物的结构鉴定提供依据。 展开更多
关键词 电子电离质谱(EI-MS) 新精神活性物质 机器学习 分类预测模型
下载PDF
基于机器学习的医疗器械分类与预测方法研究
19
作者 黄佳 刘翔宇 《科技创新与应用》 2024年第5期28-31,共4页
针对当前医疗器械分类仍然采用人工分类方式,费时费力的问题,提出一种基于机器学习的医疗器械分类与预测方法,通过引入机器学习和自然语言处理领域的经典算法,以新版《医疗器械分类目录》为标准,提取医疗器械产品注册证的关键信息作为... 针对当前医疗器械分类仍然采用人工分类方式,费时费力的问题,提出一种基于机器学习的医疗器械分类与预测方法,通过引入机器学习和自然语言处理领域的经典算法,以新版《医疗器械分类目录》为标准,提取医疗器械产品注册证的关键信息作为语料库,实现对医疗器械的产品类别划分,达到真正意义上的医疗器械自动分类,为各级医疗机构的医疗器械分类管理信息化奠定基础,提供借鉴和启示。 展开更多
关键词 医疗器械 机器学习 自动分类 分类管理 信息化
下载PDF
基于机器学习的中医体质分类研究
20
作者 潘康宁 王洪杰 +1 位作者 于霞 孙万晨 《中国医疗设备》 2024年第1期6-11,共6页
目的 采用随机森林的过滤式特征选择方法,筛选出最优特征子集后构建梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型,对平和体质与偏颇体质进行分类研究。方法 选取2756例受试者为研究对象,使用横断面调查法进行问卷调查。... 目的 采用随机森林的过滤式特征选择方法,筛选出最优特征子集后构建梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型,对平和体质与偏颇体质进行分类研究。方法 选取2756例受试者为研究对象,使用横断面调查法进行问卷调查。采集受试者十二经脉上24个原穴的穴位信号与身高、体重、年龄、性别等信息构建数据集。对数据集预处理后使用随机森林特征选择方法筛选最优特征子集;使用GBDT算法构建基于机器学习的平和-偏颇体质二分类研究;采用十折交叉验证计算准确度、精准度、召回率、F1得分,并综合评价模型性能。结果 筛选出22个特征构成最优特征子集,使用筛选后的特征子集构建的GBDT模型准确度、精准度、召回率、F1得分分别是92.86%、93.65%、93.08%、0.92。结论 随机森林的特征选择方法有助于筛选最优特征子集,GBDT可为中医体质分类研究提供帮助。 展开更多
关键词 机器学习 中医体质 特征选择 分类模型
下载PDF
上一页 1 2 83 下一页 到第
使用帮助 返回顶部