期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于Stacking集成学习的水稻表型组学实体分类研究 被引量:21
1
作者 袁培森 杨承林 +2 位作者 宋玉红 翟肇裕 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2019年第11期144-152,共9页
为研究整合水稻表型组学相关知识,系统地建立水稻表型组学知识图谱,通过分布式爬虫框架从国家水稻数据中心网站获取水稻表型组学数据集,并以互动百科为辅助数据源获取水稻表型组学数据。对水稻表型组学数据采用TF-IDF技术结合潜在语义... 为研究整合水稻表型组学相关知识,系统地建立水稻表型组学知识图谱,通过分布式爬虫框架从国家水稻数据中心网站获取水稻表型组学数据集,并以互动百科为辅助数据源获取水稻表型组学数据。对水稻表型组学数据采用TF-IDF技术结合潜在语义模型进行预处理,并对水稻表型组学实体进行人工分类和标注。为实现水稻表型组学实体分类,研究了基于堆叠式两阶段集成学习的分类器组合模型,结合K-近邻算法、支持向量机、随机森林、梯度提升决策树机器学习方法,提升水稻表型组学实体数据分类的性能。研究表明,基于堆叠式两阶段集成学习的分类器组合模型对不同类别的水稻表型组学数据都具有较好的多分类能力,对于不平衡的水稻表型组学数据集,本文方法的分类器组合模型对水稻表型组学数据分类效果最佳,Gene类别的F1为90.47%,总体准确率达80.55%,比支持向量机、K-近邻、随机森林和梯度提升决策树4种基分类器的分类准确率平均高6.78个百分点。 展开更多
关键词 水稻表型组学 实体分类 堆叠式集成学习 知识图谱 潜在语义模型
下载PDF
基于半监督主动学习的菊花表型分类研究 被引量:4
2
作者 袁培森 任守纲 +1 位作者 翟肇裕 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2018年第9期27-34,共8页
鉴于人工和专家分类模式的局限性,基于表型的菊花分类存在效率低下的问题。本文采用基于半监督主动学习技术,在已分类菊花数据的基础上,利用未标号菊花样本数据提供的信息,建立了菊花表型分类模型,提升了分类质量和效率。该模型可以不... 鉴于人工和专家分类模式的局限性,基于表型的菊花分类存在效率低下的问题。本文采用基于半监督主动学习技术,在已分类菊花数据的基础上,利用未标号菊花样本数据提供的信息,建立了菊花表型分类模型,提升了分类质量和效率。该模型可以不依赖外界交互,利用未标号样本来自动提升菊花分类的质量。为了训练学习模型,本文收集了菊花的表型特征数据,标注了菊花表型类别,并研究了菊花分类属性特征的编码技术。在此数据集上,采用基于图标号传播的半监督学习技术对未标号的菊花数据进行建模,为了提升半监督分类的有效性,在标号传播的基础上使用主动学习技术,采用熵最大策略来选择难以识别的样本,以改进分类质量。在该数据集上进行了试验验证,并进行了试验对比和分析,试验结果表明,本文方法能够较好地利用未标号菊花样本提升分类的精度,随着标号百分比从6.25%升至23%,识别精度达到0.7以上,标号百分比在81.25%时,平均识别精度和召回率分别达到0.91和0.88。 展开更多
关键词 菊花表型分类 半监督学习 图模型 one-hot编码 主动学习 熵最大化
下载PDF
基于GAN网络的菌菇表型数据生成研究 被引量:11
3
作者 袁培森 吴茂盛 +2 位作者 翟肇裕 杨承林 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2019年第12期231-239,共9页
生成式对抗网络是基于对抗过程生成数据模型的新框架,它能够生成高质量的图像数据,为解决小样本数据、非均衡数据分析等提供了行之有效的方法。菌菇作为重要的真菌之一,其种类繁多,数据长尾分布、非均衡性等为其表型智能化识别与分类带... 生成式对抗网络是基于对抗过程生成数据模型的新框架,它能够生成高质量的图像数据,为解决小样本数据、非均衡数据分析等提供了行之有效的方法。菌菇作为重要的真菌之一,其种类繁多,数据长尾分布、非均衡性等为其表型智能化识别与分类带来了困难。针对蘑菇表型数据,设计了一个高效的蘑菇表型生成式对抗网络MPGAN。研究了菌菇表型数据生成技术,设计了用于菌菇表型数据生成的生成式对抗网络结构,系统分为模型训练和表型图像生成两个模块。为了提升生成质量,使用Wasserstein距离和带有梯度惩罚的损失函数。利用开源数据和私有数据集测试学习率、处理所需的批次数EPOCH与Wasserstein距离。系统生成的菌菇表型数据为后期菌菇数据分类与识别提供了大数据基础。 展开更多
关键词 菌菇表型 生成式对抗网络 生成器 判别器 Wasserstein距离
下载PDF
基于SVC和过采样的类别非均衡农业高光谱数据分类 被引量:2
4
作者 袁培森 翟肇裕 +2 位作者 任守纲 顾兴健 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2019年第6期257-264,共8页
系统研究了农业高光谱数据中少数类的分类质量问题。为了提升少数类的分类质量,提出采用过采样SMOTE技术增加少数类新样本,同时研究了SMOTE技术中新样本生成策略和少数类采样倍率对高光谱数据中少数类分类结果的影响,以及不平衡数据集... 系统研究了农业高光谱数据中少数类的分类质量问题。为了提升少数类的分类质量,提出采用过采样SMOTE技术增加少数类新样本,同时研究了SMOTE技术中新样本生成策略和少数类采样倍率对高光谱数据中少数类分类结果的影响,以及不平衡数据集上分类器与模型的匹配度。在新的采样数据集上采用多类分类SVC技术对少数类分类,提升了非均衡高光谱数据集中少数类的分类质量。在真实数据集上进行了试验验证,并对不同的分类方法和系统参数进行了试验对比和分析,结果表明,本文方法能够显著地提高非均衡高光谱数据中少数类分类效果,平均分类精度不小于0.82,平均召回率提升幅度为11.11%~26.15%,F1提升幅度为5.81%~40.85%。 展开更多
关键词 高光谱数据分类 支持向量分类 过采样 非均衡数据 SMOTE
下载PDF
基于Multi-probe LSH的菊花花型相似性计算 被引量:2
5
作者 袁培森 翟肇裕 +1 位作者 钱淑韵 徐焕良 《农业机械学报》 EI CAS CSCD 北大核心 2019年第7期208-215,共8页
针对海量高维菊花图像相似性计算带来的挑战,研究了基于多探测局部位置敏感哈希技术的菊花表型相似性计算方法。针对菊花图像,采用SIFT技术提取菊花图像特征,并采用BoVW模型进行建模。由于图像特征的高维性质,海量的菊花表型相似性计算... 针对海量高维菊花图像相似性计算带来的挑战,研究了基于多探测局部位置敏感哈希技术的菊花表型相似性计算方法。针对菊花图像,采用SIFT技术提取菊花图像特征,并采用BoVW模型进行建模。由于图像特征的高维性质,海量的菊花表型相似性计算效率不高,为了提高计算效率,提出采用近似相似性技术中的多探测局部位置敏感哈希技术,用此方法构建菊花图像数据的哈希数据结构,在菊花相似性查询方面提高了计算效率,并确保了计算结果的质量。在菊花数据集上进行了计算效率和查询质量两方面的测试,并与典型的方法进行了试验对比和分析。结果表明,相比线性式扫描,平均查询成功概率达到0.90以上,平均加速比为3.3~19.8。本文方法能够在查询质量和计算效率两方面通过参数设置提供灵活的优化选择,并对参数的选择提供了参考范围,可为海量菊花花型相似性计算提供参考。 展开更多
关键词 菊花 花型 花型相似性 多探测 局部位置敏感哈希
下载PDF
基于无人机高通量植物表型大数据分析及应用研究综述 被引量:4
6
作者 袁培森 薛铭家 +2 位作者 熊迎军 翟肇裕 徐焕良 《农业大数据学报》 2021年第3期62-75,共14页
植物表型是指基因和环境因素决定或影响的作物物理、生理、生化特征和性状。准确和快速的获取植物在各种不同环境条件下的表型信息,从而挖掘其基因组的遗传和表现规律,可有效推动有关基因组与表型信息关联性研究。无人机高通量植物表型... 植物表型是指基因和环境因素决定或影响的作物物理、生理、生化特征和性状。准确和快速的获取植物在各种不同环境条件下的表型信息,从而挖掘其基因组的遗传和表现规律,可有效推动有关基因组与表型信息关联性研究。无人机高通量植物表型平台凭借无人机机动灵活的特点,适合于农作物田间环境中的植物表型数据获取,具有数据获取效率高和成本低等优势,借助于图像、高光谱、激光雷达等先进传感器技术,为高效获取各类植物表型数据提供了可行的途径;与此同时,快速发展的大数据技术和智能数据分析技术为无人机所获取的植物表型图像提供有效的分析处理方法和技术。在此背景下,基于无人机平台的高通量植物表型分析,为研究田间作物表型信息提供了重要的方法和工具。本文综述了国内外无人机高通量作物表型大数据分析的最新研究成果,就其研究原理、相关算法、过程、关键技术及应用等进行总结与分析,重点讨论了应用于无人机高通量植物表型大数据分析相关的大数据处理与智能分析技术,重点分析了植物株高获取、叶面积指数、植物病害等典型的表型分析需求,并就其应用前景进行了总结和展望。 展开更多
关键词 表型大数据 无人机 高通量 植物表型分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部