期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
GPR图像的数据集构建及其DRDU-Net去噪算法
1
作者 王惠琴 高大庆 +3 位作者 何永强 刘宾灿 王莹 曹明华 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期20-28,共9页
为了解决生成对抗网络(Generative Adversarial Network,GAN)在生成探地雷达(Ground Penetrating Radar,GPR)图像时存在训练不稳定的问题,提出利用带有梯度惩罚的Wasserstein距离生成对抗网络(WGAN-GP)生成GPR图像,并结合时域有限差分... 为了解决生成对抗网络(Generative Adversarial Network,GAN)在生成探地雷达(Ground Penetrating Radar,GPR)图像时存在训练不稳定的问题,提出利用带有梯度惩罚的Wasserstein距离生成对抗网络(WGAN-GP)生成GPR图像,并结合时域有限差分法和实地采集图像提出了一种构建GPR图像数据集的方法.相较于原始GAN与Wasserstein GAN等方法,WGAN-GP具有更好的稳定性,而且生成的GPR图像更接近真实图像.在此基础之上,将密集残差块和U-Net相结合提出了一种适合于GPR图像的密集残差去噪U-Net方法.该方法利用U-Net中编码-解码结构提高了GPR图像的去噪性能;同时,密集残差块的引入加强了GPR图像的特征复用,且使U-Net训练更加稳定.最后,利用仿真实验验证了所提去噪方法的性能,并与三维块匹配(BM3D)和U-Net方法进行了对比.结果表明:所提方法与BM3D以及U-Net去噪方法相比,具有更好的去噪效果.当σ等于20时,在模拟和实测数据上取平均值,其峰值信噪比分别提升了约6.5 dB和2.4 dB;结构相似性分别提升了约0.09和0.04. 展开更多
关键词 GPR数据集构建 GPR图像去噪 WGAN-GP 残差块
下载PDF
人工智能囊胚形态评估数据集构建与质控专家共识
2
作者 王浩 张孝东 +25 位作者 孙莹璞 孙海翔 邓成艳 黄学锋 刘平 周灿权 冯云 郝桂敏 卢文红 沈浣 师娟子 张松英 滕晓明 王晓红 王秀霞 伍琼芳 全松 曾勇 钟影 邵小光 柯林楠 毛歆 韩倩倩 黄国宁 中华医学会生殖医学分会第五届委员会 中国食品药品检定研究院 《生殖医学杂志》 CAS 2024年第7期843-851,共9页
囊胚形态人工智能(AI)评估是AI医疗器械发展的新兴方向,也是AI在辅助生殖领域的重要应用。AI在新领域应用的起步阶段,数据集的构建与质控对产品质量有重要影响。目前,囊胚形态学AI评估在数据采集、标注、质控等方面尚未形成统一的规范... 囊胚形态人工智能(AI)评估是AI医疗器械发展的新兴方向,也是AI在辅助生殖领域的重要应用。AI在新领域应用的起步阶段,数据集的构建与质控对产品质量有重要影响。目前,囊胚形态学AI评估在数据采集、标注、质控等方面尚未形成统一的规范。在参考AI医疗器械、辅助生殖医疗器械现有国家行业标准的基础上,本文以囊胚形态AI评估数据集为主题,对数据集构建与质控要求进行了探讨,对数据集质量特性进行了解析,旨在指导数据集制造责任方加强数据集全生命周期管理,更好地为产品研发、测试、临床试验等环节提供质量保障,助力产业发展。 展开更多
关键词 人工智能(AI) 囊胚形态评估 数据集构建 数据标注 数据质量控制
下载PDF
深度学习道路标线提取数据集构建及评估
3
作者 唐先祥 何银鑫 朱运权 《测绘》 2024年第4期152-157,共6页
道路标线的准确提取在高级辅助驾驶系统和高精度地图的开发中具有重要意义。基于深度学习的方法强烈依赖于高质量的训练样本数据集,因此本文根据工程项目需要并在分析道路标线特征信息的基础上,提出了一种深度学习道路标线提取数据集的... 道路标线的准确提取在高级辅助驾驶系统和高精度地图的开发中具有重要意义。基于深度学习的方法强烈依赖于高质量的训练样本数据集,因此本文根据工程项目需要并在分析道路标线特征信息的基础上,提出了一种深度学习道路标线提取数据集的构建方法。该方法选用车载激光点云数据,并对点云进行预处理操作,将预处理后得到的点云转换为强度特征图像,然后根据道路标线相关规范,结合原始车载激光点云数据中所涉及的标线进行道路标线信息标注,并研究了数据分块与划分和数据增强与归一化的方法。实验结果表明,本文研究的构建方法是可行的,可为道路标线相关提取工作提供参考。 展开更多
关键词 车载激光点云 深度学习 道路标线提取 数据集构建
下载PDF
多模态语言舆情数据集构建与识别方法
4
作者 吕学强 董良 +1 位作者 滕尚志 张乐 《北京信息科技大学学报(自然科学版)》 2023年第5期1-9,共9页
针对现有语言舆情领域缺乏研究数据集的问题,通过构建语言舆情信息源库,确立了语言舆情的信息来源和范围,并对其中包含的微博数据进行采集,以构建多模态语言舆情数据集。进一步提出了一种基于多模态融合的语言舆情识别方法,通过注意力... 针对现有语言舆情领域缺乏研究数据集的问题,通过构建语言舆情信息源库,确立了语言舆情的信息来源和范围,并对其中包含的微博数据进行采集,以构建多模态语言舆情数据集。进一步提出了一种基于多模态融合的语言舆情识别方法,通过注意力机制增强单模态特征,并学习不同模态特征之间的依赖关系,以生成细粒度的多模态表示。实验结果表明,本文方法在准确率上优于现有的多模态分类方法,可有效识别出语言舆情信息。 展开更多
关键词 语言舆情 数据集构建 注意力机制 多模态融合 舆情识别
下载PDF
基于胶质瘤图像的原始数据集构建及应用 被引量:1
5
作者 于永成 姜雨萌 方玲玲 《计算机系统应用》 2023年第1期368-375,共8页
胶质瘤是在世界范围内致死率排行比较靠前的几种肿瘤之一,是一种死亡率高、容易复发,对身体危害极大的恶性疾病.目前,核磁共振成像(magnetic resonance imaging,MRI)技术因其成像效果清晰,不同软组织之间对比鲜明等特点,现已成为诊断患... 胶质瘤是在世界范围内致死率排行比较靠前的几种肿瘤之一,是一种死亡率高、容易复发,对身体危害极大的恶性疾病.目前,核磁共振成像(magnetic resonance imaging,MRI)技术因其成像效果清晰,不同软组织之间对比鲜明等特点,现已成为诊断患者胶质瘤较为常用的一种医学手段.基于胶质瘤原始数据集缺少这一情况,与辽宁省肿瘤医院合作,对该医院300名胶质瘤患者MRI图像进行分析,通过病变判定、病变定位和病变定性3个步骤对原始数据进行分类并进一步分级,建立胶质瘤原始数据集.为了证明其后续应用性,通过分析和实验,证明原始数据集可被用于图像分类及分割,并为肿瘤的生长与重建提供图像数据,对胶质瘤的临床研究和应用给予充分的帮助. 展开更多
关键词 原始数据 胶质瘤 病变判定 病变定位 病变定性 数据集构建
下载PDF
高校学业文本命名实体识别及数据集构建研究
6
作者 何晨 苑迎春 +1 位作者 王克俭 陶佳 《计算机工程与应用》 CSCD 北大核心 2023年第22期322-328,共7页
近年来,我国高校因学业问题无法顺利毕业的学生数量逐年上升,给高校教学管理工作带来极大压力。利用知识图谱技术快速自动解答学业困惑成为亟待解决的重要问题。实体精准识别可有效提取学业管理文本中的关键信息,但该领域尚未存在公开... 近年来,我国高校因学业问题无法顺利毕业的学生数量逐年上升,给高校教学管理工作带来极大压力。利用知识图谱技术快速自动解答学业困惑成为亟待解决的重要问题。实体精准识别可有效提取学业管理文本中的关键信息,但该领域尚未存在公开适用的标注数据集,因此开展面向具有普遍性和通识性的高校学业命名实体识别数据集变得极为迫切。依据学业管理专家的领域知识,对某高校13万余字学业文本制定了8类学业数据构建标准,并根据构建标准以及文本特性完成了标注工作。将BiLSTM-CRF等4种识别模型在公开数据集和构建数据集上进行实验测试,结果表明构建的数据集可以应用于高校学业领域的命名实体识别任务,构建方法具有普适性,而且分类标注后的数据集识别效果相较未分类数据集有明显提升,进一步验证了该分类标准的有效性。 展开更多
关键词 高校学业 命名实体识别 数据集构建 实体标注 BiLSTM-CRF
下载PDF
糖尿病健康管理对话数据集构建
7
作者 汪正康 刘阳 +2 位作者 杨锦锋 梁先桂 郭熙铜 《中文信息学报》 CSCD 北大核心 2023年第9期23-37,共15页
我国是全球糖尿病患病人数最多的国家,患病人数仍在持续快速增长,糖尿病已成为我国重大公共卫生问题。该文关注的糖尿病健康管理对话系统服务于糖尿病患者,为患者解答日常生活中糖尿病相关问题,而目前缺乏用于训练对话系统模型的糖尿病... 我国是全球糖尿病患病人数最多的国家,患病人数仍在持续快速增长,糖尿病已成为我国重大公共卫生问题。该文关注的糖尿病健康管理对话系统服务于糖尿病患者,为患者解答日常生活中糖尿病相关问题,而目前缺乏用于训练对话系统模型的糖尿病相关数据。基于此,该文构建了首个标注体系完整的糖尿病健康管理中文对话数据集“Diachat”,以支持健康管理对话系统研究。Diachat收集了来自线上聊天平台糖尿病患者与医生的693段对话(Dialogue),共4686句语料(Sentence),完成了6594条对话动作(Dialogue act)标注。Diachat数据集采用基于对话动作的表示方式进行意图表示并定义了15个对话动作标签(Act label)。同时,Diachat定义了6个领域(Domain)涵盖语料涉及的领域,分别为:问题(Problem)、饮食(Diet)、行为(Behavior)、运动(Sport)、治疗(Treatment)、基本信息(Profile)。为了支持构建完整的对话系统,Diachat为用户端和系统端分别构造了对话状态,并为每段对话构造了对话目标。基于Diachat数据集,该课题进行了管道(Pipeline)体系的对话系统四个模块的基本实现。实验结果显示,Diachat数据集能够支持糖尿病健康管理对话系统构建,各模块仍有较大提升空间。 展开更多
关键词 对话系统 数据集构建 语料标注 糖尿病健康管理
下载PDF
用于辅助中医辨证的居家健康软硬件集成系统的家电数据集构建
8
作者 杨启城 石文鹏 +1 位作者 周一博 温川飙 《家电科技》 2023年第6期16-21,共6页
为中医居家健康场景下中医理论和家电的融合提供数据采集标准,通过在广东省新黄埔中医药联合创新研究院居家健康中心搭建居家健康套房,基于套房采集的数据进行中医居家健康家电数据元、数据集的定义,建立编码规则并对两者进行编码。搭... 为中医居家健康场景下中医理论和家电的融合提供数据采集标准,通过在广东省新黄埔中医药联合创新研究院居家健康中心搭建居家健康套房,基于套房采集的数据进行中医居家健康家电数据元、数据集的定义,建立编码规则并对两者进行编码。搭建居家健康家电数据集可以将家电厂商物联网生态与中医理论相结合,为中医和家电领域的交叉融合提供合作基础。居家健康家电数据集的构建可以给健康数据提供更好的一致性、可靠性和持续性,同时也能为家电数据与医学理论的结合提供保障。 展开更多
关键词 居家健康 智能家电 数据 数据集构建
下载PDF
交叉学科文献数据集构建探讨——以海洋学科为例 被引量:1
9
作者 苏菊 冯劭华 彭顺苓 《情报探索》 2018年第2期123-129,共7页
[目的/意义]以海洋学科为例,提出一种通过主题、学科结合权威研究机构发文量来选定期刊再构建数据集的方法。[方法/过程]方法先从"全"角度出发,通过主题筛选海洋研究的相关文献,结果显示除传统认为的"海洋"类学科外... [目的/意义]以海洋学科为例,提出一种通过主题、学科结合权威研究机构发文量来选定期刊再构建数据集的方法。[方法/过程]方法先从"全"角度出发,通过主题筛选海洋研究的相关文献,结果显示除传统认为的"海洋"类学科外,有大量的相关文献交叉涵盖在地质、环境等学科分类中,但也存在部分杂质;其次从"准"角度精选,以主题检索文献所在的期刊为基础,利用权威机构在这些期刊中的发文量筛选出132种"涉海"期刊,其结果既包含了海洋类期刊,也包含了综合性及交叉学科期刊;最后以学科分类中的海洋类期刊、主题、机构精选的"涉海"期刊,检索并收录其中的海洋类文献,并作为最终的数据集,经验证数据集中的海洋相关文献率达到93.5%。[结果/结论]本文采用的这种从"涉海"期刊入手的方法既保留了数据库已有的"海洋类"期刊,也合理考虑到海洋分类以外的大量重要"涉海"综合性期刊,在一定程度上解决了交叉学科文献数据集构建中难以"全"而"准"的问题。 展开更多
关键词 文献计量 数据集构建 海洋学科 交叉学科
下载PDF
基于角度内插仿真的飞机目标多角度SAR数据集构建方法研究 被引量:3
10
作者 王汝意 张汉卿 +5 位作者 韩冰 张月婷 郭嘉逸 洪文 孙巍 胡文龙 《雷达学报(中英文)》 EI CSCD 北大核心 2022年第4期637-651,共15页
随着SAR技术应用领域的扩大以及SAR数据获取技术的发展,构建各种典型目标的多角度SAR数据集的需求日益迫切。针对飞机目标,目前尚未有比较完备的多角度SAR图像数据集。该文探索了一种基于实测数据和智能仿真相结合的数据集构建方法,通... 随着SAR技术应用领域的扩大以及SAR数据获取技术的发展,构建各种典型目标的多角度SAR数据集的需求日益迫切。针对飞机目标,目前尚未有比较完备的多角度SAR图像数据集。该文探索了一种基于实测数据和智能仿真相结合的数据集构建方法,通过飞行试验采集飞机目标SAR多角度数据,并基于散射分析和自注意力生成对抗网络实现特定角度的SAR图像内插仿真,从而为数据集构建和扩容提供新的解决方案。最后,在假定部分数据缺失的情况下,通过6种评价指标对仿真图像和实际采集图像的相似度进行了评价,验证了所提方法的有效性。 展开更多
关键词 数据集构建 飞机目标 图像仿真 生成对抗网络 自注意力
下载PDF
人工智能医疗器械标准数据集构建现状 被引量:9
11
作者 张丽鑫 钱庆 +2 位作者 唐明坤 周佳茵 吴思竹 《中华医学图书情报杂志》 CAS 2021年第8期1-8,共8页
采用文献调查法和内容分析法对标准数据集的构建现状进行了总结,明确了标准数据集的概念和特点,分析了目前国内外标准数据集构建的相关政策规范,从标准数据集构建流程与管理要素2方面梳理了构建工作的重点,提出了解决标准数据集构建存... 采用文献调查法和内容分析法对标准数据集的构建现状进行了总结,明确了标准数据集的概念和特点,分析了目前国内外标准数据集构建的相关政策规范,从标准数据集构建流程与管理要素2方面梳理了构建工作的重点,提出了解决标准数据集构建存在问题的措施,为人工智能医疗器械标准数据集构建工作的进一步发展提供有益借鉴。 展开更多
关键词 人工智能医疗器械 标准数据集构建 管理要素 构建流程
下载PDF
三维模板跟踪的基准合成数据集构建及算法评估 被引量:4
12
作者 何弦 李佳宸 +3 位作者 金立 刘力 钟凡 秦学英 《计算机学报》 EI CAS CSCD 北大核心 2022年第3期585-600,共16页
三维模板跟踪旨在将预先构建的三维CAD模型与输入图像中的相应目标进行精确配准,在增强现实、机器人等领域具有重要的应用,也是计算机视觉领域的关键问题之一.近年来,三维模板跟踪的准确率和稳定性都得到了持续提升,但仅有少量的工作关... 三维模板跟踪旨在将预先构建的三维CAD模型与输入图像中的相应目标进行精确配准,在增强现实、机器人等领域具有重要的应用,也是计算机视觉领域的关键问题之一.近年来,三维模板跟踪的准确率和稳定性都得到了持续提升,但仅有少量的工作关注三维模板跟踪数据集的构建.随着深度学习的普及,各领域中大规模数据集的构建越来越被重视,为算法的训练、测试和评估奠定了基础,极大地推动了相关领域的发展.以往的三维模板跟踪数据集大多存在规模有限,画面不够自然、真实,多样性不足等问题.基于此,本文创建了一个大规模的基于真实感渲染的三维模板跟踪数据集(Render Dataset for Object Tracking,简称RDOT),其包含多种不同结构和材质的物体、复杂的运动模式,并且在场景、光照、噪声、运动模糊和遮挡等方面有丰富细致的设置,是目前三维模板跟踪领域最大的数据集,满足三维模板跟踪算法评估的各种需求.针对现有三维模板跟踪算法测评时使用的数据集不统一,测评结果难以客观全面地反映算法性能的问题,本文基于所构建的数据集,利用平均边缘距离、平均表面距离和重初始化率三种度量标准全面评估了目前主流的三维模板跟踪算法,并对评测结果进行了深入的分析讨论,给出了全面的分析报告和技术展望.此外,基于所构建的数据集,本文提出了对跟踪结果建立误差分析模型,并对结果进行校正的方法,有效改善了三维模版跟踪算法的准确率. 展开更多
关键词 三维模板跟踪 数据集构建 算法测评 增强现实 真实感渲染
下载PDF
产品制造过程质量数据集构建流程与方法 被引量:2
13
作者 栗仕强 臧阳阳 +1 位作者 梁昭磊 汪启华 《制造业自动化》 CSCD 北大核心 2022年第7期46-49,共4页
制造质量数据是产品缺陷及薄弱环节识别、质量管控和评价、质量改进的基础,随着质量管理向模型化、定量化方向发展,构建完善、合理的产品制造过程质量数据集成为人们关注的重点。针对目前质量数据收集不完整、存储分散以及可利用性低的... 制造质量数据是产品缺陷及薄弱环节识别、质量管控和评价、质量改进的基础,随着质量管理向模型化、定量化方向发展,构建完善、合理的产品制造过程质量数据集成为人们关注的重点。针对目前质量数据收集不完整、存储分散以及可利用性低的问题,提出了一套制造过程产品质量数据集构建流程方法,结合“5M1E”分析质量数据来源,从过程维度、质量影响因素维度、数据存储维度形成质量数据集的组成要素;通过分析质量数据的采集方法,提出了质量数据异常值处理和可信度检验方法;继而开展了制造过程因素间的关联关系和制造过程因素与产品质量特性的映射关系;最后提出了质量数据集管理平台的搭建方案,并在某高精度航空产品装配过程中进行应用。 展开更多
关键词 制造质量 数据集构建 数据 数据管理平台
下载PDF
SAR图像舰船目标检测数据集构建研究综述 被引量:4
14
作者 黄琼男 朱卫纲 李永刚 《电讯技术》 北大核心 2021年第11期1451-1458,共8页
算法和数据是影响深度学习技术发展的两大关键因素,大多数学者专注于算法的改进和开拓,仅有少部分学者致力于数据的研究。构建合成孔径雷达(Synthetic Aperture Radar,SAR)图像舰船数据集是SAR舰船目标检测项目的第一步,也是星载SAR图... 算法和数据是影响深度学习技术发展的两大关键因素,大多数学者专注于算法的改进和开拓,仅有少部分学者致力于数据的研究。构建合成孔径雷达(Synthetic Aperture Radar,SAR)图像舰船数据集是SAR舰船目标检测项目的第一步,也是星载SAR图像实际工程应用的基础。分析了影响SAR舰船目标检测性能的关键因素,阐述了SAR舰船数据集的构建方法,概述了TerraSAR-X、“哨兵”1号(Sentinel-1)和高分三号(GF-3)三种SAR图像数据源,并对几种公开的SAR舰船数据集进行梳理与分析,总结了各数据集的发展历程,最后指出构建SAR图像舰船数据集仍需考虑的几个方面。 展开更多
关键词 合成孔径雷达 目标检测 舰船图像 深度学习 数据集构建 数据
下载PDF
基于3D Studio Max的海地瓜数据集构建方法
15
作者 王颖 《信息与电脑》 2021年第5期44-46,共3页
为了给海地瓜识别工作提供数据参考,解决传统数据集构建中存在的数据重复率高的问题,笔者提出基于3D Studio Max的海地瓜数据集构建方法。该方法首先利用硬件设备采集海地瓜的三维数据,并对初始数据进行降噪和去重处理,然后构建海地瓜模... 为了给海地瓜识别工作提供数据参考,解决传统数据集构建中存在的数据重复率高的问题,笔者提出基于3D Studio Max的海地瓜数据集构建方法。该方法首先利用硬件设备采集海地瓜的三维数据,并对初始数据进行降噪和去重处理,然后构建海地瓜模型,最后以海地瓜模型为数据内容进行分类存储,实现海地瓜数据集的构建。实验结果表明:该方法的数据重复率降低了5.43%,能够有效提升识别的速度。 展开更多
关键词 3D Studio Max 海地瓜数据 数据集构建 分类存储
下载PDF
医学影像人工智能技术发展促进肺结节检测:《胸部X线(正位)肺结节数据集构建与质量控制专家共识》发布
16
《中华医学信息导报》 2024年第9期6-6,共1页
《中华放射学杂志》2024年第4期发表了由中华医学会放射学分会、中国食品药品检定研究院制定的《胸部X线(正位)肺结节数据集构建与质量控制专家共识》(以下简称《共识》),旨在为胸部X线(正位)肺结节数据的采集、标注以及质量控制提供指... 《中华放射学杂志》2024年第4期发表了由中华医学会放射学分会、中国食品药品检定研究院制定的《胸部X线(正位)肺结节数据集构建与质量控制专家共识》(以下简称《共识》),旨在为胸部X线(正位)肺结节数据的采集、标注以及质量控制提供指导意见,促进胸部X线(正位)肺结节标准化标注数据集的建设,为人工智能算法和产品的训练、调优和测试提供重要的依据,从而推动医学影像人工智能技术的快速发展以及进一步实现临床应用。 展开更多
关键词 人工智能技术 肺结节 医学影像 标注数据 人工智能算法 数据集构建 数据的采 标准化
原文传递
基于期刊主题相似性的领域分析数据集构建:方法与实证 被引量:9
17
作者 刘敏娟 张学福 +1 位作者 颜蕴 陈露 《图书情报工作》 CSSCI 北大核心 2016年第10期115-122,共8页
[目的/意义]重点针对一些在数据库中无法找到既定的主题分类,无法罗列完整关键词,也不可能通过选择有代表性机构和现成的学科领域核心期刊的方法实现数据集构建的领域,提出一种基于期刊主题相似性的领域分析数据集构建的方法。[方法/过... [目的/意义]重点针对一些在数据库中无法找到既定的主题分类,无法罗列完整关键词,也不可能通过选择有代表性机构和现成的学科领域核心期刊的方法实现数据集构建的领域,提出一种基于期刊主题相似性的领域分析数据集构建的方法。[方法/过程]该方法组合运用引文分析与期刊文献耦合分析方法,并借助科学知识图谱绘制方法,通过确定学科领域的代表性期刊群组,经过不同形式的组配最终达到满足不同层次需求的构建数据集的目的。[结果/结论]本方法可以满足宏观、中观和微观不同领域分析层次的需求,操作过程简单灵活且人工干预的程度不高,通过在具体领域的实例验证,证明其可以有效地解决一些领域数据集构建的难题,对今后相关研究具有一定借鉴意义。 展开更多
关键词 数据集构建 期刊主题相似性 引文分析 期刊文献 耦合分析 知识图谱
原文传递
高分辨率、多时相SAR图像数据集的构建 被引量:6
18
作者 郁文贤 柳彬 +3 位作者 丁拥科 胡昊 李元祥 张增辉 《测绘通报》 CSCD 北大核心 2014年第S1期119-122,158,共5页
近20年来,SAR图像理解与信息反演是一个得到广泛、深入研究的世界性难题。即使在高分辨率条件下,由于相干斑噪声、结构极度敏感性、几何畸变、成像系统干扰等原因,SAR图像的高可信解译依然非常困难。SAR测试样本数据集是发展SAR图像解... 近20年来,SAR图像理解与信息反演是一个得到广泛、深入研究的世界性难题。即使在高分辨率条件下,由于相干斑噪声、结构极度敏感性、几何畸变、成像系统干扰等原因,SAR图像的高可信解译依然非常困难。SAR测试样本数据集是发展SAR图像解译与目标认知技术的基础与支撑。但SAR数据集并不是各种SAR数据的简单收集,而是要根据研究内容的需要,制定试验方案,科学地选择样本并进行样本真值标注,并且尽可能收集各种多源辅助数据以相互验证。笔者以上海交通大学闵行校区为场景,构建了一个以高分辨率、多时相SAR图像为主的试验数据集,其由高分辨率SAR数据、地表真值标注、多源辅助数据3个主要的部分组成。笔者认为,该数据集的构建能够为高分辨率SAR图像解译、信息反演和目标识别提供高可信的、实时的、丰富的地表和目标真值信息,能够促进这些研究和相关测试工作的进展。 展开更多
关键词 高分辨率 多时相 SAR图像 数据集构建
下载PDF
胸部CT肺结节数据集构建及质量控制专家共识 被引量:25
19
作者 中华医学会放射学分会 中国食品药品检定研究院 +7 位作者 国家卫生健康委能力建设与继续教育中心 医学图像青年研究学会 浙江省数理医学学会 刘士远 李静莉 杨爱平 刘凯 王浩 《中华放射学杂志》 CAS CSCD 北大核心 2021年第2期104-110,共7页
基于人工智能的肺结节辅助诊断、辅助检测对于肺癌早期筛查具有重要意义。由于当前产品通常采用监督学习,研发与测试过程需要高质量的胸部CT肺结节数据集。目前,此类数据集的构建和质量控制尚未建立具体的技术规范,业内处于探索阶段。... 基于人工智能的肺结节辅助诊断、辅助检测对于肺癌早期筛查具有重要意义。由于当前产品通常采用监督学习,研发与测试过程需要高质量的胸部CT肺结节数据集。目前,此类数据集的构建和质量控制尚未建立具体的技术规范,业内处于探索阶段。随着人工智能医疗器械标准化的推进,关于数据集通用要求的标准正在起草。为促进产业发展、推进标准化进程,本文以训练集为案例,提出了胸部CT肺结节数据集的构建流程,包括数据采集、数据标注等环节。同时,本文解释了该类数据集质量特性的表现形式,提供了质量控制思路。本文旨在为数据集制造责任方提供参考路线,保障数据资源的有序供给,促进肺结节人工智能产品的研发生产。 展开更多
关键词 人工智能 医疗器械 肺结节 数据集构建 质量控制
原文传递
基于SVM土壤重金属污染评价的训练数据集构建 被引量:7
20
作者 鄢文苗 任东 +2 位作者 黄应平 熊彪 董方敏 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2019年第3期316-322,共7页
支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本... 支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本中添加国标法样本扩大训练数据集,进一步提高模型分类准确率。结果表明:对同一组实测样本进行分类,国标法模型准确率(53. 33%)低于实测法模型准确率(75. 56%);扩大后的数据集训练所得模型与实测法模型相比,分类60个实测样本时,准确率由88. 33%提高至98. 33%,分类45个实测样本时,准确率由75. 56%提高至82. 22%。 展开更多
关键词 支持向量机 数据集构建 分类 土壤重金属
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部