期刊文献+
共找到5,652篇文章
< 1 2 250 >
每页显示 20 50 100
人工智能囊胚形态评估数据集构建与质控专家共识
1
作者 王浩 张孝东 +25 位作者 孙莹璞 孙海翔 邓成艳 黄学锋 刘平 周灿权 冯云 郝桂敏 卢文红 沈浣 师娟子 张松英 滕晓明 王晓红 王秀霞 伍琼芳 全松 曾勇 钟影 邵小光 柯林楠 毛歆 韩倩倩 黄国宁 中华医学会生殖医学分会第五届委员会 中国食品药品检定研究院 《生殖医学杂志》 CAS 2024年第7期843-851,共9页
囊胚形态人工智能(AI)评估是AI医疗器械发展的新兴方向,也是AI在辅助生殖领域的重要应用。AI在新领域应用的起步阶段,数据集的构建与质控对产品质量有重要影响。目前,囊胚形态学AI评估在数据采集、标注、质控等方面尚未形成统一的规范... 囊胚形态人工智能(AI)评估是AI医疗器械发展的新兴方向,也是AI在辅助生殖领域的重要应用。AI在新领域应用的起步阶段,数据集的构建与质控对产品质量有重要影响。目前,囊胚形态学AI评估在数据采集、标注、质控等方面尚未形成统一的规范。在参考AI医疗器械、辅助生殖医疗器械现有国家行业标准的基础上,本文以囊胚形态AI评估数据集为主题,对数据集构建与质控要求进行了探讨,对数据集质量特性进行了解析,旨在指导数据集制造责任方加强数据集全生命周期管理,更好地为产品研发、测试、临床试验等环节提供质量保障,助力产业发展。 展开更多
关键词 人工智能(AI) 囊胚形态评估 数据集构建 数据集标注 数据集质量控制
下载PDF
2D-3D医学图像配准临床数据集标定结果的分析与评价
2
作者 魏萍 王顺顺 +1 位作者 王珠 舒丽霞 《北京生物医学工程》 2024年第1期51-57,共7页
目的构建采自临床的2D-3D医学图像配准数据集,是实现各种学习算法应用于实际医疗的重要环节。然而临床数据的获取过程中存在多种不确定因素,致使数据集的标定结果需要分析和评价。本文对采自胸主动脉腔内修复术的一组X线和CT图像的几组... 目的构建采自临床的2D-3D医学图像配准数据集,是实现各种学习算法应用于实际医疗的重要环节。然而临床数据的获取过程中存在多种不确定因素,致使数据集的标定结果需要分析和评价。本文对采自胸主动脉腔内修复术的一组X线和CT图像的几组标定数据进行分析和评价,并确定正确标定结果。方法分别采用相似性度量法和投影距离误差法对标定结果进行分析和评价。选用相似性准则,计算CT图像生成的二维数字放射重建图像和X线图像的相似性,相似程度越高,对应的标定值越接近真实值。读取X线图像中的标记物影像位置作为参考位置;将计算得到的CT图像中标记物位置在X线图像上投影,得到投影位置;计算参考位置和投影位置的距离,距离值越小,对应的标定值越接近真实值。结果提供的几组标定数据,在比较数字放射重建图像和X线图像相似性方面,相似度接近,没有明显指向性;而投影距离误差法的分析结果指向性明显,能够定量描述标定结果的优劣。主要原因在于各组标定值之间差别不突出;生成的数字放射重建图像和X线图像之间模态差异较大等。结论投影距离误差法是评价2D-3D医学图像配准数据集标定结果的有效手段。另外,若提供的标定结果计算数据差异明显,或者可以提供高质量的数字放射重建图像时,相似性度量法也是评价标定结果的可选途径。 展开更多
关键词 数据集标定 临床数据集 评价 相似性度量 投影距离误差
下载PDF
基于AIXM数据集和改进A^(*)算法的直升机路径规划
3
作者 赖欣 梁昌盛 +1 位作者 张恒嫣 冯嘉宇 《科学技术与工程》 北大核心 2024年第14期6099-6107,共9页
针对AIXM数据集(aeronautical information exchange model dataset)在通航应用研究缺乏,以及经典A^(*)算法在直升机路径规划问题中转弯节点多等问题,提出了一种基于AIXM数据集的改进A^(*)算法直升机路径规划方法。首先,分析了AIXM数据... 针对AIXM数据集(aeronautical information exchange model dataset)在通航应用研究缺乏,以及经典A^(*)算法在直升机路径规划问题中转弯节点多等问题,提出了一种基于AIXM数据集的改进A^(*)算法直升机路径规划方法。首先,分析了AIXM数据集的时空属性,设计了基于时空属性搜索的AIXM障碍物数据查询方法,为进行直升机路径规划奠定了数据环境基础;然后结合直升机性能限制构建了碰撞判断包围盒,基于碰撞包围盒改进经典A^(*)算法,利用AIXM数据障碍物数据与航线数据,提出了一种直升机路径规划方法;通过python与Luaid AIXM 5 Viewer对该方法进行了仿真实验表明,所提方法规划的直升机路径转弯节点少,降低了直升机转弯的频率,规划路径短且符合路径与障碍物之间的安全距离要求。本文研究是将AIXM数据集利用于通航航空情报服务的创新尝试。 展开更多
关键词 通用航空 AIXM数据集 直升机路径规划 时空数据集 A^(*)算法
下载PDF
积极心理学更智能:机器学习与自发生成数据集的新途径 被引量:1
4
作者 彭凯平 童松 吴晟 《西北师大学报(社会科学版)》 北大核心 2024年第2期91-99,共9页
本文探讨了积极心理学在计算智能快速发展时所面临的具体挑战,分析了机器学习和自发生成数据集在应对这些挑战时的巨大潜力。机器学习可从高维数据中提取与人类认知相关的非线性关系,成为研究人类认知和情感的新途径。自发生成数据集能... 本文探讨了积极心理学在计算智能快速发展时所面临的具体挑战,分析了机器学习和自发生成数据集在应对这些挑战时的巨大潜力。机器学习可从高维数据中提取与人类认知相关的非线性关系,成为研究人类认知和情感的新途径。自发生成数据集能更真实地反映人类行为和心理过程,为研究者提供高效的研究素材。这些新兴技术为积极心理学提供了全新视角,能更全面地认识人类行为和心理并推动文化差异性研究、理论更新和干预策略评估。未来研究需探索机器学习、自发生成数据集与积极心理学理论的结合,以深入理解人类行为和情感的多样性和复杂性。 展开更多
关键词 积极心理学 机器学习 自发生成数据集(NODS) 计算智能
下载PDF
GPR图像的数据集构建及其DRDU-Net去噪算法
5
作者 王惠琴 高大庆 +3 位作者 何永强 刘宾灿 王莹 曹明华 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期20-28,共9页
为了解决生成对抗网络(Generative Adversarial Network,GAN)在生成探地雷达(Ground Penetrating Radar,GPR)图像时存在训练不稳定的问题,提出利用带有梯度惩罚的Wasserstein距离生成对抗网络(WGAN-GP)生成GPR图像,并结合时域有限差分... 为了解决生成对抗网络(Generative Adversarial Network,GAN)在生成探地雷达(Ground Penetrating Radar,GPR)图像时存在训练不稳定的问题,提出利用带有梯度惩罚的Wasserstein距离生成对抗网络(WGAN-GP)生成GPR图像,并结合时域有限差分法和实地采集图像提出了一种构建GPR图像数据集的方法.相较于原始GAN与Wasserstein GAN等方法,WGAN-GP具有更好的稳定性,而且生成的GPR图像更接近真实图像.在此基础之上,将密集残差块和U-Net相结合提出了一种适合于GPR图像的密集残差去噪U-Net方法.该方法利用U-Net中编码-解码结构提高了GPR图像的去噪性能;同时,密集残差块的引入加强了GPR图像的特征复用,且使U-Net训练更加稳定.最后,利用仿真实验验证了所提去噪方法的性能,并与三维块匹配(BM3D)和U-Net方法进行了对比.结果表明:所提方法与BM3D以及U-Net去噪方法相比,具有更好的去噪效果.当σ等于20时,在模拟和实测数据上取平均值,其峰值信噪比分别提升了约6.5 dB和2.4 dB;结构相似性分别提升了约0.09和0.04. 展开更多
关键词 GPR数据集构建 GPR图像去噪 WGAN-GP 残差块
下载PDF
一种多模态隐喻数据集的构建和验证方法 被引量:1
6
作者 夏冰 杨瑞楠 +4 位作者 董玉 楚世豪 唐崇俊 葛云翔 尹家斌 《集成技术》 2024年第5期64-73,共10页
隐喻的目的是启发理解、说服他人。目前,隐喻呈现文本、图像、视频等多模态融合的趋势,因此,识别多模态信息中蕴含的隐喻语义对互联网内容安全具有研究价值。由于缺乏多模态隐喻数据集,难以建立研究模型,因此,当前学者更关注基于文本的... 隐喻的目的是启发理解、说服他人。目前,隐喻呈现文本、图像、视频等多模态融合的趋势,因此,识别多模态信息中蕴含的隐喻语义对互联网内容安全具有研究价值。由于缺乏多模态隐喻数据集,难以建立研究模型,因此,当前学者更关注基于文本的隐喻检测。针对这一不足,作者首先从图像-文本、隐喻出现、情感表达和作者意图等角度构建新型多模态隐喻数据集;其次,对数据集的标注者进行Kappa分数计算;最后,借助预训练模型和注意力机制融合图像属性特征、图像实体对象特征和文本特征,构建多模态隐喻检测模型,验证多模态数据集的质量和价值。实验结果表明:具有情感和意图表达的隐喻数据集可提升隐喻模型检测效果,多模态信息间相互关系有助于隐喻的理解。 展开更多
关键词 内容安全 多模态隐喻检测 外部知识 多模态数据集 注意力机制
下载PDF
面向对海监视的舰船目标跟踪与航迹融合数据集
7
作者 刘丽华 陈志豪 +4 位作者 杨皓宇 肖开明 吴继冰 陈海文 黄宏斌 《中国科学数据(中英文网络版)》 CSCD 2024年第1期255-267,共13页
对海监视中航迹实时关联与轨迹融合任务是安全防控、区域态势监视、远程精确打击等军民应用领域的热点和难点问题,高质量的数据集对推动目标跟踪与融合技术在该领域的研究有重要作用。本研究针对目标跟踪与融合领域技术研究的数据需求... 对海监视中航迹实时关联与轨迹融合任务是安全防控、区域态势监视、远程精确打击等军民应用领域的热点和难点问题,高质量的数据集对推动目标跟踪与融合技术在该领域的研究有重要作用。本研究针对目标跟踪与融合领域技术研究的数据需求以及目前公开数据集所存在的数据缺乏、场景设计针对性差、数据格式单一、数据描述不全等问题,通过仿真软件对复杂场景中多传感器多目标探测数据进行仿真,提供了一套面向典型对海监视场景(以舰船为探测对象的2D雷达与侦察传感器﹝ESM﹞)的目标跟踪与航迹融合数据集。其中仿真软件包括剧情发生器和传感器模拟器两部分,是一套成熟的目标跟踪场景仿真环境,提供逼真的探测数据模拟能力。本数据集涵盖的传感器对象包括2D雷达与侦察传感器,目标包括典型的海上舰船类别,并支持携带辐射源配置,设计了高速运动、密集交通、多传感器数据融合、特定舰船侦测和交叉定位等多种典型场景。本数据集中共包含368155条目标点迹,舰船数量为101条,时间范围15000秒,数据格式符合实际设备上报情景、探测误差模型符合实际。本数据集通过对数据误差进行正态性检验、对检测率、虚警率的场景检验以及实地调研,完成了对数据的准确性评估与数据完备性控制,可为舰船目标跟踪、轨迹融合等算法研究与验证提供基础数据。 展开更多
关键词 目标跟踪 轨迹融合 目标点迹 雷达 侦察 数据集
下载PDF
面向机器阅读理解的高质量藏语数据集构建
8
作者 孙媛 刘思思 +2 位作者 陈超凡 旦正错 赵小兵 《中文信息学报》 CSCD 北大核心 2024年第3期56-64,共9页
机器阅读理解是通过算法让机器根据给定的上下文回答问题,从而测试机器理解自然语言的程度。其中,数据集的构建是机器阅读理解的主要任务之一。目前,相关算法模型在大多数流行的英语数据集上都取得了显著的成绩,甚至超过了人类表现。但... 机器阅读理解是通过算法让机器根据给定的上下文回答问题,从而测试机器理解自然语言的程度。其中,数据集的构建是机器阅读理解的主要任务之一。目前,相关算法模型在大多数流行的英语数据集上都取得了显著的成绩,甚至超过了人类表现。但对于低资源语言,由于缺乏相应的数据集,机器阅读理解研究尚处于起步阶段。该文以藏语为例,人工构建了藏语机器阅读理解数据集(TibetanQA),其中包含20000个问题答案对和1513篇文章。该数据集的文章均来自云藏网,涵盖了自然、文化和教育等12个领域,问题形式多样且具有一定的难度。另外,该数据集在文章收集、问题构建、答案验证、回答多样性和推理能力等方面,均采用严格的流程以确保数据的质量,同时采用基于语言特征消融输入的验证方法说明了数据集的质量。最后,该文初步探索了三种经典的英语阅读理解模型在TibetanQA数据集上的表现,其结果难以媲美人类,这表明藏语机器阅读理解任务还需要更进一步的探索。 展开更多
关键词 机器阅读理解 低资源语言 藏语 数据集
下载PDF
2016—2022学年广东外语外贸大学图书馆用户行为记录数据集
9
作者 周剑峰 王伟杰 杨卫明 《图书馆杂志》 北大核心 2024年第9期106-112,共7页
本数据集采集了2016—2022学年广东外语外贸大学图书馆用户管理平台、门禁管理系统、学习空间管理系统、Aleph500图书集成管理系统中的用户信息、进馆记录、学习空间使用记录和借阅记录,经清洗、脱敏、加工后,共获得4个数据文件,合计142... 本数据集采集了2016—2022学年广东外语外贸大学图书馆用户管理平台、门禁管理系统、学习空间管理系统、Aleph500图书集成管理系统中的用户信息、进馆记录、学习空间使用记录和借阅记录,经清洗、脱敏、加工后,共获得4个数据文件,合计14208746条记录。该数据集有助于分析“十三五”规划、“十四五”规划以来图书馆空间资源、图书资源的利用情况,探究用户在图书馆场馆内的行为规律及变化趋势,为图书馆的空间布局调整、资源建设与利用方面的服务提供决策支持,为同类院校图书馆的横向分析研究提供支持。 展开更多
关键词 高校图书馆 数据集 借阅行为 学习空间使用行为 进馆记录
下载PDF
基于改进级联算法的不平衡数据集分类检测算法
10
作者 吕文官 薛峰 《保定学院学报》 2024年第2期98-103,共6页
以提升不平衡数据集分类检测为研究目标,提出基于改进级联算法的不平衡数据集分类检测算法.首先,采用卡尔曼滤波法进行数据去噪预处理,利用小波阈值去噪算法二次消除噪声数据,并对去噪结果进行归一化预处理;利用DPC算法提取数据的局部... 以提升不平衡数据集分类检测为研究目标,提出基于改进级联算法的不平衡数据集分类检测算法.首先,采用卡尔曼滤波法进行数据去噪预处理,利用小波阈值去噪算法二次消除噪声数据,并对去噪结果进行归一化预处理;利用DPC算法提取数据的局部密度特征,利用时间编码挖掘数据的时序性特征,采用Apriori算法的强关联规则提取数据集特征;利用模糊层次聚类算法对支持向量机进行优化,实现数据类型的划分;利用改进的级联算法联合布谷鸟算法实现不平衡数据集分类检测.实验结果表明本方法的分类协方差低于0.15,检测准确率高于95%,检测时间低于2.2 ms,有效提升了不平衡数据集分类检测效果. 展开更多
关键词 卡尔曼滤波 改进级联算法 不平衡数据集 分类检测
下载PDF
不平衡数据集的DC-SMOTE过采样方法
11
作者 冀常鹏 尚佳奇 代巍 《智能系统学报》 CSCD 北大核心 2024年第3期525-533,共9页
针对不平衡数据集在分类任务中表现不佳的问题,提出基于局部密度与集中度的过采样算法。针对数据集中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与集中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决... 针对不平衡数据集在分类任务中表现不佳的问题,提出基于局部密度与集中度的过采样算法。针对数据集中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与集中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决类内不平衡问题。根据集中度的不同,区分出少数类样本的边界,有针对性地合成第二类新样本,达到强化边界的作用;同时,通过自适应生成新样本,有效解决大部分过采样算法没有明确过采样量或者盲目追求样本平衡度相等的问题。最后,在公开的12个不平衡数据集上进行了实验,实验结果表明,本算法在低不平衡数据集与高不平衡数据集上的应用均拥有良好的表现。 展开更多
关键词 不平衡数据集 过采样 高斯核函数 局部引力 高不平衡数据 合成少数类过采样 不平衡度 分类
下载PDF
基于最小数据集的集约化葡萄园土壤健康评价 被引量:2
12
作者 王斌 李云 +3 位作者 李瑞鹏 方菲 张江周 张俊伶 《农业工程学报》 EI CAS CSCD 北大核心 2024年第8期71-79,共9页
健康土壤是生产高产优质葡萄的基础,目前葡萄园不合理管理导致果园土壤生产力下降和生态失衡。为摸清集约化葡萄园土壤健康状况,该研究以河北省曲周县典型葡萄园为研究对象,通过测定20项土壤物理、化学和生物学指标,利用主成分分析法构... 健康土壤是生产高产优质葡萄的基础,目前葡萄园不合理管理导致果园土壤生产力下降和生态失衡。为摸清集约化葡萄园土壤健康状况,该研究以河北省曲周县典型葡萄园为研究对象,通过测定20项土壤物理、化学和生物学指标,利用主成分分析法构建最小数据集,开展土壤健康评价并揭示葡萄园存在的主要障碍因子。结果表明,集约化葡萄园土壤健康评价最小数据集由有机碳、亚表层土壤硬度、交换性钠、容重、含水率和水稳性团聚体6个指标构成。利用线性和非线性评分函数,基于全数据集和最小数据集计算的土壤健康指数间呈显著正相关(P<0.01),这说明最小数据集可以代替全数据集用于葡萄园土壤健康评价。基于最小数据集,利用线性和非线性评分函数获得的葡萄园土壤健康指数范围分别为0.39~0.59和0.36~0.66,平均值分别为0.52和0.51,处于中等水平。不同树龄葡萄土壤健康指数差异不显著(P>0.05)。集约化葡萄园土壤障碍因子主要有土壤压实、养分不平衡和有机碳含量低等问题。通过适当减少田间管理频率,结合增施(生物)有机肥、种植覆盖作物和养分综合管理能有效消减土壤障碍因子,提升葡萄园土壤健康水平,促进当地葡萄产业可持续发展。 展开更多
关键词 土壤 葡萄园 主成分分析 最小数据集 土壤健康指数
下载PDF
基于本土对象数据集的人工智能教学
13
作者 陈凯 《中国信息技术教育》 2024年第19期15-18,共4页
本文围绕具有跨学科特性的利用人工智能进行校园植物观测的活动,探讨用于人工智能学习的本土对象的数据集构建的相关问题,提出应该从学生日常生活出发,结合真实情境,为数据采集和分类任务建立具有一定合理性、真实性的目标框架,可以为... 本文围绕具有跨学科特性的利用人工智能进行校园植物观测的活动,探讨用于人工智能学习的本土对象的数据集构建的相关问题,提出应该从学生日常生活出发,结合真实情境,为数据采集和分类任务建立具有一定合理性、真实性的目标框架,可以为分类目标限定范围,分类任务中的对象的特征既要有相似性又要有区分度,可以通过计算机视觉库的自动化处理来提高特征数据采集和记录的效率。 展开更多
关键词 人工智能 自然观测 数据集
下载PDF
基于修订的最小数据集的土壤质量评价—以安徽合肥巢湖湖滨国家湿地公园为例 被引量:1
14
作者 崔梦婷 刘璇 +2 位作者 吴继龙 黄涛 孙庆业 《地球与环境》 CAS CSCD 北大核心 2024年第1期41-52,共12页
运用主成分分析法建立修订的最小数据集(revised minimum data set,R-MDS),计算土壤质量指数(soil quality index,SQI),对安徽合肥巢湖湖滨国家湿地公园土壤质量开展评价。结果表明,建立的最小数据集包括土壤有机质、全氮、速效钾、酸... 运用主成分分析法建立修订的最小数据集(revised minimum data set,R-MDS),计算土壤质量指数(soil quality index,SQI),对安徽合肥巢湖湖滨国家湿地公园土壤质量开展评价。结果表明,建立的最小数据集包括土壤有机质、全氮、速效钾、酸性磷酸酶、脱氢酶、过氧化氢酶和含水率。基于修订的最小数据集的巢湖湖滨湿地土壤质量指数(soil quality index-revised minimum,SQI-RM)与基于全体数据集(total data set,TDS)的土壤质量指数(soil quality index-total,SQI-T)呈显著正相关,R^(2)达到0.86(P<0.05),Nash有效系数为0.65,偏差系数为0.02,表明修订的最小数据集能够提取大部分数据信息,可以有效替代全体数据集开展湖滨湿地土壤质量评价。基于修订的最小数据集的安徽合肥巢湖湖滨湿地公园土壤质量指数范围为0.25~0.61(均值0.44),表明湖滨湿地土壤质量整体水平一般。土壤全氮、有机质含量低是巢湖湖滨湿地土壤的显著特征,是土壤质量的限制因子。本研究结果为安徽合肥巢湖湖滨湿地公园管理提供了重要参考依据。 展开更多
关键词 巢湖 湖滨湿地 最小数据集 主成分分析 土壤质量评价
下载PDF
基于数据集蒸馏的光伏发电功率超短期预测 被引量:1
15
作者 郑珂 王丽婕 +1 位作者 郝颖 王勃 《中国电机工程学报》 EI CSCD 北大核心 2024年第13期5196-5207,I0015,共13页
云是影响太阳直接辐射变化的主要因素,由于各类云的透光率不同,导致到达光伏电站的太阳辐射会随之产生波动。为解决各类云遮挡下的光伏发电功率波动大、预测模型个数多的问题,提出一种基于卫星云图和数据集蒸馏的光伏发电功率超短期预... 云是影响太阳直接辐射变化的主要因素,由于各类云的透光率不同,导致到达光伏电站的太阳辐射会随之产生波动。为解决各类云遮挡下的光伏发电功率波动大、预测模型个数多的问题,提出一种基于卫星云图和数据集蒸馏的光伏发电功率超短期预测模型。首先,基于待测场站上方的历史云图,采用Farneback光流法预测出云图;然后,根据卫星云分类标签数据建立各类云的样本库,利用数据集蒸馏算法训练样本库得到云类判别图,将预测云图与云类判别图匹配计算,获得云类聚合匹配特征;最后,利用上述特征、云量特征以及数值天气预报数据建立长短期记忆网络模型,对光伏发电功率进行超短期预测。利用某光伏电站数据进行验证,结果显示,该文所提模型能准确描述云层的各项特征,有效提升光伏功率预测精度。 展开更多
关键词 数据集蒸馏 卫星云图 云分类 光流法 超短期光伏功率预测
下载PDF
CMADS数据集在呼兰河流域的适用性评价 被引量:1
16
作者 陈楷 王立权 +1 位作者 刘岩 刘家溪 《灌溉排水学报》 CAS CSCD 2024年第1期60-68,共9页
【目的】探究中国大气同化数据集(CMADS)在呼兰河流域水文模拟的适用性。【方法】对CMADS与传统水文站降水、气温数据的精度及时空分布特征进行分析,构建CMADS与传统水文站2种气象数据驱动流域有、无水库控制水系情景下的SWAT模型,同时... 【目的】探究中国大气同化数据集(CMADS)在呼兰河流域水文模拟的适用性。【方法】对CMADS与传统水文站降水、气温数据的精度及时空分布特征进行分析,构建CMADS与传统水文站2种气象数据驱动流域有、无水库控制水系情景下的SWAT模型,同时使用SUFI-2算法以月值实测断面径流数据为准进行模型参数的率定和验证,评价该数据集作为气象驱动数据的适用性及对传统水文站数据的可替代性。【结果】(1)2种气象数据具有较强的线性相关性和对应关系,且时空分布特征相似,年内变化趋势一致。(2)在无水库呼兰河干流水系,CMADS数据驱动的模型率定期R^(2)=0.92、NSE=0.91、PBIAS=18.53%,验证期R^(2)=0.94、NSE=0.96、PBIAS=10.51%;在有水库通肯河水系,模型在率定期R^(2)=0.89、NSE=0.82、PBIAS=12.79%,验证期模型R^(2)=0.93、NSE=0.86、PBIAS=12.03%,模拟结果均达到径流模拟评价标准。【结论】CMADS+SWAT模型比传统水文站在呼兰河流域径流模拟整体效果更佳、模拟精度和适用性更好,与实测值更为接近,可为缺少气象数据的研究区建立SWAT模型提供数据支撑。 展开更多
关键词 SWAT分布式水文模型 CMADS数据集 水文模拟 时空分布特征 适用性评价
下载PDF
中国土地利用/覆被重建数据集历史文献数据源的应用现状与前景
17
作者 薛樵风 金晓斌 +2 位作者 成一农 杨绪红 周寅康 《地理科学》 CSCD 北大核心 2024年第9期1555-1564,共10页
历史时期土地利用/覆被变化(LUCC)是全球变化研究的重要组成部分。中国丰富的历史文献资料是开展长时段LUCC数据集重建的关键数据源。从百年以上历史文献数据源应用的角度分析现有中国LUCC重建数据集,将历史文献中蕴含的土地利用数据源... 历史时期土地利用/覆被变化(LUCC)是全球变化研究的重要组成部分。中国丰富的历史文献资料是开展长时段LUCC数据集重建的关键数据源。从百年以上历史文献数据源应用的角度分析现有中国LUCC重建数据集,将历史文献中蕴含的土地利用数据源归纳为统计、列举、描述和图像4种主要类型,从各类数据源应用现状、制备方法等方面对现有重建数据集进行了重点回顾,归纳重建数据集应用历史文献的主要特点和存在问题,并从多重历史数据源综合利用、重建思路调整、利用现代信息技术提高数据源制备效率等方面展望了LUCC重建数据集改进历史文献应用方式、方法的未来发展趋势。 展开更多
关键词 历史土地利用/覆被数据集 历史文献 数据 空间重建 中国
下载PDF
多视角网页分类数据集构建及性能评估
18
作者 孙辰星 刘伟 +3 位作者 卢彬 梁诗宇 诸云强 甘小莺 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期406-415,共10页
网页分类是互联网数据挖掘中的一项重要任务,在信息搜索、推荐系统和知识发现等领域发挥着关键作用.然而,现有的公开网页数据集缺乏多视角信息,难以适用于蕴含复杂特征的网页分类任务.针对上述问题,基于“收集-处理-标注”构建流程,提... 网页分类是互联网数据挖掘中的一项重要任务,在信息搜索、推荐系统和知识发现等领域发挥着关键作用.然而,现有的公开网页数据集缺乏多视角信息,难以适用于蕴含复杂特征的网页分类任务.针对上述问题,基于“收集-处理-标注”构建流程,提出一个涵盖文本语义、网页结构等多视角特征的网页数据集Web-Minds,该数据集包含600余个门户网站下的21828条网页.首先,在开放互联网中通过关键词检索采集得到相关网页数据;其次,使用网页解析工具对收集的数据中的文本、DOM结构树、关键词等多视角信息进行提取与清洗;最后,采用大语言模型与“人在回路”的联合标注策略,形成网页类型与网页主题两种标签.在此基础上,针对Web-Minds数据集,测试评估了机器学习、文本分类和网页分类多种算法,结果表明,综合利用多视角特征能有效提升算法的准确率,和仅应用单视角特征相比,在网页类型和主题分类任务上,准确率分别提升了5.49%和5.61%. 展开更多
关键词 网页数据集 网页分类 文本分类 数据挖掘 深度学习
下载PDF
面向兵棋推演复盘分析的机器学习数据集构建
19
作者 张大永 杨镜宇 +1 位作者 马骏 宋晨烨 《系统仿真学报》 CAS CSCD 北大核心 2024年第3期608-624,共17页
运用机器学习进行兵棋推演复盘分析,首先要解决的是数据集构建问题。由于机器学习对数据结构的规范化要求,以及算力和存储限制,通过兵棋推演数据构建机器学习数据集,在如何描述兵棋推演状态,如何描述推演过程,如何处理高维数据,如何数... 运用机器学习进行兵棋推演复盘分析,首先要解决的是数据集构建问题。由于机器学习对数据结构的规范化要求,以及算力和存储限制,通过兵棋推演数据构建机器学习数据集,在如何描述兵棋推演状态,如何描述推演过程,如何处理高维数据,如何数据保真等方面,还面临不少问题。针对此类问题,构建了兵棋推演过程数据向机器学习数据集映射模型,在总体框架上对数据集构建的映射流程、态势描述数据范围和数据统计计算规则进行规范,并从时间关联数据、地理空间关联数据和高维数据降维3个视角设计针对性处理方法,以保证构建数据集的数据结构统一、高维数据降维需求和数据集保真要求。通过数据集构建实验进行了验证,结果表明:在时间分辨率和地理空间分辨率适中情况下,所构建数据集映射模型,既能较好对兵棋推演高维数据进行降维,又能较好防止构建的数据集失真。 展开更多
关键词 兵棋推演 复盘分析 机器学习 数据集 构建方法
下载PDF
依赖差分隐私:关联数据集下的高斯机制 被引量:1
20
作者 欧阳恒 陈洪超 《网络安全与数据治理》 2024年第3期9-13,共5页
差分隐私(Differential Privacy)是一种数据扰动框架,它保证查询结果在概率上不可区分。研究表明差分隐私应用于关联数据集时,将带来隐私泄露的风险。根据依赖差分隐私(Dependent Differential Privacy),量化了依赖差分隐私敏感度的度量... 差分隐私(Differential Privacy)是一种数据扰动框架,它保证查询结果在概率上不可区分。研究表明差分隐私应用于关联数据集时,将带来隐私泄露的风险。根据依赖差分隐私(Dependent Differential Privacy),量化了依赖差分隐私敏感度的度量;随后,提出了依赖差分隐私-高斯机制算法(Gaussian Mechanism Algorithm-Dependent Differential Privacy),实现数据扰动,同时证明了该机制满足隐私保证的基本定理;通过使用真实数据集的实验表明,GMA-DDP在管理依赖数据的隐私-效用权衡方面具有较高的可用性。 展开更多
关键词 差分隐私 依赖差分隐私 高斯机制 关联数据集
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部