期刊文献+
共找到1,071,558篇文章
< 1 2 250 >
每页显示 20 50 100
数据要素流通与安全的研究范畴与未来发展趋势 被引量:4
1
作者 李凤华 李晖 +1 位作者 牛犇 邱卫东 《通信学报》 EI CSCD 北大核心 2024年第5期1-11,共11页
针对数据从信息技术时代的受控共享向数据技术时代的数据要素泛在流通演化的趋势,分析了数据共享与数据要素流通的差异,阐述了什么样的数据才能成为数据要素,提出了数据成为数据要素所必须具有的6个属性,定义了数据要素流通模型及主要环... 针对数据从信息技术时代的受控共享向数据技术时代的数据要素泛在流通演化的趋势,分析了数据共享与数据要素流通的差异,阐述了什么样的数据才能成为数据要素,提出了数据成为数据要素所必须具有的6个属性,定义了数据要素流通模型及主要环节,明确了数据要素流通的研究范畴,梳理了数据要素流通研究范畴的相关概念,厘清了研究范畴所涵盖的关键核心技术,并对未来需要突破的关键技术进行了展望。 展开更多
关键词 数据要素流通 数据确权 数据安全计算 隐私计算
下载PDF
面向多模态数据的新型数据库技术专题前言 被引量:2
2
作者 彭智勇 高云君 +1 位作者 李国良 许建秋 《软件学报》 EI CSCD 北大核心 2024年第3期1049-1050,共2页
以数字技术为标志的新一轮科技革命方兴未艾,将人类带入数字经济时代.全球各行各业数据量呈现爆炸式增长,数据类型和数据格式也呈现多种形式,例如结构化关系表、半结构化JSON/XML、非结构化文本/图像/视频,以及图数据、流数据和时序数据... 以数字技术为标志的新一轮科技革命方兴未艾,将人类带入数字经济时代.全球各行各业数据量呈现爆炸式增长,数据类型和数据格式也呈现多种形式,例如结构化关系表、半结构化JSON/XML、非结构化文本/图像/视频,以及图数据、流数据和时序数据等.这要求数据库系统能够同时高效地管理多种不同类型的数据.多模态数据管理与分析成为亟需解决的问题.目前的方法主要通过拓展现有的数据库或通过集成各种不同模态数据管理引擎来支持多模态数据管理与分析,缺少新颖的理论、方法与技术的支撑.本专题围绕多模态数据管理与分析的整个生命周期,通过结合大数据技术和人工智能方法探讨新型数据库系统理论、方法和技术,包括多模态数据统一建模、存储与索引、查询与挖掘、并发控制、多模态数据库系统构建及其典型应用等主题,赋予数据库系统新的管理能力,形成多模态数据管理与分析在各行各业的最新应用成果. 展开更多
关键词 数据库系统 多模态数据 数据库技术 人工智能方法 并发控制 数据技术 数据类型 统一建模
下载PDF
教育场景驱动的高校数据治理 被引量:3
3
作者 刘英群 周潜 韩锡斌 《中国电化教育》 CSSCI 北大核心 2024年第1期38-43,67,共7页
教育数字化转型的重要任务之一是通过数据治理提高教育治理能力,当前数据治理呈现出场景化和智能化的趋势,但是以管理和标准为核心的静态治理理念难以适应应用场景的数字化转型和创新。该文首先从数据治理的视角探讨了教育场景的概念和... 教育数字化转型的重要任务之一是通过数据治理提高教育治理能力,当前数据治理呈现出场景化和智能化的趋势,但是以管理和标准为核心的静态治理理念难以适应应用场景的数字化转型和创新。该文首先从数据治理的视角探讨了教育场景的概念和特征,然后分析了当前高校教育场景数据治理中存在的数据不够“大”、数据不够“好”、数据未尽其“用”三个核心问题,提出高校教育场景驱动的数据治理方法和治理流程,教育场景中的原始数据经过数据资产化、数据标准化、数据要素化三个关键环节演化为具有计算属性、组织属性和教育属性的场景数据资产,作为关键要素进入到教育教学过程中,从而形成良性循环的数据资产生态,充分发挥数据资产的教育价值。 展开更多
关键词 职业教育 数据治理 教育场景 数据资产 数据资产生态
下载PDF
新型电力系统数据跨域流通泛安全边界防护技术 被引量:5
4
作者 郭少勇 刘岩 +3 位作者 邵苏杰 臧志斌 杨超 亓峰 《电力系统自动化》 EI CSCD 北大核心 2024年第6期96-111,共16页
新型电力系统建设涉及多业务系统、多部门、多方主体间进行海量、异构数据的交互和共享,电力数据的内外部网络环境与安全形势日趋复杂化,数据流通的脆弱性风险加剧。首先,分析新型电力系统下数据流的类型与特性,概括电力数据流通安全防... 新型电力系统建设涉及多业务系统、多部门、多方主体间进行海量、异构数据的交互和共享,电力数据的内外部网络环境与安全形势日趋复杂化,数据流通的脆弱性风险加剧。首先,分析新型电力系统下数据流的类型与特性,概括电力数据流通安全防护面临的新形势;其次,基于专用数据处理器(DPU)的高性能流量编排和多功能安全网关能力,构建面向电力数据跨域流通安全增强的泛安全边界,凭借数据面可编程技术沟通网络安全与数据安全双维度安全能力,提出基于DPU的数据跨域流通协同防护技术应用方案;最后,阐释DPU在不同电力通信网络层次的部署方式、价值与关键技术,分析现阶段DPU在电力领域应用存在的挑战。 展开更多
关键词 新型电力系统 数据流通 专用数据处理器 数据安全 网络安全 安全防护
下载PDF
数据要素在医疗健康领域的内涵、价值与应用 被引量:3
5
作者 朱庆华 王晰 赵宇翔 《图书情报知识》 CSSCI 北大核心 2024年第2期13-17,共5页
十七部门联合发布的《“数据要素×”三年行动计划(2024—2026年)》引发了社会的广泛关注。本文首先探讨医疗健康领域数据要素的本质、分类及其重要性。在此基础上,提出促进医疗健康数据融合创新的关键策略,包括通过技术赋能医疗健... 十七部门联合发布的《“数据要素×”三年行动计划(2024—2026年)》引发了社会的广泛关注。本文首先探讨医疗健康领域数据要素的本质、分类及其重要性。在此基础上,提出促进医疗健康数据融合创新的关键策略,包括通过技术赋能医疗健康数据的采集,推动医疗健康数据的整合与标准化工作,促进医疗健康数据的开放和共享,以及加强对医疗健康数据的安全保护。 展开更多
关键词 医疗健康领域 数据要素 数据标准化 数据开放共享 数据安全
下载PDF
数字化铀矿勘查服务平台数据资源共享与安全策略 被引量:1
6
作者 孔维豪 刘洋 +5 位作者 陈霜 朱鹏飞 蔡煜琦 李晓翠 刘琳莹 王思宇 《铀矿地质》 CSCD 2024年第1期171-180,共10页
随着“数字核工业”建设的全面铺开,数据资源成为铀矿地质勘查业务中不可或缺的核心生产要素。核工业北京地质研究院基于开源软件架构,研发了基于统一架构、研产一体的“数字化铀矿勘查服务平台”,该平台是基于各类实用型软件功能和丰... 随着“数字核工业”建设的全面铺开,数据资源成为铀矿地质勘查业务中不可或缺的核心生产要素。核工业北京地质研究院基于开源软件架构,研发了基于统一架构、研产一体的“数字化铀矿勘查服务平台”,该平台是基于各类实用型软件功能和丰富的勘查数据资源开展数据共享与应用,在铀矿地质勘查工作中提高勘查效率和准确性的一种服务型软件系统。为了满足铀矿地质勘查不同类型的数据及服务需求,建立了一套较为健全的数据资源和服务体系,提供了一批基础地质、铀矿勘查物化探等相关数据资源,并严格划分数据权限和用户权限,实现根据数据所有权划分审批权限的功能。同时,在国家网络安全和信息安全的要求下,开展了数据安全策略研究,以保障平台安全稳定运行。面向四代勘查项目,面向铀矿地质勘查领域,初步构建了“快速存储、方便查询、灵活调用、共享发布、动态更新、分析应用”的数据资源管理、共享和应用服务平台。 展开更多
关键词 开源 数据资源 数据共享 数据安全
下载PDF
政府数据开放到公共数据开放的嬗变 被引量:2
7
作者 赵需要 姬祥飞 樊振佳 《情报理论与实践》 CSSCI 北大核心 2024年第4期50-58,83,共10页
[目的/意义]分析政府数据开放到公共数据开放的嬗变有利于数据开放活动的健康发展,促进数据要素流通。[方法/过程]在梳理政府数据开放和公共数据开放两者关系基础上,从创新扩散理论出发分析嬗变的三维度表现及嬗变动力。[结果/结论]嬗... [目的/意义]分析政府数据开放到公共数据开放的嬗变有利于数据开放活动的健康发展,促进数据要素流通。[方法/过程]在梳理政府数据开放和公共数据开放两者关系基础上,从创新扩散理论出发分析嬗变的三维度表现及嬗变动力。[结果/结论]嬗变动力共有技术、组织和环境三个维度下的9个关键驱动因素,并提出了6个嬗变的趋势。 展开更多
关键词 公共数据开放 政府数据开放 数据要素 数据 创新扩散
下载PDF
企业数据权益论 被引量:9
8
作者 程啸 《中国海商法研究》 CSSCI 2024年第1期50-63,共14页
企业对其生产和处理的数据享有的利益应受法律保护,然而现行的物权法、合同法、知识产权法和反不正当竞争法等民事法律制度都不足以实现对企业数据的全面保护,故应当确立企业对其数据享有一种独立的、新型的财产权,即企业数据权益。企... 企业对其生产和处理的数据享有的利益应受法律保护,然而现行的物权法、合同法、知识产权法和反不正当竞争法等民事法律制度都不足以实现对企业数据的全面保护,故应当确立企业对其数据享有一种独立的、新型的财产权,即企业数据权益。企业数据权益的确权应当采取单一路径,不应区分数据、数据资源和数据产品或数据的生产与流通而分别确权。企业对其数据享有的权益具有排他效力,但是该排他性受制于数据上其他参与方的权益,即个人信息权益及数据来源者权利。数据资源持有权、数据加工使用权和数据产品经营权并非是企业数据权益的内容,企业对其数据享有的权益的内容仍应从占有、使用、收益和处分等方面加以界定。 展开更多
关键词 数据产权 企业数据权益 个人数据 数据来源者权利 数据二十条》
下载PDF
我国地方数据政策体系的构建进展与展望 被引量:1
9
作者 周文泓 代林序 +1 位作者 吴一凡 吴琼 《情报理论与实践》 CSSCI 北大核心 2024年第8期201-210,共10页
[目的/意义]研究我国地方数据政策体系的构建情况,旨在明确各地数据政策制定的进展与提点,进而推动政策体系的优化建设。[方法/过程]对31个省级政府的数据政策进行统计,并采用文本分析法梳理政策的总体内容框架,基于此,对比与解析政策... [目的/意义]研究我国地方数据政策体系的构建情况,旨在明确各地数据政策制定的进展与提点,进而推动政策体系的优化建设。[方法/过程]对31个省级政府的数据政策进行统计,并采用文本分析法梳理政策的总体内容框架,基于此,对比与解析政策内容的地区差异。[结果/结论]我国地方数据政策的发布可划分为国家信息化发展时期、大数据发展时期以及数据要素市场化时期三个阶段;政策总体内容框架包含数据基本内涵、数据资源建设、数据共享、数据开放、数据资产化、数据安全6大要点;不同地区涵盖上述政策要点的程度不同,也显示了我国数据政策在地方层面的特点。由此,我国地方数据政策需进一步面向多元数据对象、多层数据行动、多元责任主体,实现内容的体系化建设,并为国家数据政策体系的优化发展提供参考。 展开更多
关键词 地方政府 数据政策 数据共享 数据开放 数据要素 数据安全
下载PDF
国内数据资产研究现状和研究前沿分析 被引量:2
10
作者 韩秀兰 崔梦韬 李宝瑜 《统计与决策》 CSSCI 北大核心 2024年第12期18-23,共6页
为了解数据资产领域的研究现状,探索其研究热点和前沿,文章使用CiteSpace软件,从发文时间、作者、机构以及关键词等角度对数据资产领域进行可视化分析,研究对象为2004—2021年CNKI数据库中的中文相关文献。研究发现:随着社会的发展,对... 为了解数据资产领域的研究现状,探索其研究热点和前沿,文章使用CiteSpace软件,从发文时间、作者、机构以及关键词等角度对数据资产领域进行可视化分析,研究对象为2004—2021年CNKI数据库中的中文相关文献。研究发现:随着社会的发展,对“数据资产”这一主题的关注度逐渐提高,但该领域的研究仍处于初级阶段,研究体系还不够成熟,该领域具有一定的研究前景。在该领域中,发文机构合作和作者合作已成为常态,但机构合作多局限于同一地区,而发文作者在机构内部和机构外部均有合作。关键词的聚类结果反映出数据资产化和数据治理及应用研究是该领域当前的热点。关键词突变分析结果表明,数据资产的定义、核算范围、估价方式以及管理成为研究重点,然而数据资产定义不一、确权困难、划分范围不明确以及估价方式繁多等问题为数据资产的研究带来困难。 展开更多
关键词 数据资产 数据治理 文献计量分析 数据可视化
下载PDF
基于扎根理论的政府开放数据价值影响因素研究 被引量:2
11
作者 马捷 栾泽权 +1 位作者 张超 孙文晶 《情报理论与实践》 CSSCI 北大核心 2024年第5期87-95,共9页
[目的/意义]政府开放数据价值是数字经济情境下个体数据行为嬗变的反馈性标志。从政府开放数据使用者视角识别其价值要素,对于促进政府数据管理水平,提升数据交易常态化具有理论和实践意义。[方法/过程]利用会议、访谈与网络数据获取原... [目的/意义]政府开放数据价值是数字经济情境下个体数据行为嬗变的反馈性标志。从政府开放数据使用者视角识别其价值要素,对于促进政府数据管理水平,提升数据交易常态化具有理论和实践意义。[方法/过程]利用会议、访谈与网络数据获取原始资料,结合扎根理论,构建“三维—多层”的数据价值影响因素模型,涵盖121个初始概念、30项范畴和9项主范畴,各领域受访者共33位。[结果/结论]个体感知数据价值影响因素主要涉及需求、进路、市场化三个维度,综合考察各项主范畴,针对数据价值的内在关联以及外部机制,可以提炼出直接、间接、跨层、双元4种关系结构。这个过程在理论上弥补了传统政务体系下政府开放数据与个体需求二元割裂之不足,延展了政府开放数据的价值使用行为与价值释放路径。 展开更多
关键词 政府开放数据 数据价值 影响因素 扎根理论 数据交易
下载PDF
数据产权法律构造论 被引量:18
12
作者 冯晓青 《政法论丛》 CSSCI 北大核心 2024年第1期120-136,共17页
在数字经济环境中,数据已成为一种新型生产要素,需要更好地挖掘和开发其经济价值。数据不同于传统有体物以及知识产权客体的特征和属性使其在法律制度构建和运行上也具有特殊性。数据产权制度是数据基础制度的核心内容,其应涵盖保护数... 在数字经济环境中,数据已成为一种新型生产要素,需要更好地挖掘和开发其经济价值。数据不同于传统有体物以及知识产权客体的特征和属性使其在法律制度构建和运行上也具有特殊性。数据产权制度是数据基础制度的核心内容,其应涵盖保护数据主体合法权益、协调和平衡数据利益关系、促进数据有序流动和分享、促进数据要素利益公平分配等内容。数据产权的法律构造旨在建立数据资源持有权、数据加工使用权和数据产品经营权的数据动态流转和价值实现机制,最终服务于数字经济发展目标。 展开更多
关键词 数据产权 法律构造 数据资源持有权 数据加工使用权 数据产品经营权 公共领域
下载PDF
基于密度划分的分布式数据容错存储算法研究 被引量:2
13
作者 翁锦阳 朱铁兵 柏志安 《吉林大学学报(信息科学版)》 CAS 2024年第1期67-73,共7页
为保证数据安全性,缓解数据存储空间,提出基于密度划分的分布式数据容错存储算法。过滤分布式数据高密度数据区域,将具有高度相似的目标划分到不同区域,通过数据来源样本点描述数据的密度分布,设定数据弹性,利用概率以及数据粒度推算出... 为保证数据安全性,缓解数据存储空间,提出基于密度划分的分布式数据容错存储算法。过滤分布式数据高密度数据区域,将具有高度相似的目标划分到不同区域,通过数据来源样本点描述数据的密度分布,设定数据弹性,利用概率以及数据粒度推算出对应的存储梯度和强度指数,并在信息存储中引入数据存储梯度和数据弹性,完成分布式数据容错存储。实验证明,所提算法有较高的容错性,带宽吞吐量平稳,平均路径长度较小,能提高网络数据的安全性。 展开更多
关键词 密度划分 分布式数据 数据容错存储 数据粒度 强度指数
下载PDF
数据要素市场化配置的法治推进——兼论《数据二十条》相关条款设计 被引量:8
14
作者 陈兵 《上海大学学报(社会科学版)》 CSSCI 北大核心 2024年第1期1-13,共13页
数据要素市场化配置的程度与水平决定了充分释放数据要素动能的程度,对加快数据产业链、价值链重构与转型升级意义重大。数据要素市场化配置的前提是明确数据产权归属,基础是构建统一开放的数据要素市场,发展是健全高效的定价机制,底线... 数据要素市场化配置的程度与水平决定了充分释放数据要素动能的程度,对加快数据产业链、价值链重构与转型升级意义重大。数据要素市场化配置的前提是明确数据产权归属,基础是构建统一开放的数据要素市场,发展是健全高效的定价机制,底线是保障数据要素安全发展。我国虽已明确了数据这一新型生产要素的重要地位,但相关法律尚未明确数据的产权归属,全国统一的数据要素市场尚未建立,数据要素定价机制尚未明确,数据要素市场交易与监管的边界也尚未清晰,所有这些阻碍了数据要素市场化配置的充分实现。故需立足数据要素市场的特征与现实,以数据产权结构性分置制度促进数据动态权属流动,构建统一开放的数据要素交易市场机制,同时厘清数据监管边界,保障数据要素市场安全发展,实现数据要素高水平、高质量、高效率的市场化配置。 展开更多
关键词 数据要素市场化配置 数据二十条》 数据权属 数据安全 法治推进
下载PDF
公共数据进入数据要素市场模式研究 被引量:7
15
作者 范佳佳 《信息资源管理学报》 CSSCI 2024年第2期68-81,共14页
公共数据是数据要素市场的重要组成部分,其如何进入数据要素市场以及其参与数据要素市场的模式分为几类,学界对此少有研究。通过梳理和比较,深入挖掘国内外公共数据参与数据要素市场的模式类型,归纳得出公共数据进入数据要素市场有两大... 公共数据是数据要素市场的重要组成部分,其如何进入数据要素市场以及其参与数据要素市场的模式分为几类,学界对此少有研究。通过梳理和比较,深入挖掘国内外公共数据参与数据要素市场的模式类型,归纳得出公共数据进入数据要素市场有两大类、五种模式,包括一级市场(授权运营)+二级市场(场内交易)模式,公共数据开发利用+场外交易模式,依托数据平台构建公共数据流通市场模式,借助数据经纪商、数据中介的交易模式,以及通过(公共)数据信托参与数据市场模式等。在此归纳基础上,演绎出公共数据进入数据要素市场的理想模式,这一理想模式分为数据获取、数据产品生产、数据产品交易三个各有其独特特征的环节,可为我国公共数据进入数据要素市场的策略选择提供参考。 展开更多
关键词 公共数据 数据要素市场 公共数据授权运营 公共数据交易 数据信托模式
下载PDF
协同过滤下混合大数据无损挖掘算法研究 被引量:4
16
作者 卢思安 刘江平 《计算机仿真》 2024年第4期485-488,共4页
大数据具有大规模性、多样性以及价值性,由于海量数据间的较高相似度,导致数据挖掘过程易受冗余干扰,出现数据丢失、损坏等问题。为解决上述问题,提出基于协同过滤算法的混合大数据无损挖掘方法。对混合大数据集成预处理,去除冗余,将不... 大数据具有大规模性、多样性以及价值性,由于海量数据间的较高相似度,导致数据挖掘过程易受冗余干扰,出现数据丢失、损坏等问题。为解决上述问题,提出基于协同过滤算法的混合大数据无损挖掘方法。对混合大数据集成预处理,去除冗余,将不同来源的相同数据无损融合。采用协同过滤算法的时间衰减函数,计算挖掘项目间相似性。在混合大数据特征关联度的约束下,实现混合大数据无损挖掘。实验结果表明,所提方法应用下,混合大数据量高达25000MB时,数据挖掘所需时间仅为45ms左右,且挖掘精度高达95%以上,数据挖掘结果与目标具有一致性。 展开更多
关键词 协同过滤算法 混合大数据 无损挖掘 数据清理 数据集成
下载PDF
基于单篇高被引数据论文的多层级数据再利用主题差异分析 被引量:1
17
作者 刘桂锋 于若凡 +1 位作者 韩牧哲 苏文成 《情报理论与实践》 CSSCI 北大核心 2024年第5期105-113,共9页
[目的/意义]在当今“数据密集型”时代,科学数据的重要性不断凸显,深入研究数据论文的利用价值有助于推动科学数据的开放和共享。[方法/过程]文章以单篇高被引论文为研究对象,根据对其不同的引证层级构建文献集合,通过对两个引证文献集... [目的/意义]在当今“数据密集型”时代,科学数据的重要性不断凸显,深入研究数据论文的利用价值有助于推动科学数据的开放和共享。[方法/过程]文章以单篇高被引论文为研究对象,根据对其不同的引证层级构建文献集合,通过对两个引证文献集合论文的关键词统计和聚类分析,对其主题团簇的差异性进行对比和分析,进而揭示数据论文的多层级数据再利用和特征演化情况。[结果/结论]研究发现,不同层级的数据再利用扩展出了不同细度的研究主题,体现了数据论文知识扩散的模式和规律。 展开更多
关键词 科学数据 数据论文 高被引论文 数据再利用 主题差异 数据管理
下载PDF
信息资源管理学科视角下的数据要素研究 被引量:4
18
作者 孙建军 李阳 《图书情报知识》 CSSCI 北大核心 2024年第2期6-12,共7页
[目的/意义]数字经济背景下,信息资源管理学科需要进一步融入到数据要素化市场建设之中,积极建构新的学术增长点。[研究设计/方法]首先分析信息资源管理学科与数据要素的关联逻辑以及学科的角色建构问题,而后介绍信息资源管理学科视域... [目的/意义]数字经济背景下,信息资源管理学科需要进一步融入到数据要素化市场建设之中,积极建构新的学术增长点。[研究设计/方法]首先分析信息资源管理学科与数据要素的关联逻辑以及学科的角色建构问题,而后介绍信息资源管理学科视域下的若干核心议题,最后对两者融合的未来发展提出思考。[结论/发现]数据要素研究是信息资源管理学科的新领域和新方向,应充分发挥学科特色和优势,有组织地推进数据要素研究与实践。[创新/价值]从信息资源管理学科视域思考数据要素研究,为进一步扩大学科研究视野、拓展学科研究空间提供启示,为数据要素化与数字经济发展中的学科话语建构提供参考。 展开更多
关键词 信息资源管理 图情档 数据要素 数字经济 数据资源
下载PDF
科技情报智慧数据服务体系建设研究 被引量:2
19
作者 丁洁兰 钱力 +1 位作者 常志军 张智雄 《情报理论与实践》 CSSCI 北大核心 2024年第1期30-37,共8页
[目的/意义]在数据驱动环境下,科技情报工作愈加重视基于数据的循证分析,建设智慧数据服务体系是科技情报工作向数据驱动赋能转型的重要动力。[方法/过程]界定了智慧数据服务的概念内涵与外延,从数据视角与服务视角两个维度出发阐述了... [目的/意义]在数据驱动环境下,科技情报工作愈加重视基于数据的循证分析,建设智慧数据服务体系是科技情报工作向数据驱动赋能转型的重要动力。[方法/过程]界定了智慧数据服务的概念内涵与外延,从数据视角与服务视角两个维度出发阐述了智慧数据服务的特点,论述了科技情报智慧数据服务体系的建设目标;以此为基础,依据从数据到情报的服务逻辑与层级,提出了科技情报智慧数据服务体系的内容架构与建设模式。[结果/结论]从数据供给站、数据超市、数据应用产品、数据服务中台4个方面构建科技情报智慧数据服务体系,前两者侧重数据供给型服务,旨在满足用户的数据型需求,后两者侧重数据感知型服务,旨在满足用户的情报型需求;提出需求与建设并行、治理与协同并行、技术与内容并行、质控与运营并行的“四个并行”建设模式;并以中国科学院文献情报中心的智慧数据服务体系建设为案例,阐述了智慧数据服务体系的应用落地。 展开更多
关键词 智慧数据 智慧数据服务 服务体系 科技情报
下载PDF
考虑载客状态的改进孤立森林浮动车异常数据检测算法 被引量:2
20
作者 任其亮 徐韬 +1 位作者 刘媛 程龙春 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第1期124-131,共8页
为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S... 为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S)、三阶求和平均差分(DTA)的二维度空间SDTA特征向量;提出差额累计更新和动态区分辨识的改进孤立森林IIForest算法,通过设置停止阈值参数,避免当出现新样本异常值分数大于停止阈值时,仅更新样本不更新孤立森林模型的问题,设计每个二叉树区分辨识度参数,区分辨识度位于停止区间时停止二叉树生长,提高算法收敛性能,以ROC(Receiver Operating Characteristic)曲线下面积AUC(Area Under ROC Cure)、F1-score为指标对模型精度进行对比分析,并以重庆市中心城区学府大道开展实例验证。结果表明:本文S-DTA-IIForest组合算法AUC、F1-score分别为86.63%、0.89,AUC较传统孤立森林IForest(Isolation Forest)提高32.4%,运行效率提高1.29%,具有收敛速度更快、精度更高的优势,载客条件下模型AUC、F1-score较未载客分别提高7.7%、10.8%,组合算法对载客数据有更高的检测精度,且未载客状态数据异常率较载客状态增加71.4%,未载客数据异常率更高。 展开更多
关键词 智能交通 异常数据检测 改进孤立森林 浮动车数据 S-DTA算法
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部