期刊文献+
共找到1,366篇文章
< 1 2 69 >
每页显示 20 50 100
Cost-Aware Multi-Domain Virtual Data Center Embedding 被引量:1
1
作者 Xiao Ma Zhongbao Zhang Sen Su 《China Communications》 SCIE CSCD 2018年第12期190-207,共18页
Virtual data center is a new form of cloud computing concept applied to data center. As one of the most important challenges, virtual data center embedding problem has attracted much attention from researchers. In dat... Virtual data center is a new form of cloud computing concept applied to data center. As one of the most important challenges, virtual data center embedding problem has attracted much attention from researchers. In data centers, energy issue is very important for the reality that data center energy consumption has increased by dozens of times in the last decade. In this paper, we are concerned about the cost-aware multi-domain virtual data center embedding problem. In order to solve this problem, this paper first addresses the energy consumption model. The model includes the energy consumption model of the virtual machine node and the virtual switch node, to quantify the energy consumption in the virtual data center embedding process. Based on the energy consumption model above, this paper presents a heuristic algorithm for cost-aware multi-domain virtual data center embedding. The algorithm consists of two steps: inter-domain embedding and intra-domain embedding. Inter-domain virtual data center embedding refers to dividing virtual data center requests into several slices to select the appropriate single data center. Intra-domain virtual data center refers to embedding virtual data center requests in each data center. We first propose an inter-domain virtual data center embedding algorithm based on label propagation to select the appropriate single data center. We then propose a cost-aware virtual data center embedding algorithm to perform the intra-domain data center embedding. Extensive simulation results show that our proposed algorithm in this paper can effectively reduce the energy consumption while ensuring the success ratio of embedding. 展开更多
关键词 virtual data CENTER EMBEDDING MULTI-DOMAIN cost-aware LABEL PROPAGATION
下载PDF
WATERiD's Novel Methodology for Condition Assessment Cost Data Collection and Visualization
2
作者 Stephen M. Welling Sunil K. Sinha 《Journal of Civil Engineering and Architecture》 2015年第4期419-428,共10页
A profound understanding of the costs to perform condition assessment on buried drinking water pipeline infrastructure is required for enhanced asset management. Toward this end, an automated and uniform method of col... A profound understanding of the costs to perform condition assessment on buried drinking water pipeline infrastructure is required for enhanced asset management. Toward this end, an automated and uniform method of collecting cost data can provide water utilities a means for viewing, understanding, interpreting and visualizing complex geographically referenced cost information to reveal data relationships, patterns and trends. However, there has been no standard data model that allows automated data collection and interoperability across platforms. The primary objective of this research is to develop a standard cost data model for drinking water pipeline condition assessment projects and to conflate disparate datasets from differing utilities. The capabilities of this model will be further demonstrated through performing trend analyses. Field mapping files will be generated from the standard data model and demonstrated in an interactive web map created using Google Maps API (application programming interface) for JavaScript that allows the user to toggle project examples and to perform regional comparisons. The aggregation of standardized data and further use in mapping applications will help in providing timely access to condition assessment cost information and resources that will lead to enhanced asset management and resource allocation for drinking water utilities. 展开更多
关键词 Drinking water pipeline condition assessment water pipeline cost data.
下载PDF
Research Model of Churn Prediction Based on Customer Segmentation and Misclassification Cost in the Context of Big Data
3
作者 Yong Liu Yongrui Zhuang 《Journal of Computer and Communications》 2015年第6期87-93,共7页
Enterprises have vast amounts of customer behavior data in the era of big data. How to take advantage of these data to evaluate custom forfeit risks effectively is a common issue faced by enterprises. Most of traditio... Enterprises have vast amounts of customer behavior data in the era of big data. How to take advantage of these data to evaluate custom forfeit risks effectively is a common issue faced by enterprises. Most of traditional customer churn predicting models ignore customer segmentation and misclassification cost, which reduces the rationality of model. Dealing with these deficiencies, we established a research model of customer churn based on customer segmentation and misclassification cost. We utilized this model to analyze customer behavior data of a telecom company. The results show that this model is better than those models without customer segmentation and misclassification cost in terms of the performance, accuracy and coverage of model. 展开更多
关键词 BIG data CHURN Prediction CUSTOMER Segmentation MISCLASSIFICATION cost
下载PDF
基于医用耗材精细化管理的智能大数据成本分析研究 被引量:2
4
作者 秦雄妹 王宜威 《中国医疗设备》 2024年第1期125-132,共8页
目的 实现对医用耗材的智能大数据成本分析,提升医疗机构医用耗材成本控制管理水平。方法 基于医用耗材SPD精细化管理及供应链延伸服务,建立医用耗材商品字典多维度分类、科室成本核算分析、术式成本核算分析,引入BI智能大数据分析平台... 目的 实现对医用耗材的智能大数据成本分析,提升医疗机构医用耗材成本控制管理水平。方法 基于医用耗材SPD精细化管理及供应链延伸服务,建立医用耗材商品字典多维度分类、科室成本核算分析、术式成本核算分析,引入BI智能大数据分析平台工具,控制医用耗材使用及管理成本。选取2022年11月科室二级库房的补货流程中各环节花费时间为实验组数据。对照组由医护人员按照传统模式的业务步骤进行模拟计时,然后比较实验组和对照组在耗材申领、耗材核对、库房管理等业务步骤所花费的时间。结果 实现手术成本的动态透视多层级联动分析、医用耗材合理性使用智能分析,医护人员耗材管理事务所占用的时间由65.9 min减少至38.95 min,满意度由89.47%提升至94.74%。结论 通过医用耗材SPD精细化管理及智能大数据成本分析,细分医院内部医用耗材管理的颗粒度,降低医院耗占比,实现耗材管理效率提升和耗材成本下降双目标,对医疗机构医用耗材管理有一定的借鉴意义。 展开更多
关键词 医用耗材 SPD 智能大数据分析 成本控制
下载PDF
非均衡数据下基于注意力网络和代价敏感学习的轨面状态识别
5
作者 于惠钧 张锦圣 +3 位作者 刘建华 彭慈兵 刘丽丽 龚事引 《科学技术与工程》 北大核心 2024年第5期1972-1979,共8页
准确识别轨面状态,可为列车牵引/制动性能提升提供关键依据。重点针对传统代价敏感学习应用在非均衡轨面状态识别中存在的同类别样本重要性不同和多数类精度下降等问题,提出一种基于注意力网络和代价敏感学习的轨面状态识别方法。该法... 准确识别轨面状态,可为列车牵引/制动性能提升提供关键依据。重点针对传统代价敏感学习应用在非均衡轨面状态识别中存在的同类别样本重要性不同和多数类精度下降等问题,提出一种基于注意力网络和代价敏感学习的轨面状态识别方法。该法首先利用迁移学习思想将均衡数据集的特征迁移到非均衡轨面状态数据集,减轻少数类样本误分类影响;其次在骨干网络ResNet18中引入卷积注意力机制模块,增强网络对目标区域的特征学习能力和全局特征信息的感知性能,调整优化网络权重参数;最后构造依据轨面状态样本重要性大小的自适应加权平衡损失函数,降低决策边界对困难样本中多数类的过拟合,获得更加平滑的决策边界。非均衡数据下的实验结果表明,在3种非均衡比下,所提方法的准确率和召回率分别达到96.00%、90.67%、86.33%,与目前常用的方法Focal相比,分别提升了7.00%、2.34%、3.00%。此外,该方法在提高少数类召回率的同时可有效维持多数类的召回率,并且降低了网络训练时间成本。 展开更多
关键词 轨面状态识别 非均衡数据 代价敏感学习 注意力机制
下载PDF
大数据分析在医院成本管理中的应用研究
6
作者 许一路 孙静琴 许莹颖 《卫生经济研究》 北大核心 2024年第9期87-89,93,共4页
在大数据背景下,医院成本管理普遍存在成本数据缺乏精准性、分析应用能力不足及成本控制手段欠缺等问题,应将大数据分析和医院成本管理有效结合,建立医院成本数据仓库,采用数据挖掘手段分析医疗业务与成本数据的关联性,提高医院成本管... 在大数据背景下,医院成本管理普遍存在成本数据缺乏精准性、分析应用能力不足及成本控制手段欠缺等问题,应将大数据分析和医院成本管理有效结合,建立医院成本数据仓库,采用数据挖掘手段分析医疗业务与成本数据的关联性,提高医院成本管理能力,促进医疗业务和财务管理融合,加快医疗行业成本管理的发展。 展开更多
关键词 大数据分析 医院成本管理 成本数据标准化
下载PDF
Making Data-Driven Transportation Decisions for Freight Operations
7
作者 Kwabena Abedi Julius Codjoe Raju Thapa 《Journal of Transportation Technologies》 2023年第3期411-442,共32页
Using Louisiana’s Interstate system, this paper aims to demonstrate how data can be used to evaluate freight movement reliability, economy, and safety of truck freight operations to improve decision-making. Data main... Using Louisiana’s Interstate system, this paper aims to demonstrate how data can be used to evaluate freight movement reliability, economy, and safety of truck freight operations to improve decision-making. Data mainly from the National Performance Management Research Data Set (NPMRDS) and the Louisiana Crash Database were used to analyze Truck Travel Time Reliability Index, commercial vehicle User Delay Costs, and commercial vehicle safety. The results indicate that while Louisiana’s Interstate system remained reliable over the years, some segments were found to be unreliable, which were annually less than 12% of the state’s Interstate system mileage. The User Delay Costs by commercial vehicles on these unreliable segments were, on average, 65.45% of the User Delay Cost by all vehicles on the Interstate highway system between 2016 and 2019, 53.10% between 2020 and 2021, and 70.36% in 2022, which are considerably high. These disproportionate ratios indicate the economic impact of the unreliability of the Interstate system on commercial vehicle operations. Additionally, though the annual crash frequencies remained relatively constant, an increasing proportion of commercial vehicles are involved in crashes, with segments (mileposts) that have high crash frequencies seeming to correspond with locations with recurring congestion on the Interstate highway system. The study highlights the potential of using data to identify areas that need improvement in transportation systems to support better decision-making. 展开更多
关键词 FREIGHT Performance Measures TTTR Index Crash Rate data-DRIVEN User Delay cost
下载PDF
论中国数据跨境制度的现状、问题与纾困路径 被引量:2
8
作者 叶传星 闫文光 《北京航空航天大学学报(社会科学版)》 2024年第1期57-71,共15页
中国已经建立了以“安全评估、标准合同、保护认证”为核心、以行业规定为配套的数据跨境制度体系,形成了既保安全又促发展的中国方案。但在具体立法中,该制度在理论与实践上存在双重失衡,在理论上缺乏完善的基础理论支撑,在实践中未能... 中国已经建立了以“安全评估、标准合同、保护认证”为核心、以行业规定为配套的数据跨境制度体系,形成了既保安全又促发展的中国方案。但在具体立法中,该制度在理论与实践上存在双重失衡,在理论上缺乏完善的基础理论支撑,在实践中未能形成系统完整的制度体系,且其在适用关系上出现龃龉,与国际规则之间也存在割裂导致难以衔接,致使数据处理者在合规实践中面临较大成本,难以获得预期成效。不同于美国的“市场话语”和欧盟“权利本位”的数据跨境理论基础,中国应当基于国情明确利益平衡体系下的数据主权理论建构数据出境制度体系,矫正实践中过度保障安全的规制思路,通过单列安全评估、制定行业性与地方性特殊制度等措施,完善相关制度之间、国内法与国际规则之间的适用衔接,着力降低合规成本,保障制度落到实处。 展开更多
关键词 数据跨境 安全评估 标准合同 保护认证 数据主权理论 合规成本
下载PDF
数字平台个人数据可携带政策的竞争效应
9
作者 唐要家 单若彤 《产经评论》 北大核心 2024年第4期5-21,共17页
个人数据可携带政策是应对数字平台日益突出的数据垄断问题的重要反垄断监管政策,但是对于个人数据可携带政策的竞争效应,现有理论研究并没有给出明确的答案。构建在位者-进入者动态博弈模型来分析个人数据可携带政策的竞争效应,结果显... 个人数据可携带政策是应对数字平台日益突出的数据垄断问题的重要反垄断监管政策,但是对于个人数据可携带政策的竞争效应,现有理论研究并没有给出明确的答案。构建在位者-进入者动态博弈模型来分析个人数据可携带政策的竞争效应,结果显示:个人数据可携带政策总体上可以降低消费者转换成本,削弱在位平台的数据垄断势力,促进市场竞争并提高消费者总福利和社会总福利。但个人数据可携带政策的竞争促进效应具有明显的场景差异,在消费者面临网络关注转换成本情况下,其具有明显的竞争促进效应;在消费者面临个性化服务转换成本情况下,个人数据可携带政策虽然能在一定程度上缓解竞争扭曲,但无法根本改变在位平台的垄断化趋势。总体来说,个人数据可携带政策是应对数据垄断的可行反垄断政策选择,但政策实施要区分不同场景进行精准设计,以有效实现维护市场可竞争性的目标。 展开更多
关键词 数字平台 数据垄断 转换成本 个人数据可携带政策 反垄断
下载PDF
铁路数据资产流通价值下数据资产定价
10
作者 王雅 张博勇 +1 位作者 王旭琴 赵娅琴 《兰州交通大学学报》 CAS 2024年第4期10-16,共7页
随着大数据技术的发展,数据作为生产要素在经济中起到关键作用,企业逐渐开始利用大数据通过各种方式赋能,以求能给企业带来更大利益。交通是经济建设的“先行官”,铁路是交通体系的重要一环,其积累的大量数据资源具有极高的应用价值。... 随着大数据技术的发展,数据作为生产要素在经济中起到关键作用,企业逐渐开始利用大数据通过各种方式赋能,以求能给企业带来更大利益。交通是经济建设的“先行官”,铁路是交通体系的重要一环,其积累的大量数据资源具有极高的应用价值。铁路信息数据化的底层逻辑是通过对数据的开发和对数据进行二次分析,将数据跨行业、跨系统传递利用,从而推动数据价值的增值。本文结合铁路数据动态性复杂、保密性强等特点,挖掘铁路数据资产定价的影响因素,通过对传统定价方法进行改进,结合AHP分析法构建出更切合实际的铁路数据资产价值评估模型。 展开更多
关键词 铁路数据资产 数据价值评估 成本法
下载PDF
DNA测序首段信号数据特别处理方法研究
11
作者 贾二惠 张欣欣 +1 位作者 管桦 李明 《分析仪器》 CAS 2024年第4期59-63,共5页
针对荧光标记毛细管电泳DNA测序开始一段序列的信号杂乱特性以及不同碱基通道信号间的相对偏移问题,提出了一种用于首段信号特别处理的电泳迁移率自适应校正方法。分析设计基于四通道首段信号间峰重叠程度估计的运筹决策目标函数,通过... 针对荧光标记毛细管电泳DNA测序开始一段序列的信号杂乱特性以及不同碱基通道信号间的相对偏移问题,提出了一种用于首段信号特别处理的电泳迁移率自适应校正方法。分析设计基于四通道首段信号间峰重叠程度估计的运筹决策目标函数,通过目标函数动态寻优计算确定不同碱基通道信号的相对偏移系数,从而实现DNA测序首段信号的相对偏移校正,为提高首段信号碱基的合理判读及后续DNA精准排序提供了可靠的过程数据。 展开更多
关键词 DNA测序 毛细管电泳 首段信号 数据处理 目标函数 动态寻优
下载PDF
低成本地磁场监测设备的设计与实现
12
作者 孙路强 张明东 +1 位作者 康健 刘建波 《地震工程学报》 CSCD 北大核心 2024年第3期665-671,共7页
为能够在短时间内建成区域高密度地磁场观测台网,实现地磁场数据成网、成片观测,需要解决精准捕捉极震区特大震前磁场异常现象的问题。项目组利用物联网通信技术,基于RM3100三轴磁传感器,开发低成本地磁场监测设备,并部署在天津市宝坻... 为能够在短时间内建成区域高密度地磁场观测台网,实现地磁场数据成网、成片观测,需要解决精准捕捉极震区特大震前磁场异常现象的问题。项目组利用物联网通信技术,基于RM3100三轴磁传感器,开发低成本地磁场监测设备,并部署在天津市宝坻区、武清区,同时利用人工智能数据分析技术和时序数据存储技术,开展地震前兆异常自动判定和可视化预报技术研究。该成果在2022年6月23日天津宝坻M 2.0地震中得到了验证,说明低成本地磁场观测系统不仅对大震有察觉,对于近距离的中小地震同样敏感。 展开更多
关键词 地磁场 地震预报 低成本 高密度 大数据
下载PDF
个人数据主体收益权的理论迷思与制度选择
13
作者 袁康 刘羿鸣 《学习与实践》 北大核心 2024年第8期21-31,共11页
是否应以法定形式明确个人数据主体收益权,当前在理论界存在较大分歧。个人数据在数据价值链中的价值倍增,主要得益于数据处理者而非个人的投入,其体量上的规模性和分布上的碎片化决定了向个人分配收益存在经济性缺失,即设置个人数据主... 是否应以法定形式明确个人数据主体收益权,当前在理论界存在较大分歧。个人数据在数据价值链中的价值倍增,主要得益于数据处理者而非个人的投入,其体量上的规模性和分布上的碎片化决定了向个人分配收益存在经济性缺失,即设置个人数据主体收益权缺乏正当性和合理性基础。立法应对个人数据主体收益权采取“原则否定,约定例外”的态度,在个人数据价值的初次分配中放弃个人的法定收益权,但允许其以约定方式取得经济利益。同时,在保障个人数据主体在先权益的前提下,探索数据服务税、数据基金等集体利益实现机制,以体现个人在数据价值分配中的应有地位。 展开更多
关键词 个人数据主体 收益权 成本-收益分析 在先权益
下载PDF
数据要素与流通企业高质量发展 被引量:1
14
作者 杨向阳 徐从才 《商业经济与管理》 北大核心 2024年第3期5-17,共13页
作为新型生产要素,数据要素已快速融入生产、流通、消费等环节,深刻改变着经济运行过程与企业组织管理模式。基于2007—2021年我国沪深A股上市流通企业样本,尝试利用Python技术爬取年报中的数据要素关键词频并进行量化处理,由此从理论... 作为新型生产要素,数据要素已快速融入生产、流通、消费等环节,深刻改变着经济运行过程与企业组织管理模式。基于2007—2021年我国沪深A股上市流通企业样本,尝试利用Python技术爬取年报中的数据要素关键词频并进行量化处理,由此从理论和实证两个层次探究数据要素对流通企业高质量发展的影响及其作用机制。研究发现:数据要素能够显著促进流通企业高质量发展,这种结论在稳健性检验和内生性处理后仍然成立;数据要素主要通过降本增效与提质增效两种路径促进流通企业高质量发展,前者表现为以节约流通成本为核心的降低经营成本与扩大市场规模效应,后者表现为以提高流通速度为核心的促进市场匹配与增强部门协同效应;数据要素对流通企业高质量发展的促进作用存在明显异质性,这种作用在非国有企业、非零售行业以及大数据政策提出之后更显著。 展开更多
关键词 数据要素 流通企业 高质量发展 降本增效 提质增效
下载PDF
医院资源计划系统成本原子级数据治理及实践
15
作者 张琪 王晓飞 +1 位作者 徐正明 冯哲 《中国数字医学》 2024年第6期26-30,共5页
探讨面对医院成本管理复杂性高、难度大的挑战,如何借助医院资源计划(HRP)系统建立统一高效的成本管理体系。结合医院实践,通过构建面向成本管理的原子级数据治理体系和实践路径,逐步迭代优化HRP系统,最终实现对全院成本的精细化管理,... 探讨面对医院成本管理复杂性高、难度大的挑战,如何借助医院资源计划(HRP)系统建立统一高效的成本管理体系。结合医院实践,通过构建面向成本管理的原子级数据治理体系和实践路径,逐步迭代优化HRP系统,最终实现对全院成本的精细化管理,辅助管理决策,为各医疗机构建立HRP系统提供相关技术参考和行业思考。 展开更多
关键词 医院资源计划系统 成本管理 原子级数据治理
下载PDF
公立医院成本核算单元数据字典的构建与建议 被引量:1
16
作者 夏培勇 时玉梅 +2 位作者 徐迅 殷佳 李昌琪 《中国卫生信息管理杂志》 2024年第1期64-68,共5页
目的依据《公立医院成本核算规范》,探讨在医院全成本核算信息系统中如何构建成本核算单元数据字典。方法依据该规范对公立医院进行成本核实时建立单元字典的情况进行实证分析。结果归纳了该规范在实施中存在的难点及问题,提出了构建一... 目的依据《公立医院成本核算规范》,探讨在医院全成本核算信息系统中如何构建成本核算单元数据字典。方法依据该规范对公立医院进行成本核实时建立单元字典的情况进行实证分析。结果归纳了该规范在实施中存在的难点及问题,提出了构建一套科学、标准、有弹性的高质量单元数据字典的几点建议。结论完善成本核算单元数据字典是确保成本核算信息系统功能最大发挥的关键性工作,以确保高效、高质量医院管理的实现。 展开更多
关键词 医院 成本核算 数据字典 支付改革
下载PDF
面向非均匀分布数据的代价敏感标记分布学习
17
作者 樊俊 张恒汝 +1 位作者 余一帆 闵帆 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期40-50,共11页
标记歧义近年来在机器学习和数据挖掘领域备受关注.标记分布学习(LDL)通过为样本分配概率标记来解决标记歧义问题.现有的LDL方法主要是为处理训练数据均匀分布的情况而设计的.然而,在实际应用中,训练数据往往呈现非均匀分布.因此,提出... 标记歧义近年来在机器学习和数据挖掘领域备受关注.标记分布学习(LDL)通过为样本分配概率标记来解决标记歧义问题.现有的LDL方法主要是为处理训练数据均匀分布的情况而设计的.然而,在实际应用中,训练数据往往呈现非均匀分布.因此,提出了一种代价敏感的标记分布学习方法(CSLDL),用以处理这种非均匀分布的数据.通过充分利用样本的密度信息,设计了一种新的损失函数.首先,将描述度集平均划分为多个区间,并统计这些区间中的样本个数,从而推导出每个类别标记的经验密度向量.其次,为了确保不同区间之间的连续性,利用邻居来对目标区间的经验密度进行修正.将经验密度向量与对称核进行卷积,以使每个区间不仅考虑当前区间,还考虑附近区间.最后,利用修正后的密度向量构建代价矩阵,并结合Kullback-Leibler(K-L)散度来处理非均匀分布的训练数据.CSLDL在10个真实世界的数据集上与6种最先进的算法进行了对比实验.实验结果充分验证了提出的方法的有效性和优越性. 展开更多
关键词 标记分布学习 标记歧义 非均匀分布数据 代价敏感 样本密度
下载PDF
基于粒子群优化的面向数据异构的联邦学习方法
18
作者 徐奕成 戴超凡 +3 位作者 马武彬 吴亚辉 周浩浩 鲁晨阳 《计算机科学》 CSCD 北大核心 2024年第6期391-398,共8页
联邦学习是一种新兴的面向隐私保护的分布式机器学习框架,其核心特点是能够在不获取客户端原始数据的条件下实现分布式机器学习。客户端利用本地数据进行模型训练,然后将模型参数上传至服务端进行聚合,从而确保客户端数据始终得到保护... 联邦学习是一种新兴的面向隐私保护的分布式机器学习框架,其核心特点是能够在不获取客户端原始数据的条件下实现分布式机器学习。客户端利用本地数据进行模型训练,然后将模型参数上传至服务端进行聚合,从而确保客户端数据始终得到保护。在此过程中,存在频繁的参数传输导致的通信成本高昂问题和各客户端所拥有的非独立同分布异构数据问题,两者严重制约了联邦学习的应用。针对上述问题,提出了一种基于粒子群优化的面向数据异构的联邦学习方法——FedPSG,将客户端传输到服务器的数据形式由模型参数转变为模型分值,在每轮训练中只需要少部分客户端向服务器上传模型参数,从而降低通信成本;同时,提出了一种模型再训练策略,使用服务器数据对全局模型进行二次迭代训练,通过缓解数据异构问题对联邦学习的影响来进一步提升模型性能。模拟不同的数据异构环境,在MNIST,FashionMNIST与CIFAR-10数据集上进行实验,结果表明FedPSG能够有效提高模型在不同数据异构环境下的准确率,并且验证了模型再训练策略能有效解决客户端数据异构问题。 展开更多
关键词 联邦学习 粒子群算法 通信成本 数据异构 隐私保护
下载PDF
煤炭企业安全生产费用效率评价
19
作者 刘伟 董晓瑞 +1 位作者 于秀燕 李芊芊 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第1期43-49,共7页
为评估我国的煤炭企业安全生产费用效率,选用数据包络分析(DEA)方法,选取2012—2020年煤矿安全投入产出数据构建DEA模型,对煤炭企业每年的安全生产费用效率进行静态分析和评价;随后,利用Malmquist指数对煤炭企业安全生产费用效率作进一... 为评估我国的煤炭企业安全生产费用效率,选用数据包络分析(DEA)方法,选取2012—2020年煤矿安全投入产出数据构建DEA模型,对煤炭企业每年的安全生产费用效率进行静态分析和评价;随后,利用Malmquist指数对煤炭企业安全生产费用效率作进一步动态分析研究。研究结果表明:从静态分析来看,纯技术效率呈负增长趋势是阻碍综合效率增长的主要原因,煤炭企业安全生产费用应占营业收入的4.23%;从动态分析来看,技术进步和技术效率的提高都会相应提高Malmquist指数,提高我国煤炭企业全要素生产率指数的关键是提高技术进步指数。研究结果可为煤炭企业规范使用安全生产费用提供参考。 展开更多
关键词 煤炭企业 效率评价 数据包络分析(DEA) MALMQUIST指数 安全生产费用
下载PDF
基于代价敏感LightGBM的网购意愿预测研究
20
作者 罗咪 邱一卉 林建宗 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期232-240,共9页
[目的]由于购买商品的消费者数量远小于未购买商品的消费者数量,网购意愿预测研究是典型的不平衡数据分类问题.研究不平衡数据的分类问题以提升网购意愿预测的分类准确率,该问题主要存在少数类样本识别准确率远小于多数类样本的问题.[方... [目的]由于购买商品的消费者数量远小于未购买商品的消费者数量,网购意愿预测研究是典型的不平衡数据分类问题.研究不平衡数据的分类问题以提升网购意愿预测的分类准确率,该问题主要存在少数类样本识别准确率远小于多数类样本的问题.[方法]提出一种基于贝叶斯优化的代价敏感轻量梯度提升机(Light Gradient Boosting Machine, LightGBM)模型.首先引入误分类代价作为惩罚因子修正LightGBM的损失函数,其次通过阈值移动降低模型的分类阈值以提高针对少数类样本的预测准确率,最后利用贝叶斯优化算法优化误分类代价参数、分类阈值及其他参数.[结果]从KEEL数据库中选取5个典型的不平衡数据集进行对比实验,相较于标准LightGBM模型,改进LightGBM模型的AUC值和G-mean值均提升了10%左右;相较于遗传算法优化代价敏感LightGBM模型和粒子群优化代价敏感LightGBM模型,改进LightGBM模型的AUC值和G-mean值普遍提升了4%左右;相较于ADASYN-LightGBM模型和BorderlineSMOTE-LightGBM模型,改进LightGBM模型的AUC值和G-mean值普遍提升了3%左右.[结论]基于代价敏感学习在LightGBM损失函数中添加误分类代价作为惩罚因子,并通过阈值移动降低模型的分类阈值,同时利用贝叶斯优化算法优化代价敏感LightGBM模型中的误分类代价参数、分类阈值及其他参数,实现更高的少数类样本预测准确率,提升了网购意愿预测的分类准确率. 展开更多
关键词 不平衡数据 贝叶斯优化 代价敏感 LightGBM 网购意愿预测
下载PDF
上一页 1 2 69 下一页 到第
使用帮助 返回顶部