期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
融合深度神经网络特征的ARIMAX雾霾PM2.5预测
1
作者 张钰洁 王钰 杨杏丽 《计算机技术与发展》 2023年第2期167-172,共6页
目前,雾霾污染问题是关乎国计民生的重大问题,它已经对人们的生产、生活、身体健康,以及生态环境和气候变化都产生了很大的影响。这样,如何通过监测雾霾变化获取的雾霾相关信息去准确预测雾霾污染物的浓度,以防治和减轻雾霾造成的严重... 目前,雾霾污染问题是关乎国计民生的重大问题,它已经对人们的生产、生活、身体健康,以及生态环境和气候变化都产生了很大的影响。这样,如何通过监测雾霾变化获取的雾霾相关信息去准确预测雾霾污染物的浓度,以防治和减轻雾霾造成的严重后果变得尤为重要。因此,通过在简单有效的传统ARIMAX模型基础上融入深度神经网络语义特征,提出了一种新的雾霾PM2.5浓度预测框架。首先,把对雾霾预测有显著影响的气象因子温度、压力、相对湿度数据转换为图像数据;然后,运用ResNet-50(Residual Network-50)卷积神经网络模型提取深度语义特征,进而运用主成分分析(Principal Component Analysis,PCA)技术处理高维特征,得到最佳深度神经网络特征组合;最后,用ARIMAX技术建立雾霾PM2.5浓度预测模型。在收集的山西省2015~2019年PM2.5浓度和气象因子数据集上验证了该预测框架在皮尔逊相关系数(Pearson’s Correlation Coefficient,PCC)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)度量下,对于1、3、5和7天长短期预测,都始终优于传统的简单差分自回归滑动平均(Autoregressive Integrated Moving Average,ARIMA)模型、三因素ARIMAX模型、多元回归模型、ResNet-多元回归模型、长短期记忆网络(Long and Short-Term Memory,LSTM)模型和支持向量机(Support Vector Machine,SVM)模型。 展开更多
关键词 PM2.5预测 ARIMAX模型 ResNet神经网络 主成分分析技术 深度语义特征
下载PDF
分类学习算法的性能度量指标综述 被引量:21
2
作者 杨杏丽 《计算机科学》 CSCD 北大核心 2021年第8期209-219,共11页
在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各... 在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各性能度量指标的提出背景、意义以及适用范围,分析了各种性能度量之间的差异,提出和分析了各方法中有待进一步研究的问题和方向。进一步,通过实验数据横向(每类度量中各方法之间的类内差异)和纵向(3类度量之间的类间差异)对照了各性能度量指标之间的差异,分析了各性能度量指标在分类算法选择上的一致性。 展开更多
关键词 性能度量 错误率 混淆矩阵 统计检验
下载PDF
基于组块3×2交叉验证的预测误差估计的方差 被引量:1
3
作者 杨杏丽 王钰 +1 位作者 王瑞波 李济洪 《应用概率统计》 CSCD 北大核心 2014年第4期372-380,共9页
本文对文献中新提出的预测误差的组块3×2交叉验证估计的方差进行了研究,给出了其方差的更为精细的表达式,且从理论上证明了不存在其方差的通用(对所有分布都适用的)无偏估计.
关键词 组块3×2交叉验证 无偏估计 预测误差估计的方差
下载PDF
山西大学网络空间安全研究生创新人才培养探索
4
作者 杨杏丽 王钰 《无线互联科技》 2021年第14期161-163,166,共4页
网络空间安全学科是我国2015年新增设的一级学科,该学科的建立反映了社会对该学科领域人才的重大需求。网络空间安全是实践性特别强且多学科交叉渗透的一门新兴学科,如何有效培养网络空间安全人才,已经是各大高校的重要任务之一。根据... 网络空间安全学科是我国2015年新增设的一级学科,该学科的建立反映了社会对该学科领域人才的重大需求。网络空间安全是实践性特别强且多学科交叉渗透的一门新兴学科,如何有效培养网络空间安全人才,已经是各大高校的重要任务之一。根据山西大学的实际情况,文章通过研究网络空间安全人才培养目前的现状和不足,从课程体系建设、教学模式、创新创业能力培养等方面探索网络空间安全研究生培养思路,尽早为山西省培养网络空间安全的高端人才。 展开更多
关键词 网络空间安全 人才培养 学科建设 创新实践
下载PDF
基于规则的中文阅读理解问题回答技术研究 被引量:1
5
作者 李济洪 杨杏丽 +2 位作者 王瑞波 张娜 李国臣 《中文信息学报》 CSCD 北大核心 2009年第4期3-9,共7页
该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则... 该文针对中文阅读理解问答中的时间、人物、地点、数值、实体、描述六类问题,制定了各类问题回答的启发式规则集。对规则集中每条规则赋予一个相应权值,利用正交表对各规则所对应的权值进行了调优选取,给出了各候选答案句基于相应规则的得分计算方法。该文方法在山西大学自主开发的中文阅读理解语料库CRCC v1.1上进行了实验,在整个语料库上得到了83.09%的HumSent准确率。为了与文献[10]中的最大熵方法比较,该文在与文献[10]中完全相同的训练集上调优规则的权值,在相同的测试集上测试,最终得到HumSent准确率81.13%,比最大熵的方法高大约1%,且在全部的六类问题上,该文方法的HumSent准确率都不低于最大熵方法。 展开更多
关键词 计算机应用 中文信息处理 阅读理解 问答系统 规则 正交表
下载PDF
高维回归中基于组块3×2交叉验证的调节参数选择
6
作者 李济洪 陈萌萌 杨杏丽 《云南师范大学学报(自然科学版)》 2015年第3期27-32,共6页
将组块3×2交叉验证方法用于高维回归中的调节参数选择.首先通过ISIS方法把模型的维数降低到样本个数以内,然后使用AENET方法对降维后的模型进行进一步的降维和参数估计,使用组块3×2交叉验证方法选择最佳的调节参数.综合考虑... 将组块3×2交叉验证方法用于高维回归中的调节参数选择.首先通过ISIS方法把模型的维数降低到样本个数以内,然后使用AENET方法对降维后的模型进行进一步的降维和参数估计,使用组块3×2交叉验证方法选择最佳的调节参数.综合考虑模拟实验中各种调节参数选择方法(AIC、BIC、EBIC、HBIC、5折交叉验证、组块3×2交叉验证)的EMSE值、方差以及计算复杂度,结果表明基于组块3×2交叉验证的方法是有其优势的. 展开更多
关键词 调节参数选择 组块3×2交叉验证 EMSE准则
下载PDF
基于正则化KL距离的交叉验证折数K的选择 被引量:4
7
作者 褚荣燕 王钰 +1 位作者 杨杏丽 李济洪 《计算机技术与发展》 2021年第3期52-57,共6页
在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不... 在机器学习中,K折交叉验证方法常常通过把数据分成多个训练集和测试集来进行模型评估与选择,然而其折数K的选择一直是一个公开的问题。注意到上述交叉验证数据划分的一个前提假定是训练集和测试集的分布一致,但是实际数据划分中,往往不是这样。因此,可以通过度量训练集和测试集的分布一致性来进行K折交叉验证折数K的选择。直观地,KL(Kullback-Leibler)距离是一种合适的度量方法,因为它度量了两个分布之间的差异。然而直接基于KL距离进行K的选择时,从多个数据实验结果发现随着K的增加KL距离也在增大,显然这是不合适的。为此,提出了一种基于正则化KL距离的K折交叉验证折数K的选择准则,通过最小化此正则KL距离来选择合适的折数K。进一步多个真实数据实验验证了提出准则的有效性和合理性。 展开更多
关键词 K折交叉验证 折数K的选择 KL(Kullback-Leibler)距离 正则化 机器学习
下载PDF
基于互信息F统计量特征选择技术的地基气象云图分类 被引量:4
8
作者 杨秋良 王钰 +1 位作者 杨杏丽 李济洪 《计算机与现代化》 2021年第2期18-23,29,共7页
在地基气象云图的云状(云类)识别研究中,基于局部二值模式(Local Binary Pattern,LBP)描述子的特征选择技术由于它的简单性和有效性成为最通用的方法。然而,LBP特征的高维特性使得云状识别的性能和计算开销不能令人满意。为此,本文提出... 在地基气象云图的云状(云类)识别研究中,基于局部二值模式(Local Binary Pattern,LBP)描述子的特征选择技术由于它的简单性和有效性成为最通用的方法。然而,LBP特征的高维特性使得云状识别的性能和计算开销不能令人满意。为此,本文提出一种基于互信息构造的F检验统计量的LBP特征选择算法,可以实现高维LBP特征的有效降维,同时保证云状识别的准确性,极大减少了特征选择过程的计算开销。 展开更多
关键词 地基气象云图 高维特征选择 互信息 F统计量 分类
下载PDF
方差正则化的分类模型选择准则 被引量:1
9
作者 房立超 王钰 +1 位作者 杨杏丽 李济洪 《计算机科学与探索》 CSCD 北大核心 2019年第3期457-467,共11页
在传统的机器学习中,模型选择常常是直接基于某个性能度量指标的估计本身进行,没有考虑估计的方差,但是这样的忽略极有可能导致错误模型的选择。于是考虑在分类模型选择研究中添加方差的信息的方法,以提高所选模型的泛化能力,即将泛化... 在传统的机器学习中,模型选择常常是直接基于某个性能度量指标的估计本身进行,没有考虑估计的方差,但是这样的忽略极有可能导致错误模型的选择。于是考虑在分类模型选择研究中添加方差的信息的方法,以提高所选模型的泛化能力,即将泛化误差性能度量指标的组块3×2交叉验证估计的方差估计作为正则化项添加到传统模型选择准则中,提出了一种新的方差正则化的分类模型选择准则。模拟和真实数据实验验证了在分类模型选择问题中,提出的模型选择准则相比传统方法选到正确分类模型的概率更大,验证了方差在模型选择中的重要性以及提出的模型选择准则的有效性。进一步,理论上证明了在二分类问题的模型选择中,该模型选择准则具有选择的一致性。 展开更多
关键词 模型选择 泛化误差 组块3×2交叉验证 方差正则化
下载PDF
基于网页在线工具的鼻咽癌个体化部位特异性复发转移条件风险预测模型的建立及验证:10,058例高发区鼻咽癌病例分析 被引量:5
10
作者 吴晨飞 吕佳蔚 +13 位作者 林丽 毛燕萍 邓滨 郑维泓 温丹菀 陈月 寇嘉 陈佛平 杨杏丽 郑子奇 李智轩 徐思思 马骏 孙颖 《癌症》 SCIE CAS 2021年第7期300-313,共14页
背景与目的条件生存(conditional survival,CS)将患者现有的生存时间纳入分析,可提供动态的预后预测。目前,尚缺乏高发区鼻咽癌(nasopharyngeal carcinoma,NPC)的CS数据。本研究旨在对高发区NPC进行分析,建立基于网页在线工具的个体化... 背景与目的条件生存(conditional survival,CS)将患者现有的生存时间纳入分析,可提供动态的预后预测。目前,尚缺乏高发区鼻咽癌(nasopharyngeal carcinoma,NPC)的CS数据。本研究旨在对高发区NPC进行分析,建立基于网页在线工具的个体化部位特异性复发转移条件风险预测模型。方法采用大数据智能平台和NPC单病种数据库,对10,058例2009年4月至2015年12月之间,接受了调强放疗加或不加化疗治疗的高发区非转移性I–IVA期NPC患者进行分析。分别计算条件总生存(conditional overall survival,COS)、条件无病生存(conditionaldisease-freesurvival,CDFS)、条件无局部区域复发生存(conditional locoregional relapse-free survival,CLRRFS)、条件无远处转移生存(conditional distant metastasis-free survival,CDMFS)以及条件NPC特异生存(conditional NPC-specific survival,CNPC-SS)的粗估计值。逆概率加权法生成协变量调整的CS估计值。用竞争风险模型建立了一个预测模型,用来自另一个医院的、接受了调强放疗加或不加化疗治疗的非转移性I–IVA期NPC患者(n=601)的独立队列进行了外部验证。结果研究队列的中位随访时间为67.2个月。5年COS、CDFS、CLRRFS、CDMFS和CNPC-SS率分别由确诊时的86.2%、78.1%、89.8%、87.3%和87.6%,升高为诊断后生存3年时的87.3%、87.7%、94.4%、96.0%和90.1%。根据不同预后因素分组,各亚组中确诊时的各类CS差异明显,随着生存时间的延长,差异性消失;而根据年龄分组时,不同年龄组之间的CS呈现随时间持续增加的差异性。值得注意的是,对于确诊时认为预后差的患者,随着患者生存时间延长,其预后得到很大改善。为进行个体化CS预测,我们建立了一个基于网页在线工具的模型,用于评价各类复发转移的条件风险,局部复发(C指数,0.656)、区域复发(0.667)、骨转移(0.742)、肺转移(0.681)和肝转移(0.711),预测效力显著优于目前使用的分期系统(P <0.001)。在外部验证队列(中位随访时间为61.3个月)中进一步验证了这一模型的效能,C指数分别为0.672、0.736、0.754、0.663和0.721。结论本研究在迄今最大的队列中描述了高发区NPC的CS特性。我们建立了一个基于网页在线工具的模型,用于预测NPC部位特异性复发转移的CS,有助于建立个体化的、基于风险和时间变化的NPC随访策略。 展开更多
关键词 高发区鼻咽癌 条件生存 大数据 基于网页在线工具 个体化预测模型 总生存 无病生存 无局部区域复发生存 无远处转移生存 NPC特异性生存
下载PDF
财务分析在税收风险管理中的应用研究 被引量:2
11
作者 杨杏丽 《技术与市场》 2019年第12期207-208,共2页
近年来,我国对税收风险管理方面愈加重视,将实施税收风险管理作为税收征管改革的重点、难点,在纳税人风险管理实施过程中亟需具体的落地措施。阐述了财务分析的含义,通过了解财务分析应用于税收风险管理的重点内容,提出了税收风险管理... 近年来,我国对税收风险管理方面愈加重视,将实施税收风险管理作为税收征管改革的重点、难点,在纳税人风险管理实施过程中亟需具体的落地措施。阐述了财务分析的含义,通过了解财务分析应用于税收风险管理的重点内容,提出了税收风险管理中财务分析的应用对策,以期为提高税收风险管理水平提供可靠保障。 展开更多
关键词 财务分析 税收风险管理 重点
下载PDF
论人对产品质量的保证使用
12
作者 杨杏丽 《中国棉花加工》 1992年第3期33-33,共1页
产品质量是指产品的使用价值,指产品适合一定用途、能够满足国家建设和人民生活需要所具备的质量特性。它可概括为产品的性能、寿命、可靠性、安全性、经济性五个方面。产品这五个方面的特性又是通过其设计质量、制造质量、检验质量、... 产品质量是指产品的使用价值,指产品适合一定用途、能够满足国家建设和人民生活需要所具备的质量特性。它可概括为产品的性能、寿命、可靠性、安全性、经济性五个方面。产品这五个方面的特性又是通过其设计质量、制造质量、检验质量、使用质量来保证的。换句话说,产品质量是企业各部门的人的工作质量来保证的。即人是保证产品质量的关键。 展开更多
关键词 企业 职工素质 产品质量保证 工作质量 质量管理
下载PDF
县级财政预算管理存在的问题及对策研究
13
作者 杨杏丽 《科技经济市场》 2019年第11期16-17,共2页
近年来,随着社会经济的迅速发展,财政预算改革步伐不断加快,面对复杂的市场变化,完善预算管理,不仅能够降低行政成本,还能全面提升财政资金使用效率,对我国经济转型意义重大。为此,本文以县级财政为研究对象,在全面掌握了预算管理基本... 近年来,随着社会经济的迅速发展,财政预算改革步伐不断加快,面对复杂的市场变化,完善预算管理,不仅能够降低行政成本,还能全面提升财政资金使用效率,对我国经济转型意义重大。为此,本文以县级财政为研究对象,在全面掌握了预算管理基本概念的基础上,剖析了县级财政预算管理存在的问题,提出了完善县级财政局预算管理的对策,以进一步推进我国财政部门预算管理体制改革。 展开更多
关键词 预算管理 基本概念 问题 对策
下载PDF
县级财政内部控制优化
14
作者 杨杏丽 徐永正 《投资与创业》 2019年第11期198-199,共2页
伴随国民经济的不断增长,我国财政改革不断深入,高效的财政管理备受关注,在新经济背景下,我国行政事业单位内部控制体系愈加完善。本文结合内部控制相关概念,对县级财政内部控制进行了分析,并在此基础上,提出了优化县级财政内部控制的... 伴随国民经济的不断增长,我国财政改革不断深入,高效的财政管理备受关注,在新经济背景下,我国行政事业单位内部控制体系愈加完善。本文结合内部控制相关概念,对县级财政内部控制进行了分析,并在此基础上,提出了优化县级财政内部控制的相关对策及有效运行的保障措施。 展开更多
关键词 内部控制 优化对策 保障措施
下载PDF
遥感、地理信息系统和全球定位系统在林业中的应用和展望 被引量:3
15
作者 年学东 杨杏丽 《内蒙古林业调查设计》 1998年第3期113-114,共2页
遥感(RS)、地理信息系统(GIS)、全球定位系统(GPS)是近十几年迅速发展进来的一种空间信息获取和分析处理的综合性技术,它们与空间、电子、光学、地理学、地图学以及信息与计算机科学等一切处理和分析空间数据有关的学科... 遥感(RS)、地理信息系统(GIS)、全球定位系统(GPS)是近十几年迅速发展进来的一种空间信息获取和分析处理的综合性技术,它们与空间、电子、光学、地理学、地图学以及信息与计算机科学等一切处理和分析空间数据有关的学科有着密切的联系。已被广泛应用于林业... 展开更多
关键词 遥感 地理信息系统 GPS 林业 应用 展望
下载PDF
文本数据建模中的机器学习重抽样理论与方法
16
作者 李济洪 王钰 +5 位作者 王瑞波 杨杏丽 曹学飞 谷波 牛倩 薛彦 《中国科技成果》 2023年第12期25-27,共3页
在文本数据建模中,许多研究发现目前广泛使用的神经网络大模型,在常用的hold-outCV下,难以正确评估和优化模型,学习到的模型的预测性能稳定性也较差。为此,本课题研究和开发了一种统计机器学习新的重抽样方法,内容包括数据切分、模型的... 在文本数据建模中,许多研究发现目前广泛使用的神经网络大模型,在常用的hold-outCV下,难以正确评估和优化模型,学习到的模型的预测性能稳定性也较差。为此,本课题研究和开发了一种统计机器学习新的重抽样方法,内容包括数据切分、模型的超参数调优、模型评估指标的统计分布、多个模型聚合、模型比较的假设检验和置信度计算等,称为组块正则化交叉验证(mX2BCV)建模方法,并从统计机器学习的模型评估和选择的基础理论上,论证了该方法的优良性,最后,在汉语句法语义自动分析器的建模中,验证了方法的可行性和优良性,开发完成了一个高性能的汉语句法语义分析器,为基于文本数据的稳健建模开辟了新途径。 展开更多
关键词 文本数据 重抽样 组块正则化交叉验证 模型评估和选择 聚合模型
原文传递
基于K折交叉验证Beta分布的AUC度量的置信区间 被引量:11
17
作者 王钰 赵晓艳 +1 位作者 杨杏丽 李济洪 《系统科学与数学》 CSCD 北大核心 2020年第9期1564-1577,共14页
在统计机器学习研究中,基于K折交叉验证的AUC(Area Under ROC Curve)度量常常被用作分类算法性能的评价.然而,点估计显然没有考虑方差的信息,为此,基于正态假定的K折交叉验证t分布构造的AUC度量的通用对称置信区间(区间估计)被提出.但是... 在统计机器学习研究中,基于K折交叉验证的AUC(Area Under ROC Curve)度量常常被用作分类算法性能的评价.然而,点估计显然没有考虑方差的信息,为此,基于正态假定的K折交叉验证t分布构造的AUC度量的通用对称置信区间(区间估计)被提出.但是,这些对称置信区间往往表现出低的置信度或长的区间长度,从而容易导致激进的(liberal)统计推断结果.通过对AUC度量的理论分析,发现AUC度量的真实分布实际上是非对称的,此时简单使用对称分布去近似它显然是不合适的.因此,针对二类分类问题,本文提出了一种新的基于K折交叉验证Beta分布的AUC度量的非对称置信区间,在模拟和真实数据实验上验证了提出的置信区间相对于传统的基于K折交叉验证t分布的对称置信区间的优越性. 展开更多
关键词 AUC度量 置信区间 BETA分布 K折交叉验证
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部