期刊文献+
共找到1,567篇文章
< 1 2 79 >
每页显示 20 50 100
Revisiting Akaike’s Final Prediction Error and the Generalized Cross Validation Criteria in Regression from the Same Perspective: From Least Squares to Ridge Regression and Smoothing Splines
1
作者 Jean Raphael Ndzinga Mvondo Eugène-Patrice Ndong Nguéma 《Open Journal of Statistics》 2023年第5期694-716,共23页
In regression, despite being both aimed at estimating the Mean Squared Prediction Error (MSPE), Akaike’s Final Prediction Error (FPE) and the Generalized Cross Validation (GCV) selection criteria are usually derived ... In regression, despite being both aimed at estimating the Mean Squared Prediction Error (MSPE), Akaike’s Final Prediction Error (FPE) and the Generalized Cross Validation (GCV) selection criteria are usually derived from two quite different perspectives. Here, settling on the most commonly accepted definition of the MSPE as the expectation of the squared prediction error loss, we provide theoretical expressions for it, valid for any linear model (LM) fitter, be it under random or non random designs. Specializing these MSPE expressions for each of them, we are able to derive closed formulas of the MSPE for some of the most popular LM fitters: Ordinary Least Squares (OLS), with or without a full column rank design matrix;Ordinary and Generalized Ridge regression, the latter embedding smoothing splines fitting. For each of these LM fitters, we then deduce a computable estimate of the MSPE which turns out to coincide with Akaike’s FPE. Using a slight variation, we similarly get a class of MSPE estimates coinciding with the classical GCV formula for those same LM fitters. 展开更多
关键词 Linear Model Mean Squared Prediction Error Final Prediction Error Generalized cross validation Least Squares Ridge Regression
下载PDF
基于Cross-Validation的小波自适应去噪方法 被引量:4
2
作者 黄文清 戴瑜兴 李加升 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第11期40-43,共4页
小波去噪算法中,阈值的选择非常关键.提出一种自适应阈值选择算法.该算法先通过Cross-Validation方法将噪声干扰信号分成两个子信号,一个用于阈值处理,一个用作参考信号;再采用最深梯度法来寻求一个最优去噪阈值.仿真和实验结果表明:在... 小波去噪算法中,阈值的选择非常关键.提出一种自适应阈值选择算法.该算法先通过Cross-Validation方法将噪声干扰信号分成两个子信号,一个用于阈值处理,一个用作参考信号;再采用最深梯度法来寻求一个最优去噪阈值.仿真和实验结果表明:在均方误差意义上,所提算法去噪效果优于Donoho等提出的VisuShrink和SureShrink两种去噪算法,且不需要带噪信号的任何'先验信息',适应于实际信号去噪处理. 展开更多
关键词 小波变换 cross-validation 自适应滤波 阈值
下载PDF
基于gBLUP方法及Cross-validation大豆表型精准预测研究 被引量:1
3
作者 唐友 郑萍 张继成 《青岛大学学报(自然科学版)》 CAS 2017年第1期56-59,共4页
为了实现提高产量和抵抗病害等能力的目的,需要提高育种水平,通过设计交差验证(Cross-Validation)实验进行大豆基因型和表型数据的分组处理,根据数据的个体和mark的数量进行合理分配,采用gBLUP(genomic Best Linear Unbiased Prediction... 为了实现提高产量和抵抗病害等能力的目的,需要提高育种水平,通过设计交差验证(Cross-Validation)实验进行大豆基因型和表型数据的分组处理,根据数据的个体和mark的数量进行合理分配,采用gBLUP(genomic Best Linear Unbiased Prediction)方法进行表型预测。根据对大豆数据多个性状通过不同分组的对比来得到精确值的范围,为后续的育种分析提供依据。对于只有大豆基因型数据而没有表型数据的情况,需要模拟表型,根据设定遗传力和模拟位点的个数(NQTN)进行模拟,然后再进行不同分组获取精准值,这样扩大了大豆数据的预测灵活性。 展开更多
关键词 交叉验证 表型预测 gBLUP 遗传力
下载PDF
基于Cross-Validation的电机故障诊断振动数据处理方法 被引量:6
4
作者 王惠中 乔林翰 +1 位作者 贺珂珂 段洁 《自动化仪表》 CAS 2018年第4期22-25,共4页
针对牵引电机故障诊断研究中所采用的神经网络方法,提出在模型训练阶段引入K折交叉验证。该方法在划分训练集与测试集期间,使验证集能够遍历所有数据集,从多方向开始学习,从而在一定程度上避免了局部极小的问题。训练完成后,以神经网络... 针对牵引电机故障诊断研究中所采用的神经网络方法,提出在模型训练阶段引入K折交叉验证。该方法在划分训练集与测试集期间,使验证集能够遍历所有数据集,从多方向开始学习,从而在一定程度上避免了局部极小的问题。训练完成后,以神经网络作为分类器进行故障识别。神经网络学习算法采用随机梯度下降的方法,每次投入一组数据集进行训练,大大提高了训练速度。Eclipse+Anaconda仿真结果证明:与传统神经网络电机故障诊断方法相比,该方法可以在一定程度上避免过拟合现象,同时避免局部极小。此外,在Matlab环境下,单独比较支持向量机采用交叉验证前后的故障分类效果。对比结果表明:交叉验证方法从多方向开始学习,对于提升故障诊断的准确率有较好作用。 展开更多
关键词 电机故障诊断 K折交叉验证 随机梯度下降 神经网络 拟合 支持向量机
下载PDF
非参数回归的L_1-Cross-Validation最近邻中位数估计的强相合性
5
作者 郑忠国 杨瑛 《甘肃科学学报》 1993年第3期14-19,共6页
考虑非参数回归模型Y<sub>i</sub>=g(x<sub>i</sub>)+e<sub>i</sub>,i≥1,其中g(x)是待估计的连续函数,{x<sub>i</sub>,i≥1}是非随机的,{e<sub>i</sub>,i≥1}是iid... 考虑非参数回归模型Y<sub>i</sub>=g(x<sub>i</sub>)+e<sub>i</sub>,i≥1,其中g(x)是待估计的连续函数,{x<sub>i</sub>,i≥1}是非随机的,{e<sub>i</sub>,i≥1}是iid随机误差,在本文中,我们讨论最近邻中位数估计(x)=m(Y<sub>(i(1)),…,Y<sub>i(h<sup>*</sup>)</sub></sub>=Yi(1),…,Y<sub>i(h<sup>*</sup>)</sub>之中位数,其中h<sup>*</sup>利用L<sub>1</sub>—Cross—Validation方法选择,在一定条件下,建立了L<sub>1</sub>—Cross—Validation最近邻中位数估计的强相合性。 展开更多
关键词 L1crossvalidation 非参数回归 最近邻中位数估计
下载PDF
非参数回归的L_1-cross-validation最近邻估计的强相合性
6
作者 杨瑛 《甘肃农业大学学报》 CAS CSCD 1993年第2期150-154,共5页
考虑非参数回归模型:Y_i=g(x_i)+e_i,i≥1,其中g是待估计的连续函数,{x_i,i≥1}是非随机的,{e_i,i≥1)是iid随机误差。在本文中,我们讨论最近邻估计g_(n,h)(x)=1/h∑Y_(R_(i,x)^(n)),其中h利用L_1-cross-validation方法选择,在一定条件... 考虑非参数回归模型:Y_i=g(x_i)+e_i,i≥1,其中g是待估计的连续函数,{x_i,i≥1}是非随机的,{e_i,i≥1)是iid随机误差。在本文中,我们讨论最近邻估计g_(n,h)(x)=1/h∑Y_(R_(i,x)^(n)),其中h利用L_1-cross-validation方法选择,在一定条件下,证明了L_1-cross-validation最近邻估计的强相合性。 展开更多
关键词 最近邻估计 强相合性 非参数回归
下载PDF
Fast cross validation for regularized extreme learning machine 被引量:9
7
作者 Yongping Zhao Kangkang Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2014年第5期895-900,共6页
A method for fast 1-fold cross validation is proposed for the regularized extreme learning machine (RELM). The computational time of fast l-fold cross validation increases as the fold number decreases, which is oppo... A method for fast 1-fold cross validation is proposed for the regularized extreme learning machine (RELM). The computational time of fast l-fold cross validation increases as the fold number decreases, which is opposite to that of naive 1-fold cross validation. As opposed to naive l-fold cross validation, fast l-fold cross validation takes the advantage in terms of computational time, especially for the large fold number such as l 〉 20. To corroborate the efficacy and feasibility of fast l-fold cross validation, experiments on five benchmark regression data sets are evaluated. 展开更多
关键词 extreme learning machine (ELM) regularization theory cross validation neural networks.
下载PDF
Efficient strategies for leave-one-out cross validation for genomic best linear unbiased prediction 被引量:3
8
作者 Hao Cheng Dorian J.Garrick Rohan L.Fernando 《Journal of Animal Science and Biotechnology》 SCIE CAS CSCD 2017年第3期733-737,共5页
Background: A random multiple-regression model that simultaneously fit all allele substitution effects for additive markers or haplotypes as uncorrelated random effects was proposed for Best Linear Unbiased Predictio... Background: A random multiple-regression model that simultaneously fit all allele substitution effects for additive markers or haplotypes as uncorrelated random effects was proposed for Best Linear Unbiased Prediction, using whole-genome data. Leave-one-out cross validation can be used to quantify the predictive ability of a statistical model.Methods: Naive application of Leave-one-out cross validation is computationally intensive because the training and validation analyses need to be repeated n times, once for each observation. Efficient Leave-one-out cross validation strategies are presented here, requiring little more effort than a single analysis.Results: Efficient Leave-one-out cross validation strategies is 786 times faster than the naive application for a simulated dataset with 1,000 observations and 10,000 markers and 99 times faster with 1,000 observations and 100 markers. These efficiencies relative to the naive approach using the same model will increase with increases in the number of observations.Conclusions: Efficient Leave-one-out cross validation strategies are presented here, requiring little more effort than a single analysis. 展开更多
关键词 Leave-one-out cross validation GBLUP
下载PDF
Cross-Validation, Shrinkage and Variable Selection in Linear Regression Revisited 被引量:3
9
作者 Hans C. van Houwelingen Willi Sauerbrei 《Open Journal of Statistics》 2013年第2期79-102,共24页
In deriving a regression model analysts often have to use variable selection, despite of problems introduced by data- dependent model building. Resampling approaches are proposed to handle some of the critical issues.... In deriving a regression model analysts often have to use variable selection, despite of problems introduced by data- dependent model building. Resampling approaches are proposed to handle some of the critical issues. In order to assess and compare several strategies, we will conduct a simulation study with 15 predictors and a complex correlation structure in the linear regression model. Using sample sizes of 100 and 400 and estimates of the residual variance corresponding to R2 of 0.50 and 0.71, we consider 4 scenarios with varying amount of information. We also consider two examples with 24 and 13 predictors, respectively. We will discuss the value of cross-validation, shrinkage and backward elimination (BE) with varying significance level. We will assess whether 2-step approaches using global or parameterwise shrinkage (PWSF) can improve selected models and will compare results to models derived with the LASSO procedure. Beside of MSE we will use model sparsity and further criteria for model assessment. The amount of information in the data has an influence on the selected models and the comparison of the procedures. None of the approaches was best in all scenarios. The performance of backward elimination with a suitably chosen significance level was not worse compared to the LASSO and BE models selected were much sparser, an important advantage for interpretation and transportability. Compared to global shrinkage, PWSF had better performance. Provided that the amount of information is not too small, we conclude that BE followed by PWSF is a suitable approach when variable selection is a key part of data analysis. 展开更多
关键词 cross-validation LASSO SHRINKAGE SIMULATION STUDY VARIABLE SELECTION
下载PDF
Handwriting Classification Based on Support Vector Machine with Cross Validation 被引量:4
10
作者 Anith Adibah Hasseim Rubita Sudirman Puspa Inayat Khalid 《Engineering(科研)》 2013年第5期84-87,共4页
Support vector machine (SVM) has been successfully applied for classification in this paper. This paper discussed the basic principle of the SVM at first, and then SVM classifier with polynomial kernel and the Gaussia... Support vector machine (SVM) has been successfully applied for classification in this paper. This paper discussed the basic principle of the SVM at first, and then SVM classifier with polynomial kernel and the Gaussian radial basis function kernel are choosen to determine pupils who have difficulties in writing. The 10-fold cross-validation method for training and validating is introduced. The aim of this paper is to compare the performance of support vector machine with RBF and polynomial kernel used for classifying pupils with or without handwriting difficulties. Experimental results showed that the performance of SVM with RBF kernel is better than the one with polynomial kernel. 展开更多
关键词 SUPPORT VECTOR MACHINE HANDWRITING DIFFICULTIES cross-validation
下载PDF
Validation method for simulation models with cross iteration
11
作者 FANG Ke ZHAO Kaibin ZHOU Yuchen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第3期555-563,共9页
Cross iteration often exists in the computational process of the simulation models, especially for control models. There is a credibility defect tracing problem in the validation of models with cross iteration. In ord... Cross iteration often exists in the computational process of the simulation models, especially for control models. There is a credibility defect tracing problem in the validation of models with cross iteration. In order to resolve this problem, after the problem formulation, a validation theorem on the cross iteration is proposed, and the proof of the theorem is given under the cross iteration circumstance. Meanwhile, applying the proposed theorem, the credibility calculation algorithm is provided, and the solvent of the defect tracing is explained. Further, based on the validation theorem on the cross iteration, a validation method for simulation models with the cross iteration is proposed, which is illustrated by a flowchart step by step. Finally, a validation example of a sixdegree of freedom (DOF) flight vehicle model is provided, and the validation process is performed by using the validation method. The result analysis shows that the method is effective to obtain the credibility of the model and accomplish the defect tracing of the validation. 展开更多
关键词 validation METHOD simulation model cross ITERATION validation THEOREM validation EXAMPLE
下载PDF
一种基于Cross-Validation的盲图像恢复方法 被引量:1
12
作者 康云 《测绘学院学报》 北大核心 2004年第4期259-261,265,共4页
图像盲复原所面临的主要问题是可利用的信息不足,目前已有的图像盲复原算法一般都是有先验知识,如非负和有限支持域的限制。但在实际中目标的支持域是未知的。文中介绍了CV(cross validation)的基本原理,给出了一种基于CV原理的支持域... 图像盲复原所面临的主要问题是可利用的信息不足,目前已有的图像盲复原算法一般都是有先验知识,如非负和有限支持域的限制。但在实际中目标的支持域是未知的。文中介绍了CV(cross validation)的基本原理,给出了一种基于CV原理的支持域确定方法的详细步骤;并针对计算大的问题提出了一定的改进。最后给出了实验结果,证明CV确定支持域的方法对于图像盲复原是有一定价值的。 展开更多
关键词 图像盲复原 点扩散函数 CV(交叉确定)
下载PDF
ON THE CONSISTENCY OF CROSS-VALIDATIONIN NONLINEAR WAVELET REGRESSION ESTIMATION
13
作者 张双林 郑忠国 《Acta Mathematica Scientia》 SCIE CSCD 2000年第1期1-11,共11页
For the nonparametric regression model Y-ni = g(x(ni)) + epsilon(ni)i = 1, ..., n, with regularly spaced nonrandom design, the authors study the behavior of the nonlinear wavelet estimator of g(x). When the threshold ... For the nonparametric regression model Y-ni = g(x(ni)) + epsilon(ni)i = 1, ..., n, with regularly spaced nonrandom design, the authors study the behavior of the nonlinear wavelet estimator of g(x). When the threshold and truncation parameters are chosen by cross-validation on the everage squared error, strong consistency for the case of dyadic sample size and moment consistency for arbitrary sample size are established under some regular conditions. 展开更多
关键词 CONSISTENCY cross-validation nonparametric regression THRESHOLD TRUNCATION wavelet estimator
下载PDF
在核非参数回归中Cross Validation的渐近最优性
14
作者 何仲洛 《湖州师专学报》 1991年第6期1-16,共16页
给定Y<sub>i</sub>=f(t<sub>i</sub>)+ε<sub>i</sub>,i=1,2,…,n,令f<sub>n</sub>(t<sub>j</sub>λ<sup>*</sup>)是回归函数f(t)的核估计并且λ<su... 给定Y<sub>i</sub>=f(t<sub>i</sub>)+ε<sub>i</sub>,i=1,2,…,n,令f<sub>n</sub>(t<sub>j</sub>λ<sup>*</sup>)是回归函数f(t)的核估计并且λ<sup>*</sup>是窗宽基于均方预测误差的Cross—Validation选择.在较弱的矩的条件E<sub>ε<sub>i</sub></sub><sup>2</sup>【∞下,我们研究了f<sub>n</sub>(t<sub>i</sub>λ<sup>*</sup>)的藉助于均方误差的强相合性以及渐近最优性. 展开更多
关键词 回归函数 核估计 非参数 C-V选择
下载PDF
基于DBN的风电机组变桨系统可靠性动态评估
15
作者 冯红岩 朱海娜 +1 位作者 邱美艳 冯玉龙 《可再生能源》 CAS CSCD 北大核心 2024年第4期486-492,共7页
为了对风电机组变桨系统的潜在风险进行可靠的动态预测,针对变桨系统部件种类多、系统复杂、故障特征提取困难的问题,文章首先对变桨系统故障点和故障传递过程进行归纳分析,建立故障树;然后将其转化为融合Leaky Noisy-Or节点的动态贝叶... 为了对风电机组变桨系统的潜在风险进行可靠的动态预测,针对变桨系统部件种类多、系统复杂、故障特征提取困难的问题,文章首先对变桨系统故障点和故障传递过程进行归纳分析,建立故障树;然后将其转化为融合Leaky Noisy-Or节点的动态贝叶斯网络(DBN),保证了模型精度并具备了动态预测能力;最后采用5折交叉验证的方式对模型进行寻优并验证。测试结果表明,该方法在对变桨系统进行风险预测、故障致因分析、风险动态演化过程分析方面准确率较高,可指导变桨系统进行预防性维护,在保证风电机组整体安全方面具有工程应用价值。 展开更多
关键词 变桨系统 动态贝叶斯网络 交叉验证 可靠性评估
下载PDF
Asher-McDade鼻唇评价量表的汉化及信效度初步研究
16
作者 陈丽先 曾妮 +1 位作者 石冰 黄汉尧 《华西口腔医学杂志》 CAS CSCD 北大核心 2024年第1期97-103,共7页
目的检测Asher-McDade鼻唇评价量表汉化后的信效度,明确其在中国唇裂术后效果评价的可行性。方法通过翻译、回译、调试及预调查形成中文版Asher-McDade鼻唇评价量表,选取四川大学华西口腔医院收治的80例唇腭裂患者的术后照片,并由唇腭... 目的检测Asher-McDade鼻唇评价量表汉化后的信效度,明确其在中国唇裂术后效果评价的可行性。方法通过翻译、回译、调试及预调查形成中文版Asher-McDade鼻唇评价量表,选取四川大学华西口腔医院收治的80例唇腭裂患者的术后照片,并由唇腭裂外科的手术医生、护理人员、研究生共10名等进行问卷调查,检验量表的信度和效度。结果量表克隆巴赫系数为0.804,量表的重测信度为0.895。量表的内容效度指数(ICVI)为1.000,量表平均内容效度指数(S-CVI/ave)为0.95。量表Kaiser-Meyer-Olkin(KMO)值为0.706,巴特利球体检验显示χ^(2)值为962.260(P<0.01),累积方差贡献率为63.095%。结论中文版Asher-McDade鼻唇评价量表具有良好的信度和效度,且适用于中国唇裂患者术后照片的效果评价。 展开更多
关键词 唇裂 鼻唇外观 跨文化调适 信度 效度
下载PDF
MRI特征辅助分类乳腺癌分子亚型的临床研究
17
作者 郭峰 侯信明 +2 位作者 王春锋 张海芹 宋张骏 《中国CT和MRI杂志》 2024年第6期100-103,共4页
目的 应用磁共振(MRI)图像中提取的特征和机器学习方法来帮助区分乳腺癌分子亚型,以期为临床诊治提供参考。方法 回顾性分析我院于2021年10月-2023年10月间确诊的178例乳腺癌患者的临床资料,每个患者肿瘤的形状、MRI特征和基于直方图的... 目的 应用磁共振(MRI)图像中提取的特征和机器学习方法来帮助区分乳腺癌分子亚型,以期为临床诊治提供参考。方法 回顾性分析我院于2021年10月-2023年10月间确诊的178例乳腺癌患者的临床资料,每个患者肿瘤的形状、MRI特征和基于直方图的特征是使用内部软件从增强前和三次增强后的MRI图像上提取的。同时收集临床和病理资料。基于机器学习模型识别重要的成像特征并建立预测IDC亚型的模型。采用留一法交叉验证(LOOCV)避免模型过度拟合,采用Kruskal-Wallis检验确定统计学意义。结果 LOOCV过程生成一个具有不同特征的模型,在排名前20位的特征中,有11项在IDC亚型之间存在显著差异(P<0.05)。综合前九种病理和影像特征,预测模型对IDC亚型的识别准确率为83,4%。病理和影像联合模型对各亚型的准确率分别为89.2%(ERPR1)、63.6%(ERPR-/HER21)和8 2.5%(TN)。当仅结合前9个成像特征时,预测模型在LOOCV上识别IDC亚型的总体准确率为71.2%。病理和影像联合模型对各亚型的准确率分别为69.9%(ERPR1)、62.9%(ERPR-/HER21)和81.0%(TN)。结论 我们开发了一个基于机器学习的预测模型,该模型使用从M RI提取的特征来区分具有显著预测能力的IDC亚型。 展开更多
关键词 磁共振 乳腺癌分子亚型 留一法交叉验证
下载PDF
基于m×2正则化交叉验证的神经网络超参数调优方法
18
作者 曹学飞 杨帆 +2 位作者 李济洪 王瑞波 牛倩 《计算机技术与发展》 2024年第4期168-173,共6页
超参数调优是神经网络建模的关键问题。针对传统的超参数调优方法存在的问题,该文提出了一种基于m×2正则化交叉验证的超参数调优方法。目的是给出一种适用于复杂模型、大数据集背景下的计算开销较小且稳健的超参数调优方法。该方... 超参数调优是神经网络建模的关键问题。针对传统的超参数调优方法存在的问题,该文提出了一种基于m×2正则化交叉验证的超参数调优方法。目的是给出一种适用于复杂模型、大数据集背景下的计算开销较小且稳健的超参数调优方法。该方法的思想是从完整的数据集上选取少部分数据进行调优,避免模型在数据集较大时非常耗时的超参数调优难题;在m×2交叉验证的基础上设置正则化条件均衡训练集与验证集之间的分布差异,从而减少分布不一致带来的性能波动;使用信噪比作为调优的优化目标,从而可以综合考虑模型性能评价指标的均值和方差;并采用正交设计选择相关性较低的超参数组合以提高调优效率。以命名实体任务为例进行实验,在CoNLL 2003数据集上的实验结果显示,提出的调优方法能够选到和网格搜索性能上没有显著差异的超参数组合,且调优时间可显著降低约66%。 展开更多
关键词 m×2交叉验证 正则化 神经网络 超参数调优 信噪比
下载PDF
基于Stacking集成学习的声波时差测井曲线复原研究
19
作者 曹志民 丁璐 韩建 《化工自动化及仪表》 CAS 2024年第3期470-476,共7页
声波时差测井曲线在石油勘探中发挥着不可或缺的作用,但是受地质或仪器的影响,经常会出现部分甚至完整的声波测井曲线缺失的情况。针对这一问题,提出了一种基于Stacking集成学习的声波时差测井曲线复原方法,该模型使用随机森林(RF)、梯... 声波时差测井曲线在石油勘探中发挥着不可或缺的作用,但是受地质或仪器的影响,经常会出现部分甚至完整的声波测井曲线缺失的情况。针对这一问题,提出了一种基于Stacking集成学习的声波时差测井曲线复原方法,该模型使用随机森林(RF)、梯度提升决策树(GBDT)、轻量梯度提升机(LightGBM)和极限梯度提升(XGBoost)作为基学习器,支持向量回归(SVR)作为元学习器,同时采用5折交叉验证的方法。实验选取了大庆油田某区块的实际测井数据,分别进行了同井和异井间的缺失声波时差测井曲线复原实验,结果表明,所提方法比单一模型预测更加准确,验证了此方法的可行性。 展开更多
关键词 声波时差测井曲线 Stacking集成学习 测井曲线复原 5折交叉验证
下载PDF
融合多尺度CNN和CRF的通用细粒度事件检测
20
作者 任永功 阎格 何馨宇 《小型微型计算机系统》 CSCD 北大核心 2024年第4期859-864,共6页
事件检测是自然语言处理领域中事件抽取的主要任务之一,它旨在从众多非结构化信息中自动提取出结构化的关键信息.现有的方法存在特征提取不全面、特征分布不均等情况.为了提高事件检测的准确率,提出了一种融合BERT预训练模型与多尺度CN... 事件检测是自然语言处理领域中事件抽取的主要任务之一,它旨在从众多非结构化信息中自动提取出结构化的关键信息.现有的方法存在特征提取不全面、特征分布不均等情况.为了提高事件检测的准确率,提出了一种融合BERT预训练模型与多尺度CNN的神经网络模型(BMCC,BERT+Multi-scale CNN+CRF).首先通过BERT(Bidirectional Encoder Representations from Transformers)预训练模型来进行词向量的嵌入,并利用其双向训练的Transformer机制来提取序列的状态特征;其次使用不同尺度的卷积核在多个卷积通道中进行卷积训练,以此来提取不同视野的语义信息,丰富其语义表征.最后将BIO机制融入到条件随机场(CRF)来对序列进行标注,实现事件的检测.实验结果表明,所提出的模型在MAVEN数据集上的F1值为65.17%,表现了该模型的良好性能. 展开更多
关键词 事件检测 BERT 多尺度CNN 条件随机场(CRF) 交叉验证
下载PDF
上一页 1 2 79 下一页 到第
使用帮助 返回顶部