期刊文献+
共找到165篇文章
< 1 2 9 >
每页显示 20 50 100
Processing for Zero-Failure Data of the Products 被引量:3
1
作者 Han Ming 1,2 & Cui Yuping 3 (1. Department of Statistics, Renmin University of China, Beijing 100872, P.R. China 2. Department of Mathematics, Zhejiang Ocean University, Zhoushan 316004, P.R. China 3. Department of Machine and Electron, Dongbei Power College, Jilin 130012, P.R. China) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2002年第3期91-97,共7页
In this paper, an estimation method for reliability parameter in the case of zero-failuare data-synthetic estimation method is given. For zero-failure data of double-parameter exponential distribution, a hierarchical ... In this paper, an estimation method for reliability parameter in the case of zero-failuare data-synthetic estimation method is given. For zero-failure data of double-parameter exponential distribution, a hierarchical Bayesian estimation of the failure probability is presented. After failure information is introduced, hierarchical Bayesian estimation and synthetic estimation of the failure probability, as well as synthetic estimation of reliability are given. Calculation and analysis are performed regarding practical problems in case that life distribution of an engine obeys double-parameter exponential distribution. 展开更多
关键词 RELIABILITY zero-failure data Failure probability Hierarchical Bayesian estimation Synthetic estimation.
下载PDF
Question classification in question answering based on real-world web data sets
2
作者 袁晓洁 于士涛 +1 位作者 师建兴 陈秋双 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期272-275,共4页
To improve question answering (QA) performance based on real-world web data sets,a new set of question classes and a general answer re-ranking model are defined.With pre-defined dictionary and grammatical analysis,t... To improve question answering (QA) performance based on real-world web data sets,a new set of question classes and a general answer re-ranking model are defined.With pre-defined dictionary and grammatical analysis,the question classifier draws both semantic and grammatical information into information retrieval and machine learning methods in the form of various training features,including the question word,the main verb of the question,the dependency structure,the position of the main auxiliary verb,the main noun of the question,the top hypernym of the main noun,etc.Then the QA query results are re-ranked by question class information.Experiments show that the questions in real-world web data sets can be accurately classified by the classifier,and the QA results after re-ranking can be obviously improved.It is proved that with both semantic and grammatical information,applications such as QA, built upon real-world web data sets, can be improved,thus showing better performance. 展开更多
关键词 question classification question answering real-world web data sets question and answer web forums re-ranking model
下载PDF
数据科学的科学性与科学问题的分析 被引量:1
3
作者 朝乐门 《计算机科学》 CSCD 北大核心 2024年第1期26-34,共9页
作为一门新兴的学科领域,数据科学的科学性受到了关注且其科学问题未明确提出。文中从科学研究范式及方法论、可证伪性和可再现性、科学精神及快速迭代以及科学研究纲领及理论体系4个方面探讨了数据科学的“科学性”,并解答了为什么数... 作为一门新兴的学科领域,数据科学的科学性受到了关注且其科学问题未明确提出。文中从科学研究范式及方法论、可证伪性和可再现性、科学精神及快速迭代以及科学研究纲领及理论体系4个方面探讨了数据科学的“科学性”,并解答了为什么数据科学是一门新兴科学的问题。在此基础上,结合DIKW模型(DIKW Pyramid or Hierarchy)、DMP(Data-Model-Problem)模型、数据科学的统计学和机器学习方法论以及数据科学的流程与活动,提出了数据科学的7个核心科学问题:解释在先还是在后或无、问题对齐数据还是数据对齐问题、更加相信数据还是模型、更加重视性能还是可解释性、如何划分数据、如何用已知数据解决未知数据的问题、人在环路还是人出环路。最后,提出了数据科学研究的4点建议:聚焦数据科学本身的理论研究,推动数据的科学、技术和工程需要进一步分离和专业化,加强人工智能赋能的数据科学的理论与实践以及数据科学学科(Data Science as A Discipline)与学科中的数据科学(Data Science Within A Discipline)的联动。 展开更多
关键词 数据科学 科学属性 科学问题 DIKW模型
下载PDF
基于图卷积网络的掩码数据增强
4
作者 胡新荣 陈静雪 +5 位作者 黄子键 王帮超 姚迅 刘军平 朱强 杨捷 《计算机应用》 CSCD 北大核心 2024年第11期3335-3344,共10页
针对多项选择问答(MCQA)领域中原始数据信息不准确、样本质量低以及模型泛化能力差等问题,提出一种基于图卷积网络(GCN)的掩码数据增强模型GMDA(Graph convolution network-based MASK Data Augmentation)。该模型以GCN作为基础框架,首... 针对多项选择问答(MCQA)领域中原始数据信息不准确、样本质量低以及模型泛化能力差等问题,提出一种基于图卷积网络(GCN)的掩码数据增强模型GMDA(Graph convolution network-based MASK Data Augmentation)。该模型以GCN作为基础框架,首先将文章中的单词抽象为图节点,并利用问题-候选答案(QA)对节点进行连接,建立与相关的文章节点之间的联系;其次,计算节点之间的相似性,并应用掩码技术对图中的节点进行掩盖,从而生成增强样本;再次,利用GCN对增强样本进行特征扩充,以提升模型的信息表达能力;最后,引入打分器对原始样本和增强样本进行评分,并结合课程学习策略提高答案预测的准确性。综合评估实验结果表明:与RACE-M、RACE-H数据集上的最优基线模型EAM相比,所提模型GMDA的准确率分别平均提高了0.8、0.4个百分点,而与DREAM数据集上的最优基线模型STM(SelfTraining Method)相比,GMDA模型的准确率平均提高了1.4个百分点。此外,对比实验的结果也验证了GMDA模型在MCQA任务中的有效性,可为数据增强技术在该领域的进一步研究和应用提供帮助。 展开更多
关键词 多项选择问答 数据增强 图卷积网络 打分器 课程学习
下载PDF
基于学习通和在线判题系统的程序设计课程考核系统研究
5
作者 邱义 郭一晶 +2 位作者 陈南南 陈俊仁 赵东锋 《现代信息科技》 2024年第8期32-35,39,共5页
程序设计课程是大部分工科专业的基础课程,对后续专业课程学习非常重要。为了提高课程的教学效果,结合学习通和在线判题系统对课程内容、实践环节等进行研究与探索,根据学校教学特点设计了一款在线判题系统。该系统基于ThinkPHP框架搭建... 程序设计课程是大部分工科专业的基础课程,对后续专业课程学习非常重要。为了提高课程的教学效果,结合学习通和在线判题系统对课程内容、实践环节等进行研究与探索,根据学校教学特点设计了一款在线判题系统。该系统基于ThinkPHP框架搭建,使用目前流行的B/S架构,最终以网页形式提供给教师与学生实践操作。学生通过该系统能获得测评实时反馈,增强了学习自主性,提高了编程能力,并减少了教师的工作量。 展开更多
关键词 学习通 在线判题系统 程序设计 THINKPHP 数据分析
下载PDF
基于多模态知识主动学习的视频问答方案
6
作者 刘明阳 王若梅 +1 位作者 周凡 林格 《计算机研究与发展》 EI CSCD 北大核心 2024年第4期889-902,共14页
视频问答是人工智能领域的一个热点研究问题.现有方法在特征提取方面缺乏针对视觉目标运动细节的获取,从而会导致错误因果关系的建立.此外,在数据融合与推理过程中,现有方法缺乏有效的主动学习能力,难以获取特征提取之外的先验知识,影... 视频问答是人工智能领域的一个热点研究问题.现有方法在特征提取方面缺乏针对视觉目标运动细节的获取,从而会导致错误因果关系的建立.此外,在数据融合与推理过程中,现有方法缺乏有效的主动学习能力,难以获取特征提取之外的先验知识,影响了模型对多模态内容的深度理解.针对这些问题,首先,设计了一种显性多模态特征提取模块,通过获取图像序列中视觉目标的语义关联以及与周围环境的动态关系来建立每个视觉目标的运动轨迹.进一步通过动态内容对静态内容的补充,为数据融合与推理提供了更加精准的视频特征表达.其次,提出了知识自增强多模态数据融合与推理模型,实现了多模态信息理解的自我完善和逻辑思维聚焦,增强了对多模态特征的深度理解,减少了对先验知识的依赖.最后,提出了一种基于多模态知识主动学习的视频问答方案.实验结果表明,该方案的性能优于现有最先进的视频问答算法,大量的消融和可视化实验也验证了方案的合理性. 展开更多
关键词 视频问答 数据融合与推理 多模态主动学习 视频细节描述提取 深度学习
下载PDF
面向知识图谱问答的查询图生成方法
7
作者 谈川源 贾永辉 +1 位作者 陈文亮 陈跃鹤 《中文信息学报》 CSCD 北大核心 2024年第5期117-126,共10页
该文提出一种新的查询图生成方法用于知识图谱问答系统的问句解析。现有查询图生成工作覆盖的复杂问句类型有限,不能较好地处理答案为关系或涉及关系约束的问句,且未充分考虑路径结果间的组合与运算。因此,该文在查询图生成中应用节点... 该文提出一种新的查询图生成方法用于知识图谱问答系统的问句解析。现有查询图生成工作覆盖的复杂问句类型有限,不能较好地处理答案为关系或涉及关系约束的问句,且未充分考虑路径结果间的组合与运算。因此,该文在查询图生成中应用节点操作的同时引入基于关系的操作,并考虑不同主路径之间的组合情况,显著提升对复杂问句的分析能力。并在此基础上,构建了中文知识图谱问答系统。此外,该文构建一份包含多种复杂类型问句的中文知识图谱问答数据集。该数据集和CCKS2019-CKBQA数据集合并后构成一个新的数据集CCKS2019-Comp,并用来测试本文方法的有效性。实验结果表明,该文方法在CCKS2019-CKBQA和CCKS2019-Comp测试集上平均F 1值分别达到73.8%和73.3%。该文的新构建数据和代码已开源①。 展开更多
关键词 知识图谱问答 查询图生成 数据构建 问答系统
下载PDF
中英心理学期刊数据删除及删除标准的元研究
8
作者 谢宜骏 杨忠静 吴燕 《心理学探新》 CSSCI 北大核心 2024年第4期374-384,共11页
数据删除在心理学研究中存在较大的操作空间,研究者借此获取显著统计结果的操作极大地威胁了科研结果的真实性和可重复性。研究以2000、2010、2020三个年度发表在《心理学报》和Psychological Science期刊上的实证研究为分析对象,结合... 数据删除在心理学研究中存在较大的操作空间,研究者借此获取显著统计结果的操作极大地威胁了科研结果的真实性和可重复性。研究以2000、2010、2020三个年度发表在《心理学报》和Psychological Science期刊上的实证研究为分析对象,结合量化和质性分析方法,揭示中英心理学期刊数据删除现状。结果显示,中英期刊存在数据删除的研究各占比为48.83%和35.56%,平均被试删除比例分别为16.31%和14.48%,在删除数据后未按相关标准进行报告的比例分别为11.48%和5.46%;在被试数据删除和观测值数据删除中,报告率最高的删除标准分别为基于极端值的删除(57.87%)和基于任务的删除(30.6%);研究报告的次级删除标准体现了一定的随意性。这些结果表明了建立更为严谨的标准化数据删除报告规范的必要性。 展开更多
关键词 数据删除 元研究 有问题的研究操作 数据删除标准
下载PDF
基于提示问答数据增强的小样本网络安全事件检测方法
9
作者 汤萌萌 郭渊博 +3 位作者 张晗 白庆春 陈庆礼 张博闻 《通信学报》 EI CSCD 北大核心 2024年第8期62-74,共13页
针对网络安全领域的事件识别标注数据较为匮乏且场景和语义复杂,难以构建准确的事件识别模型的问题,提出了一种基于提示问答数据增强的小样本网络安全事件检测方法。首先利用提示信息获取事件表示知识,并结合标签词映射网络安全事件类型... 针对网络安全领域的事件识别标注数据较为匮乏且场景和语义复杂,难以构建准确的事件识别模型的问题,提出了一种基于提示问答数据增强的小样本网络安全事件检测方法。首先利用提示信息获取事件表示知识,并结合标签词映射网络安全事件类型,从未标注的文本中生成新的数据来扩充训练数据;然后使用生成的高置信度的伪标注实例和原始数据来微调模型,以增强模型对网络安全事件的语义理解能力;最后在2个网络安全领域数据集上进行了实验验证。结果表明,与其他基线方法相比,所提方法在低资源网络安全事件检测任务上具有很强的优越性。 展开更多
关键词 网络安全 事件检测 提示问答 数据增强 小样本
下载PDF
Estimation of Reliability Derived from Binomial Distribution in Zero-Failure Data 被引量:1
10
作者 韩明 《Journal of Shanghai Jiaotong university(Science)》 EI 2015年第4期454-457,共4页
This paper introduces a new method, E-Bayesian estimation method, to estimate the reliability in zero-failure data. The definition of E-Bayesian estimation of the reliability is given. Based on the definition,the form... This paper introduces a new method, E-Bayesian estimation method, to estimate the reliability in zero-failure data. The definition of E-Bayesian estimation of the reliability is given. Based on the definition,the formulas of E-Bayesian estimation and hierarchical Bayesian estimation of the reliability are provided, and property of the E-Bayesian estimation, i.e. relation between E-Bayesian estimation and hierarchical Bayesian estimation, is discussed. Calculations performed on practical problems show that the proposed new method is feasible and easy to operate. 展开更多
关键词 reliability engineering binomial distribution zero-failure data E-Bayesian estimation hierarchical Bayesian estimation
原文传递
基于文本数据增强的中文水稻育种问句命名实体识别
11
作者 牛培宇 侯琛 《农业机械学报》 EI CAS CSCD 北大核心 2024年第8期333-343,共11页
针对现有水稻育种问答系统存在数据管理水平低、知识粒度大,水稻育种领域缺乏用于命名实体识别的标注数据、人工标注成本高等问题,提出了一种基于文本数据增强的方法来识别水稻育种问句的命名实体,通过构建水稻育种知识图谱,对水稻育种... 针对现有水稻育种问答系统存在数据管理水平低、知识粒度大,水稻育种领域缺乏用于命名实体识别的标注数据、人工标注成本高等问题,提出了一种基于文本数据增强的方法来识别水稻育种问句的命名实体,通过构建水稻育种知识图谱,对水稻育种问句中的大类命名实体进行分类,从而增强实体边界,降低知识粒度。针对水稻育种数据标注成本高导致命名实体识别性能不佳的难点,通过在BERT-BILSTM-CRF模型中引入数据增强层,提出了DA-BERT-BILSTM-CRF模型。实验以标注的水稻育种问句为训练数据,将所提出的模型与其他基线模型进行比较。结果表明,本文方法在水稻育种问句中命名实体识别的单类别识别任务和整体识别任务上均优于其他方法,其中单类别识别精确率达到94.26%,F1值达到93.32%;整体识别精确率达到93.86%,F1值达到93.34%。 展开更多
关键词 水稻育种 问答系统 命名实体识别 文本数据增强 知识图谱
下载PDF
Estimation of Parameter in the Case of Zero-Failure Data
12
作者 HAN Ming DePartment of Mathematics, Zhejiang Ocean University, Zhoushan 316004, China 《Journal of Systems Science and Systems Engineering》 SCIE EI CSCD 2001年第4期450-456,共7页
In this paper, for zero-fai1ure data (t,, n1), at moment ti, if the prior distribution of the failure probability p, = P {T<ti } is incomplete Fisher--Z distribution: Fisher-Z (0, λi; a, b), the author gives pi hi... In this paper, for zero-fai1ure data (t,, n1), at moment ti, if the prior distribution of the failure probability p, = P {T<ti } is incomplete Fisher--Z distribution: Fisher-Z (0, λi; a, b), the author gives pi hierarchical Biyesian estimation and the estimation of reliability under zero-failure data condition is obtained also. The author also gives a practical ca1culating example using the theory. 展开更多
关键词 RELIABILITY zero-failure data failure probabi1ity hierarchical Biyesian estimation
原文传递
自动气象站数据实时质量控制业务软件设计与实现 被引量:34
13
作者 李志鹏 张玮 +2 位作者 黄少平 李洪康 邓卫华 《气象》 CSCD 北大核心 2012年第3期371-376,共6页
介绍了一种面向天气监测预报实时业务的自动气象站数据质量控制软件。该软件综合应用数据质量控制、网络消息即时通信等技术,将数据质量控制纳入气象信息业务流程,建立了省、市、县三级气象台站联动的自动站数据实时质量控制业务流程,... 介绍了一种面向天气监测预报实时业务的自动气象站数据质量控制软件。该软件综合应用数据质量控制、网络消息即时通信等技术,将数据质量控制纳入气象信息业务流程,建立了省、市、县三级气象台站联动的自动站数据实时质量控制业务流程,实现了对江西省89个国家自动气象站和1531个区域自动气象站观测数据的实时质量控制,有效降低了自动站疑误数据对天气监测预报业务服务可能造成的不利影响。 展开更多
关键词 自动气象站 疑误数据 实时预审 质量控制
下载PDF
大数据正在引发地球科学领域一场深刻的革命——《地质科学》2017年大数据专题代序 被引量:69
14
作者 张旗 周永章 《地质科学》 CAS CSCD 北大核心 2017年第3期637-648,共12页
摘要本文针对目前国内大数据研究的现状,着重分析了在地球科学领域大数据研究落后的原因,指出大数据正在引发地球科学领域一场深刻的革命,大数据的关键不在于数据的大,而且在于思维的新;从数据出发,让数据说话,依靠人工智能方法... 摘要本文针对目前国内大数据研究的现状,着重分析了在地球科学领域大数据研究落后的原因,指出大数据正在引发地球科学领域一场深刻的革命,大数据的关键不在于数据的大,而且在于思维的新;从数据出发,让数据说话,依靠人工智能方法,让机器学习、深度学习、可视分析等大数据技术逐步成为必需。利用大数据方法研究玄武岩构造环境判别图以及中新世岩浆事件的意义所取得的成果即是极佳的研究范例。文中指出,面向未来,大数据对于地球科学界来说,决不是可有可无的,它将创造奇迹。大数据作为第四科学范式的研究领域十分宽广,它将改变地球科学家的思维方式,从逻辑思维方式转变为由数据驱动的关联思维方式,文中呼吁科学界对大数据给予更多的关注和支持。 展开更多
关键词 数据 第四科学范式 玄武岩判别图 小数据 问题 前景 实例
下载PDF
性病门诊就诊者AIDS相关知识、态度、行为的调查 被引量:4
15
作者 赵英 陈新 +3 位作者 任琼 李凤华 龙理良 陈锋 《海南医学院学报》 CAS 2006年第1期44-46,共3页
目的:了解性病门诊就诊者的艾滋病知识水平、态度和行为,探讨这一特殊人群的艾滋病健康教育干预模式。方法:用自制问卷对454名性病门诊就诊者进行不记名艾滋病知识、态度和相关行为的调查。结果:性病门诊就诊者对艾滋病知识的了解不够... 目的:了解性病门诊就诊者的艾滋病知识水平、态度和行为,探讨这一特殊人群的艾滋病健康教育干预模式。方法:用自制问卷对454名性病门诊就诊者进行不记名艾滋病知识、态度和相关行为的调查。结果:性病门诊就诊者对艾滋病知识的了解不够系统和全面,全部回答正确率仅为21.37%。78.63%的人艾滋病知识来源于报纸、杂志、电视和网络等宣传媒介;但82.16%的人希望能够通过正规的教育从学校和医生处获得全面、准确的AIDS知识。性病门诊就诊者对艾滋病缺乏风险意识,仅有7.39%的被调查者在每次发生非婚性行为时都使用安全套。结论:针对性病门诊就诊者的艾滋病健康教育亟待加强,重点应该放在传播途径和安全套的使用推广和提高艾滋病风险意识上;学校和医院应该加强健康教育的力度,为社会提供系统全面的健康教育。 展开更多
关键词 获得性免疫缺陷综合征 门诊病人 行为 问卷 数据收集
下载PDF
社会调查中二分数据的转换与解读——以《2005年中国青少年网瘾调查报告》中的数据分析为例 被引量:2
16
作者 柯惠新 黄刚 江宇 《数理统计与管理》 CSSCI 北大核心 2007年第6期958-965,共8页
社会调查中常常使用尽可能简短的问卷,为此将会收集到大量的二分数据。本文讨论了产生二分数据的两种主要形式,探讨了如何在遵循统计分析程序的基本要求下,对二分变量进行转换和解读,从中挖掘出丰富而深入的信息,并以《2005年中国青少... 社会调查中常常使用尽可能简短的问卷,为此将会收集到大量的二分数据。本文讨论了产生二分数据的两种主要形式,探讨了如何在遵循统计分析程序的基本要求下,对二分变量进行转换和解读,从中挖掘出丰富而深入的信息,并以《2005年中国青少年网瘾调查报告》中的数据分析为例进行了说明。 展开更多
关键词 二分数据 二项单选题 多项选择题 数据转换 数据解读
下载PDF
基于数据挖掘的智能答疑系统(英文) 被引量:3
17
作者 曲守宁 王钦 +2 位作者 邹燕 刘魁 朱强 《郑州大学学报(理学版)》 CAS 2007年第2期50-54,共5页
根据当今答疑系统的缺点,提出了一套基于数据挖掘算法的答疑设计方案,将改进的关联规则算法应用于文本聚类中,可以将数据库中问题更加准确地分类,因此可以将用户提出的问题快速定位,提高答疑速率.将聚类后的问题库应用关联规则,可以得... 根据当今答疑系统的缺点,提出了一套基于数据挖掘算法的答疑设计方案,将改进的关联规则算法应用于文本聚类中,可以将数据库中问题更加准确地分类,因此可以将用户提出的问题快速定位,提高答疑速率.将聚类后的问题库应用关联规则,可以得到更加准确的关联表,用于提取论坛数据库中的最优答案,进而形成一个快速且准确的自动答疑系统.实验结果表明该方案具有智能性、自我更新性能、节约存储空间和提高答疑效率等优点. 展开更多
关键词 答疑系统 关联规则 聚类 数据仓库
下载PDF
面向图书馆关联数据的自动问答技术研究 被引量:23
18
作者 欧石燕 唐振贵 《中国图书馆学报》 CSSCI 北大核心 2015年第6期44-60,共17页
早期针对语义网的自动问答主要是面向单一RDF数据集,随着网络上相互关联数据集的急速增加,迫切需要将自动问答扩展到多个RDF数据集,但同时在语义标注、答案整合方面也带来了更大的难度与挑战。本文提出了一种面向图书馆关联数据的自动... 早期针对语义网的自动问答主要是面向单一RDF数据集,随着网络上相互关联数据集的急速增加,迫切需要将自动问答扩展到多个RDF数据集,但同时在语义标注、答案整合方面也带来了更大的难度与挑战。本文提出了一种面向图书馆关联数据的自动问答新方法,通过将自然语言提问转换为结构化的SPARQL查询,从图书馆领域相互关联的五个RDF数据集中提取特定答案。该方法的创新点在于,将问句分为涉及一个数据集的简单句和涉及多个数据集的复杂句分别进行处理,又将简单句分为查询属性和查询实例两种类别分别制定SPARQL查询构建规则,将复杂句分解成若干个简单句进行处理,有利于SPARQL查询的构建和答案的整合。通过实验测评,100个问句的回答精确率达到91%,表明这是一种行之有效的问答方法,对于促进关联数据在图书馆中的应用具有重要意义。 展开更多
关键词 自动问答 关联数据 RDF数据集 SPARQL查询 语义标注 本体
下载PDF
“信息检索与利用”网络课程辅助系统——智能测试系统的设计 被引量:5
19
作者 王永丽 王伟 沈秀丽 《现代图书情报技术》 CSSCI 北大核心 2004年第4期75-77,74,共4页
对智能测试系统的开发进行了详细介绍 ,提出并实现了该系统的两个重要部分——题库系统和网上考试系统 ,题库系统中的标准化试题系统、试卷系统对提高教学质量起到推动性作用。网上考试系统具有智能性特点。
关键词 信息检索 信息利用 网络课程 教学辅助系统 智能测试系统 网上考试 题库系统
下载PDF
基于数据增强的高考阅读理解自动答题研究 被引量:3
20
作者 张虎 张颖 +2 位作者 杨陟卓 钱揖丽 李茹 《中文信息学报》 CSCD 北大核心 2021年第9期132-140,共9页
机器阅读理解是自然语言处理领域中的一项重要研究任务,高考阅读理解自动答题是近年来阅读理解任务中的又一挑战。目前高考语文阅读理解任务中真题和模拟题的数量相对较少,基于深度学习的方法受到实验数据规模较小的限制,所得的实验结... 机器阅读理解是自然语言处理领域中的一项重要研究任务,高考阅读理解自动答题是近年来阅读理解任务中的又一挑战。目前高考语文阅读理解任务中真题和模拟题的数量相对较少,基于深度学习的方法受到实验数据规模较小的限制,所得的实验结果相比传统方法无明显优势。基于此,该文探索了面向高考语文阅读理解的数据增强方法,结合传统的EDA数据增强思路提出了适应于高考阅读理解的EDA策略,针对阅读材料普遍较长的特征提出了基于滑动窗口的材料动态裁剪方式,围绕材料中不同句子的重要性差异明显的问题,提出了基于相似度计算的材料句质量评价方法。实验结果表明,三种方法均能提升高考题阅读理解自动答题的效果,答题准确率最高可提升5个百分点以上。 展开更多
关键词 阅读理解 高考题 数据增强 深度学习
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部