期刊文献+
共找到679篇文章
< 1 2 34 >
每页显示 20 50 100
Low rank optimization for efficient deep learning:making a balance between compact architecture and fast training
1
作者 OU Xinwei CHEN Zhangxin +1 位作者 ZHU Ce LIU Yipeng 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第3期509-531,F0002,共24页
Deep neural networks(DNNs)have achieved great success in many data processing applications.However,high computational complexity and storage cost make deep learning difficult to be used on resource-constrained devices... Deep neural networks(DNNs)have achieved great success in many data processing applications.However,high computational complexity and storage cost make deep learning difficult to be used on resource-constrained devices,and it is not environmental-friendly with much power cost.In this paper,we focus on low-rank optimization for efficient deep learning techniques.In the space domain,DNNs are compressed by low rank approximation of the network parameters,which directly reduces the storage requirement with a smaller number of network parameters.In the time domain,the network parameters can be trained in a few subspaces,which enables efficient training for fast convergence.The model compression in the spatial domain is summarized into three categories as pre-train,pre-set,and compression-aware methods,respectively.With a series of integrable techniques discussed,such as sparse pruning,quantization,and entropy coding,we can ensemble them in an integration framework with lower computational complexity and storage.In addition to summary of recent technical advances,we have two findings for motivating future works.One is that the effective rank,derived from the Shannon entropy of the normalized singular values,outperforms other conventional sparse measures such as the?_1 norm for network compression.The other is a spatial and temporal balance for tensorized neural networks.For accelerating the training of tensorized neural networks,it is crucial to leverage redundancy for both model compression and subspace training. 展开更多
关键词 model compression subspace training effective rank low rank tensor optimization efficient deep learning
下载PDF
Prediction of Outcomes in Mini-Basketball Training Program for Preschool Children with Autism Using Machine Learning Models 被引量:2
2
作者 Zhiyuan Sun Fabian Herold +6 位作者 Kelong Cai Qian Yu Xiaoxiao Dong Zhimei Liu Jinming Li Aiguo Chen Liye Zou 《International Journal of Mental Health Promotion》 2022年第2期143-158,共16页
In recent years evidence has emerged suggesting that Mini-basketball training program(MBTP)can be an effec-tive intervention method to improve social communication(SC)impairments and restricted and repetitive beha-vio... In recent years evidence has emerged suggesting that Mini-basketball training program(MBTP)can be an effec-tive intervention method to improve social communication(SC)impairments and restricted and repetitive beha-viors(RRBs)in preschool children suffering from autism spectrum disorder(ASD).However,there is a considerable degree if interindividual variability concerning these social outcomes and thus not all preschool chil-dren with ASD profit from a MBTP intervention to the same extent.In order to make more accurate predictions which preschool children with ASD can benefit from an MBTP intervention or which preschool children with ASD need additional interventions to achieve behavioral improvements,further research is required.This study aimed to investigate which individual factors of preschool children with ASD can predict MBTP intervention out-comes concerning SC impairments and RRBs.Then,test the performance of machine learning models in predict-ing intervention outcomes based on these factors.Participants were 26 preschool children with ASD who enrolled in a quasi-experiment and received MBTP intervention.Baseline demographic variables(e.g.,age,body,mass index[BMI]),indicators of physicalfitness(e.g.,handgrip strength,balance performance),performance in execu-tive function,severity of ASD symptoms,level of SC impairments,and severity of RRBs were obtained to predict treatment outcomes after MBTP intervention.Machine learning models were established based on support vector machine algorithm were implemented.For comparison,we also employed multiple linear regression models in statistics.Ourfindings suggest that in preschool children with ASD symptomatic severity(r=0.712,p<0.001)and baseline SC impairments(r=0.713,p<0.001)are predictors for intervention outcomes of SC impair-ments.Furthermore,BMI(r=-0.430,p=0.028),symptomatic severity(r=0.656,p<0.001),baseline SC impair-ments(r=0.504,p=0.009)and baseline RRBs(r=0.647,p<0.001)can predict intervention outcomes of RRBs.Statistical models predicted 59.6%of variance in post-treatment SC impairments(MSE=0.455,RMSE=0.675,R2=0.596)and 58.9%of variance in post-treatment RRBs(MSE=0.464,RMSE=0.681,R2=0.589).Machine learning models predicted 83%of variance in post-treatment SC impairments(MSE=0.188,RMSE=0.434,R2=0.83)and 85.9%of variance in post-treatment RRBs(MSE=0.051,RMSE=0.226,R2=0.859),which were better than statistical models.Ourfindings suggest that baseline characteristics such as symptomatic severity of 144 IJMHP,2022,vol.24,no.2 ASD symptoms and SC impairments are important predictors determining MBTP intervention-induced improvements concerning SC impairments and RBBs.Furthermore,the current study revealed that machine learning models can successfully be applied to predict the MBTP intervention-related outcomes in preschool chil-dren with ASD,and performed better than statistical models.Ourfindings can help to inform which preschool children with ASD are most likely to benefit from an MBTP intervention,and they might provide a reference for the development of personalized intervention programs for preschool children with ASD. 展开更多
关键词 Prediction OUTCOMES mini-basketball training program autistic children machine learning models
下载PDF
Cloudless-Training:基于serverless的高效跨地域分布式ML训练框架
3
作者 谭文婷 吕存驰 +1 位作者 史骁 赵晓芳 《高技术通讯》 CAS 北大核心 2024年第3期219-232,共14页
跨地域分布式机器学习(ML)训练能够联合多区域的云资源协作训练,可满足许多新兴ML场景(比如大型模型训练、联邦学习)的训练需求。但其训练效率仍受2方面挑战的制约。首先,多区域云资源缺乏有效的弹性调度,这会影响训练的资源利用率和性... 跨地域分布式机器学习(ML)训练能够联合多区域的云资源协作训练,可满足许多新兴ML场景(比如大型模型训练、联邦学习)的训练需求。但其训练效率仍受2方面挑战的制约。首先,多区域云资源缺乏有效的弹性调度,这会影响训练的资源利用率和性能;其次,模型跨地域同步需要在广域网(WAN)上高频通信,受WAN的低带宽和高波动的影响,会产生巨大通信开销。本文提出Cloudless-Training,从3个方面实现高效的跨地域分布式ML训练。首先,它基于serverless计算模式实现,使用控制层和训练执行层的2层架构,支持多云区域的弹性调度和通信。其次,它提供一种弹性调度策略,根据可用云资源的异构性和训练数据集的分布自适应地部署训练工作流。最后,它提供了2种高效的跨云同步策略,包括基于梯度累积的异步随机梯度下降(ASGD-GA)和跨云参数服务器(PS)间的模型平均(MA)。Cloudless-Training是基于OpenFaaS实现的,并被部署在腾讯云上评估,实验结果表明Cloudless-Training可显著地提高跨地域分布式ML训练的资源利用率(训练成本降低了9.2%~24.0%)和同步效率(训练速度最多比基线快1.7倍),并能保证模型的收敛精度。 展开更多
关键词 跨地域分布式机器学习(ML)训练 跨云ML训练 分布式训练框架 serverless 跨云模型同步
下载PDF
基于Tri-training GPR的半监督软测量建模方法
4
作者 马君霞 李林涛 熊伟丽 《化工学报》 EI CSCD 北大核心 2024年第7期2613-2623,共11页
集成学习因通过构建并结合多个学习器,常获得比单一学习器显著优越的泛化能力。但是在标记数据比例较少时,建立高性能的集成学习软测量模型依然是个挑战。针对这一个问题,提出一种基于半监督集成学习的软测量建模方法——Tri-training ... 集成学习因通过构建并结合多个学习器,常获得比单一学习器显著优越的泛化能力。但是在标记数据比例较少时,建立高性能的集成学习软测量模型依然是个挑战。针对这一个问题,提出一种基于半监督集成学习的软测量建模方法——Tri-training GPR模型。该建模策略充分发挥了半监督学习的优势,减轻建模过程对标记样本数据的需求,在低数据标签率下,仍能通过对无标记数据进行筛选从而扩充可用于建模的有标记样本数据集,并进一步结合半监督学习和集成学习的优势,提出一种新的选择高置信度样本的思路。将所提方法应用于青霉素发酵和脱丁烷塔过程,建立青霉素和丁烷浓度预测软测量模型,与传统的建模方法相比获得了更优的预测结果,验证了模型的有效性。 展开更多
关键词 软测量 集成学习 半监督学习 TRI-training 高斯过程回归 过程控制 动力学模型 化学过程
下载PDF
Recent Progresses in Deep Learning Based Acoustic Models 被引量:9
5
作者 Dong Yu Jinyu Li 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2017年第3期396-409,共14页
In this paper,we summarize recent progresses made in deep learning based acoustic models and the motivation and insights behind the surveyed techniques.We first discuss models such as recurrent neural networks(RNNs) a... In this paper,we summarize recent progresses made in deep learning based acoustic models and the motivation and insights behind the surveyed techniques.We first discuss models such as recurrent neural networks(RNNs) and convolutional neural networks(CNNs) that can effectively exploit variablelength contextual information,and their various combination with other models.We then describe models that are optimized end-to-end and emphasize on feature representations learned jointly with the rest of the system,the connectionist temporal classification(CTC) criterion,and the attention-based sequenceto-sequence translation model.We further illustrate robustness issues in speech recognition systems,and discuss acoustic model adaptation,speech enhancement and separation,and robust training strategies.We also cover modeling techniques that lead to more efficient decoding and discuss possible future directions in acoustic model research. 展开更多
关键词 Attention model convolutional neural network(CNN) connectionist temporal classification(CTC) deep learning(DL) long short-term memory(LSTM) permutation invariant training speech adaptation speech processing speech recognition speech separation
下载PDF
Enhanced UAV Pursuit-Evasion Using Boids Modelling:A Synergistic Integration of Bird Swarm Intelligence and DRL
6
作者 Weiqiang Jin Xingwu Tian +3 位作者 Bohang Shi Biao Zhao Haibin Duan Hao Wu 《Computers, Materials & Continua》 SCIE EI 2024年第9期3523-3553,共31页
TheUAV pursuit-evasion problem focuses on the efficient tracking and capture of evading targets using unmanned aerial vehicles(UAVs),which is pivotal in public safety applications,particularly in scenarios involving i... TheUAV pursuit-evasion problem focuses on the efficient tracking and capture of evading targets using unmanned aerial vehicles(UAVs),which is pivotal in public safety applications,particularly in scenarios involving intrusion monitoring and interception.To address the challenges of data acquisition,real-world deployment,and the limited intelligence of existing algorithms in UAV pursuit-evasion tasks,we propose an innovative swarm intelligencebased UAV pursuit-evasion control framework,namely“Boids Model-based DRL Approach for Pursuit and Escape”(Boids-PE),which synergizes the strengths of swarm intelligence from bio-inspired algorithms and deep reinforcement learning(DRL).The Boids model,which simulates collective behavior through three fundamental rules,separation,alignment,and cohesion,is adopted in our work.By integrating Boids model with the Apollonian Circles algorithm,significant improvements are achieved in capturing UAVs against simple evasion strategies.To further enhance decision-making precision,we incorporate a DRL algorithm to facilitate more accurate strategic planning.We also leverage self-play training to continuously optimize the performance of pursuit UAVs.During experimental evaluation,we meticulously designed both one-on-one and multi-to-one pursuit-evasion scenarios,customizing the state space,action space,and reward function models for each scenario.Extensive simulations,supported by the PyBullet physics engine,validate the effectiveness of our proposed method.The overall results demonstrate that Boids-PE significantly enhance the efficiency and reliability of UAV pursuit-evasion tasks,providing a practical and robust solution for the real-world application of UAV pursuit-evasion missions. 展开更多
关键词 UAV pursuit-evasion swarm intelligence algorithm Boids model deep reinforcement learning self-play training
下载PDF
Uncertainties of landslide susceptibility prediction:Influences of different spatial resolutions,machine learning models and proportions of training and testing dataset
7
作者 Faming Huang Zuokui Teng +2 位作者 Zizheng Guo Filippo Catani Jinsong Huang 《Rock Mechanics Bulletin》 2023年第1期65-81,共17页
This study aims to reveal the impacts of three important uncertainty issues in landslide susceptibility prediction(LSP),namely the spatial resolution,proportion of model training and testing datasets and selection of ... This study aims to reveal the impacts of three important uncertainty issues in landslide susceptibility prediction(LSP),namely the spatial resolution,proportion of model training and testing datasets and selection of machine learning models.Taking Yanchang County of China as example,the landslide inventory and 12 important conditioning factors were acquired.The frequency ratios of each conditioning factor were calculated under five spatial resolutions(15,30,60,90 and 120 m).Landslide and non-landslide samples obtained under each spatial resolution were further divided into five proportions of training and testing datasets(9:1,8:2,7:3,6:4 and 5:5),and four typical machine learning models were applied for LSP modelling.The results demonstrated that different spatial resolution and training and testing dataset proportions induce basically similar influences on the modeling uncertainty.With a decrease in the spatial resolution from 15 m to 120 m and a change in the proportions of the training and testing datasets from 9:1 to 5:5,the modelling accuracy gradually decreased,while the mean values of predicted landslide susceptibility indexes increased and their standard deviations decreased.The sensitivities of the three uncertainty issues to LSP modeling were,in order,the spatial resolution,the choice of machine learning model and the proportions of training/testing datasets. 展开更多
关键词 Landslide susceptibility prediction Uncertainty analysis Machine learning models Conditioning factors Spatial resolution Proportions of training and testing dataset
原文传递
浅析E-learning在中小学教师培训中的应用 被引量:1
8
作者 葛吉雪 《科教文汇》 2016年第1期24-26,共3页
培训是提升教师的教育教学技能与实践创新能力的重要途径。要让e-learning在中小学教师培训中发挥作用,就必须充分认识e-learning在教师培训中的必要性、加强e-learning基础设施建设、拓展e-learning资源、以多元方式对参训教师进行激... 培训是提升教师的教育教学技能与实践创新能力的重要途径。要让e-learning在中小学教师培训中发挥作用,就必须充分认识e-learning在教师培训中的必要性、加强e-learning基础设施建设、拓展e-learning资源、以多元方式对参训教师进行激励与评价。 展开更多
关键词 E-learning 中小学教师培训 案例培训模式
下载PDF
多元化教学模式在缺血性脑血管病介入进修医师培训中的应用探索 被引量:1
9
作者 韩丽娟 张曦 +4 位作者 陈志斌 金佳丽 王翀 徐运 李敬伟 《中国卒中杂志》 北大核心 2024年第2期240-244,共5页
目的 探讨多元化教学模式在提高缺血性脑血管病介入诊疗进修医师培训质量和效率方面的应用。方法 选择2018年1月-2022年12月在南京大学医学院附属鼓楼医院神经内科接受脑血管介入培训的进修医师为研究对象,应用多元化教学模式,即将多种... 目的 探讨多元化教学模式在提高缺血性脑血管病介入诊疗进修医师培训质量和效率方面的应用。方法 选择2018年1月-2022年12月在南京大学医学院附属鼓楼医院神经内科接受脑血管介入培训的进修医师为研究对象,应用多元化教学模式,即将多种教学方法融合交叉的培训模式进行教学。采用问卷调查的形式对进修医师满意度及其在培训前后介入诊疗理论知识和实践操作能力进行评估。结果 共纳入55名进修医师,年龄32~50岁,其中男性51名(92.73%)。89.09%的进修医师对多元化教学模式非常满意;分别有83.64%和85.45%的进修医师认为多元化教学模式激发了学习兴趣和自主学习能力。经过多元化教学模式培训后,能够独立完成颅外支架置入治疗的进修医师显著增加(41.82%vs. 12.73%,P=0.002)。结论 多元化教学模式是提高缺血性脑血管病介入进修医师培训质量和效率的有效手段。 展开更多
关键词 缺血性脑血管病介入培训 多元化教学模式 以问题为基础的教学法 以案例为基础的教学法 分阶段培训
下载PDF
增强提示学习的少样本文本分类方法 被引量:2
10
作者 李睿凡 魏志宇 +2 位作者 范元涛 叶书勤 张光卫 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期1-12,共12页
针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中... 针对少样本文本分类任务,提出提示学习增强的分类算法(EPL4FTC)。该算法将文本分类任务转换成基于自然语言推理的提示学习形式,在利用预训练语言模型先验知识的基础上实现隐式数据增强,并通过两种粒度的损失进行优化。为捕获下游任务中含有的类别信息,采用三元组损失联合优化方法,并引入掩码语言模型任务作为正则项,提升模型的泛化能力。在公开的4个中文文本和3个英文文本分类数据集上进行实验评估,结果表明EPL4FTC方法的准确度明显优于所对比的基线方法。 展开更多
关键词 预训练语言模型 少样本学习 文本分类 提示学习 三元组损失
下载PDF
多模态方面级情感分析的多视图交互学习网络 被引量:1
11
作者 王旭阳 庞文倩 赵丽婕 《计算机工程与应用》 CSCD 北大核心 2024年第7期92-100,共9页
以往的多模态方面级情感分析方法只利用预训练模型的一般文本和图片表示,对方面和观点词相关性的识别不敏感,且不能动态获取图片信息对单词表示的贡献,因而不能充分识别多模态与方面之间的相关性。针对上述问题,提出一种多视图交互学习... 以往的多模态方面级情感分析方法只利用预训练模型的一般文本和图片表示,对方面和观点词相关性的识别不敏感,且不能动态获取图片信息对单词表示的贡献,因而不能充分识别多模态与方面之间的相关性。针对上述问题,提出一种多视图交互学习网络模型。将句子从上下文和句法两个视图上分别提取特征,以便在多模态交互时充分利用到文本的全局特征;对文本、图片和方面之间的关系进行建模,使模型实现多模态交互;同时融合不同模态的交互表示,动态获取视觉信息对文本中每个单词的贡献程度,充分提取模态与方面之间的相关性。最后通过全连接层和Softmax层获取情感分类结果。在两个数据集上进行实验,实验结果表明该模型能够有效增强多模态方面级情感分类的效果。 展开更多
关键词 多模态方面级情感分析 预训练模型 多视图学习 多模态交互 动态融合
下载PDF
实践创新能力驱动的化工人才培养模式构建与实施
12
作者 焦纬洲 刘志伟 +3 位作者 张超 袁志国 祁贵生 高璟 《大学化学》 CAS 2024年第7期76-81,共6页
以中北大学“化学工程与工艺”专业为例,构建“学训赛创”四元互促人才培养模式,在扎实的理论教学基础上,融入实验、实习、实训,并结合学科赛事,全面提升学生实践创新能力。实践结果表明,该模式强化了学生对复杂工程问题的处理能力,并... 以中北大学“化学工程与工艺”专业为例,构建“学训赛创”四元互促人才培养模式,在扎实的理论教学基础上,融入实验、实习、实训,并结合学科赛事,全面提升学生实践创新能力。实践结果表明,该模式强化了学生对复杂工程问题的处理能力,并显著提升了师资水平,为行业培养了工程创新人才,展现出良好的示范性和推广价值。 展开更多
关键词 工程实践 人才培养 “学训赛创”模式 四元互促
下载PDF
引入知识增强和对比学习的知识图谱补全
13
作者 刘娟 段友祥 +1 位作者 陆誉翕 张鲁 《计算机工程》 CAS CSCD 北大核心 2024年第7期112-122,共11页
知识图谱补全是提高知识图谱质量的重要手段,主要分为基于结构和基于描述的方法。基于结构的补全方法对图谱中常见的长尾实体推理性能表现不佳,基于描述的补全方法在描述信息利用和负样本信息学习方面存在不足。针对上述问题,提出基于... 知识图谱补全是提高知识图谱质量的重要手段,主要分为基于结构和基于描述的方法。基于结构的补全方法对图谱中常见的长尾实体推理性能表现不佳,基于描述的补全方法在描述信息利用和负样本信息学习方面存在不足。针对上述问题,提出基于知识增强的知识图谱补全方法KEKGC。设计一种特定模板,将三元组及其描述信息通过人工定义的模板转换为连贯的自然语言描述语句输入预训练语言模型,增强语言模型对三元组结构知识与描述知识的理解能力。在此基础上,提出一种对比学习框架来提高链接预测任务的效率与准确率,通过建立记忆库存储实体嵌入向量,从中选择正负样本并结合Info NCE损失进行训练。实验结果显示,相较于MEM-KGC,KEKGC在WN18RR数据集上链接预测任务的平均倒数秩(MRR)提升了5.5,Hits@1、Hits@3、Hits@10指标分别提升了2.8、0.7、4.2个百分点,三元组分类任务准确率达到94.1%,表明所提方法具有更高的预测准确率与更好的泛化能力,尤其对于长尾实体,能够有效提升图谱补全的效果与效率。 展开更多
关键词 知识图谱 预训练语言模型 链接预测 对比学习 实体描述
下载PDF
Temporally Preserving Latent Variable Models:Offline and Online Training for Reconstruction and Interpretation of Fault Data for Gearbox Condition Monitoring
14
作者 Ryan Balshaw P.Stephan Heyns +1 位作者 Daniel N.Wilke Stephan Schmidt 《Journal of Dynamics, Monitoring and Diagnostics》 2024年第2期156-177,共22页
Latent variable models can effectively determine the condition of essential rotating machinery without needing labeled data.These models analyze vibration data via an unsupervised learning strategy.Temporal preservati... Latent variable models can effectively determine the condition of essential rotating machinery without needing labeled data.These models analyze vibration data via an unsupervised learning strategy.Temporal preservation is necessary to obtain an informative latent manifold for the fault diagnosis task.In a temporalpreserving context,two approaches exist to develop a condition-monitoring methodology:offline and online.For latent variable models,the available training modes are not different.While many traditional methods use offline training,online training can dynamically adjust the latent manifold,possibly leading to better fault signature extraction from the vibration data.This study explores online training using temporal-preserving latent variable models.Within online training,there are two main methods:one focuses on reconstructing data and the other on interpreting the data components.Both are considered to evaluate how they diagnose faults over time.Using two experimental datasets,the study confirms that models from both training modes can detect changes in machinery health and identify faults even under varying conditions.Importantly,the complementarity of offline and online models is emphasized,reassuring their versatility in fault diagnostics.Understanding the implications of the training approach and the available model formulations is crucial for further research in latent variable modelbased fault diagnostics. 展开更多
关键词 Condition monitoring unsupervised learning latent variable models temporal preservation training approaches
下载PDF
在线研修中教师深度学习测评模型构建及支持对策研究
15
作者 李宝敏 张杨紫棋 《中国电化教育》 北大核心 2024年第6期70-77,共8页
在线研修是“互联网+”时代促进教师专业发展的重要途径之一,随着国家智慧教育云平台服务的增强,在线研修的教师人数逐年增长,如何评价在线研修中教师深度学习成为亟需解决的问题。该研究基于比格斯的学习一般过程模型与布鲁姆认知目标... 在线研修是“互联网+”时代促进教师专业发展的重要途径之一,随着国家智慧教育云平台服务的增强,在线研修的教师人数逐年增长,如何评价在线研修中教师深度学习成为亟需解决的问题。该研究基于比格斯的学习一般过程模型与布鲁姆认知目标、辛普森动作技能目标和克拉斯沃尔情感目标分类体系构建了教师深度学习评价模型,并从中提取了价值认同、理解迁移、系统建构、反思批判与问题解决五个评价深度学习的核心要素。基于评价模型编制了“教师深度学习评价量表”,从教师先验知识、学习过程和学习结果三个方面对917位教师进行测评。研究发现:(1)参与在线研修的教师深度学习比例较低;(2)不同教龄、先验知识的教师在深度学习时存在显著的群体差异;(3)成就动机与元认知策略是影响教师深度学习的关键因素;(4)教师深度学习的五大核心能力发展尚不均衡,教师联系型及创新型问题解决能力有待加强,批判性思维能力有待改善,教师对在线研修价值认同感不足,研修内容与学习需求的匹配度有待提升。鉴于此,提出了促进教师深度学习的策略与建议。 展开更多
关键词 在线研修 教师学习 深度学习 深度学习评价 评价模型
下载PDF
基于视觉-语言预训练模型的零样本迁移学习方法综述
16
作者 孙仁科 许靖昊 +2 位作者 皇甫志宇 李仲年 许新征 《计算机工程》 CAS CSCD 北大核心 2024年第10期1-15,共15页
近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能,多模态学习的重要性和必要性逐渐展现出来,其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模... 近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能,多模态学习的重要性和必要性逐渐展现出来,其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模型强大的泛化性能,使用视觉-语言预训练模型不仅能提高零样本识别任务的准确率,而且能够解决部分传统方法无法解决的零样本下游任务问题。对基于视觉-语言预训练模型的ZST方法进行概述,首先介绍了零样本学习(FSL)的传统方法,并对其主要形式加以总结;然后阐述了基于视觉-语言预训练模型的ZST和FSL的区别及其可以解决的新任务;其次介绍了基于视觉-语言预训练模型的ZST方法在样本识别、目标检测、语义分割、跨模态生成等下游任务中的应用情况;最后对现有的基于视觉-语言预训练模型的ZST方法存在的问题进行分析并对未来的研究方向进行展望。 展开更多
关键词 零样本学习 视觉-语言预训练模型 零样本迁移 多模态 计算机视觉
下载PDF
基于提示学习和超球原型的小样本ICD自动编码方法
17
作者 徐春 吉双焱 马志龙 《计算机应用研究》 CSCD 北大核心 2024年第9期2670-2677,共8页
针对国际疾病分类(ICD)自动编码方法的长文本处理、编码的层次结构以及长尾分布等导致的模型泛化能力弱的问题,提出一种充分利用医学预训练语言模型的基于提示学习和超球原型的小样本ICD自动编码方法(hypersphere prototypical with pro... 针对国际疾病分类(ICD)自动编码方法的长文本处理、编码的层次结构以及长尾分布等导致的模型泛化能力弱的问题,提出一种充分利用医学预训练语言模型的基于提示学习和超球原型的小样本ICD自动编码方法(hypersphere prototypical with prompt learning,PromptHP)。首先,将编码描述与临床文本融合进提示学习模型中的提示模板,使得模型能够更加深入地理解临床文本;然后,充分利用预训练语言模型的先验知识进行初始预测;接着,在预训练语言模型输出表示的基础上引入超球原型进行类别建模和度量分类,并在医学数据集上微调网络,充分纳入数据知识,提高模型在小样本ICD编码分配任务上的性能;最后,对以上两部分预测结果集成加权获得最终编码预测结果。在公开医学数据集MIMIC-Ⅲ上的实验结果表明,该模型优于最先进的基线方法,PromptHP将小样本编码的macro-AUC、micro-AUC、macro-F_(1)和micro-F_(1)分别提高了1.77%、1.54%、14.22%、15.01%。实验结果验证了该模型在小样本编码分类任务中的有效性。 展开更多
关键词 自动ICD编码 小样本学习 提示学习 超球原型 预训练语言模型
下载PDF
文本相似度计算方法综述
18
作者 魏嵬 丁香香 +2 位作者 郭梦星 杨钊 刘辉 《计算机工程》 CAS CSCD 北大核心 2024年第9期18-32,共15页
文本相似度计算是自然语言处理的一部分,用来计算两个词、句子及文本之间的相似程度,具有多种应用场景,文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面,随着词向量的提出,文本相似度计算可进... 文本相似度计算是自然语言处理的一部分,用来计算两个词、句子及文本之间的相似程度,具有多种应用场景,文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面,随着词向量的提出,文本相似度计算可进行基于统计以及深度学习的建模与计算,也可与预训练模型相结合。首先,将文本相似度计算方法分为基于字符串、基于词向量、基于预训练模型、基于深度学习、其他方法5类,并对这些方法进行简要介绍。然后,根据不同文本相似度计算方法的原理,具体介绍了编辑距离、汉明距离、词袋模型、向量空间模型(VSM)、深度结构语义模型(DSSM)、句子嵌入的简单对比学习(SimCSE)等常见方法。最后,对文本相似度计算常用的数据集以及评价标准进行整理和分析,并对文本相似度计算的未来发展进行展望。 展开更多
关键词 文本相似度 字符串 词向量 预训练模型 深度学习
下载PDF
基于对比学习与梯度惩罚的实体关系联合抽取模型
19
作者 张强 曾俊玮 陈锐 《吉林大学学报(理学版)》 CAS 北大核心 2024年第5期1155-1162,共8页
针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池... 针对使用全局指针网络进行实体关系抽取时特征信息不明显的实体关系类型数据稀疏问题,以及数据中存在的类别不平衡和错误标注问题,提出一种基于对比学习和梯度惩罚方法并使用改进的RoBERTa预训练模型的实体关系联合抽取模型,在阿里天池中文医疗信息处理评测基准数据集CBLUE2.0上进行实验的结果表明,该模型相比全局指针网络效果更优,能更有效完成复杂数据的实体关系抽取. 展开更多
关键词 实体关系抽取 对比学习 梯度惩罚 RoBERTa预训练模型 全局指针网络
下载PDF
基于视觉注意力的图文跨模态情感分析
20
作者 王法玉 郝攀征 《计算机工程与设计》 北大核心 2024年第2期601-607,共7页
针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的... 针对单模态情感分析无法完全捕获情感信息的问题,提出一种图像和文本跨模态情感分析模型(BERT-VistaNet),该模型没有直接使用视觉信息作为特征,而是利用视觉信息作为对齐方式,使用注意力机制指出文本中重要的句子,得到基于视觉注意力的文档表示。对于视觉注意力无法完全覆盖的文本内容,使用BERT模型对文本进行情感分析,得到基于文本的文档表示,将特征进行融合应用于情感分类任务。在Yelp公开餐厅数据集上,该模型相比基线模型TFN-aVGG,准确率提高了43%,相比VistaNet模型准确率提高了1.4%。 展开更多
关键词 情感分析 视觉注意力机制 跨模态 深度学习 特征融合 预训练模型 双向门控单元
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部