期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
Long Short-Term Memory Recurrent Neural Network-Based Acoustic Model Using Connectionist Temporal Classification on a Large-Scale Training Corpus 被引量:9
1
作者 Donghyun Lee Minkyu Lim +4 位作者 Hosung Park Yoseb Kang Jeong-Sik Park Gil-Jin Jang Ji-Hwan Kim 《China Communications》 SCIE CSCD 2017年第9期23-31,共9页
A Long Short-Term Memory(LSTM) Recurrent Neural Network(RNN) has driven tremendous improvements on an acoustic model based on Gaussian Mixture Model(GMM). However, these models based on a hybrid method require a force... A Long Short-Term Memory(LSTM) Recurrent Neural Network(RNN) has driven tremendous improvements on an acoustic model based on Gaussian Mixture Model(GMM). However, these models based on a hybrid method require a forced aligned Hidden Markov Model(HMM) state sequence obtained from the GMM-based acoustic model. Therefore, it requires a long computation time for training both the GMM-based acoustic model and a deep learning-based acoustic model. In order to solve this problem, an acoustic model using CTC algorithm is proposed. CTC algorithm does not require the GMM-based acoustic model because it does not use the forced aligned HMM state sequence. However, previous works on a LSTM RNN-based acoustic model using CTC used a small-scale training corpus. In this paper, the LSTM RNN-based acoustic model using CTC is trained on a large-scale training corpus and its performance is evaluated. The implemented acoustic model has a performance of 6.18% and 15.01% in terms of Word Error Rate(WER) for clean speech and noisy speech, respectively. This is similar to a performance of the acoustic model based on the hybrid method. 展开更多
关键词 acoustic model connectionisttemporal classification LARGE-SCALE trainingcorpus LONG SHORT-TERM memory recurrentneural network
下载PDF
引入预训练表示混合矢量量化和CTC的语音转换
2
作者 王琳 黄浩 《计算机工程》 CAS CSCD 北大核心 2024年第4期313-320,共8页
预训练模型通过自监督学习表示在非平行语料语音转换(VC)取得了重大突破。随着自监督预训练表示(SSPR)的广泛使用,预训练模型提取的特征中被证实包含更多的内容信息。提出一种基于SSPR同时结合矢量量化(VQ)和联结时序分类(CTC)的VC模型... 预训练模型通过自监督学习表示在非平行语料语音转换(VC)取得了重大突破。随着自监督预训练表示(SSPR)的广泛使用,预训练模型提取的特征中被证实包含更多的内容信息。提出一种基于SSPR同时结合矢量量化(VQ)和联结时序分类(CTC)的VC模型。将预训练模型提取的SSPR作为端到端模型的输入,用于提高单次语音转换质量。如何有效地解耦内容表示和说话人表示成为语音转换中的关键问题。使用SSPR作为初步的内容信息,采用VQ从语音中解耦内容和说话人表示。然而,仅使用VQ只能将内容信息离散化,很难将纯粹的内容表示从语音中分离出来,为了进一步消除内容信息中说话人的不变信息,提出CTC损失指导内容编码器。CTC不仅作为辅助网络加快模型收敛,同时其额外的文本监督可以与VQ联合优化,实现性能互补,学习纯内容表示。说话人表示采用风格嵌入学习,2种表示作为系统的输入进行语音转换。在开源的CMU数据集和VCTK语料库对所提的方法进行评估,实验结果表明,该方法在客观上的梅尔倒谱失真(MCD)达到8.896 d B,在主观上的语音自然度平均意见分数(MOS)和说话人相似度MOS分别为3.29和3.22,均优于基线模型,此方法在语音转换的质量和说话人相似度上能够获得最佳性能。 展开更多
关键词 预训练表示 自监督学习 矢量量化 解耦 联结时序分类
下载PDF
联合CTC和Transformer的轮式移动机器人语音控制研究
3
作者 唐咸荣 高瑞贞 《中国测试》 CAS 北大核心 2024年第6期117-123,共7页
针对人机交互过程中手动控制轮式移动机器人步骤繁琐且双手受到限制的问题,提出并实现基于深度学习算法的轮式移动机器人语音控制系统。系统选取树莓派4B开发板作为主控制器,科大讯飞6阵列语音模块作为语音采集器,STM32单片机作为底层... 针对人机交互过程中手动控制轮式移动机器人步骤繁琐且双手受到限制的问题,提出并实现基于深度学习算法的轮式移动机器人语音控制系统。系统选取树莓派4B开发板作为主控制器,科大讯飞6阵列语音模块作为语音采集器,STM32单片机作为底层轮式移动机器人的控制器。语音识别算法部分设计基于Transformer的端到端语音识别模型,并加入连续时序分类算法来辅助模型的训练,模型的收敛速度和鲁棒性都得到相应的提升。模型在AISHELL-1语音数据集上测试的字错率为5.57%,相对于Transformer单独训练,字错率相对下降5.1%。经过平台搭建和实验,实现轮式移动机器人根据用户语音指令完成相对应动作的目的,有利于提高工作效率和解放用户的双手。 展开更多
关键词 轮式移动机器人 语音控制 TRANSFORMER 连接时序分类
下载PDF
协调语音能量区域的正则化优化算法
4
作者 师晨康 薛珮芸 +1 位作者 白静 赵建星 《计算机工程与设计》 北大核心 2024年第7期2173-2179,共7页
为有效解决语音识别模型过拟合问题,提出一种协调语音能量区域的正则化优化算法。根据语音的共振峰特性,对语音信号高能量区域进行集体失活处理,增加模型对语音信号低能量区域的关注度;为进一步提升声学模型性能,采用堆叠8层的门控卷积... 为有效解决语音识别模型过拟合问题,提出一种协调语音能量区域的正则化优化算法。根据语音的共振峰特性,对语音信号高能量区域进行集体失活处理,增加模型对语音信号低能量区域的关注度;为进一步提升声学模型性能,采用堆叠8层的门控卷积神经网络提取语音时序特征,并对其中的门控机制进行优化,缓解梯度衰减现象;采用联结时序分类算法以汉字为建模单元对语音识别模型进行训练和解码。在公开中文语音数据集Aishell-1上的实验结果表明,该语音识别模型字错率降低至11.27%,与基线模型相比,字错率下降了7.93%,验证了该方法的有效性。 展开更多
关键词 语音识别 声学模型 语音能量区域 正则化 卷积神经网络 联结时序分类 深度学习
下载PDF
Continuous Sign Language Recognition Based on Spatial-Temporal Graph Attention Network 被引量:2
5
作者 Qi Guo Shujun Zhang Hui Li 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第3期1653-1670,共18页
Continuous sign language recognition(CSLR)is challenging due to the complexity of video background,hand gesture variability,and temporal modeling difficulties.This work proposes a CSLR method based on a spatialtempora... Continuous sign language recognition(CSLR)is challenging due to the complexity of video background,hand gesture variability,and temporal modeling difficulties.This work proposes a CSLR method based on a spatialtemporal graph attention network to focus on essential features of video series.The method considers local details of sign language movements by taking the information on joints and bones as inputs and constructing a spatialtemporal graph to reflect inter-frame relevance and physical connections between nodes.The graph-based multihead attention mechanism is utilized with adjacent matrix calculation for better local-feature exploration,and short-term motion correlation modeling is completed via a temporal convolutional network.We adopted BLSTM to learn the long-termdependence and connectionist temporal classification to align the word-level sequences.The proposed method achieves competitive results regarding word error rates(1.59%)on the Chinese Sign Language dataset and the mean Jaccard Index(65.78%)on the ChaLearn LAP Continuous Gesture Dataset. 展开更多
关键词 Continuous sign language recognition graph attention network bidirectional long short-term memory connectionist temporal classification
下载PDF
计算音系学:原理、方法及未来发展
6
作者 赵永刚 黄捷 《外国语文》 北大核心 2023年第6期69-83,共15页
计算音系学是计算语言学的一个分支,自然语言处理中的文语转换、语音合成和语音识别都与其密切相关。本文首先对计算音系学及其研究对象进行详细介绍,接着详细分析了计算音系学的两种主要研究方法——有限状态模式和联结主义方法,最后... 计算音系学是计算语言学的一个分支,自然语言处理中的文语转换、语音合成和语音识别都与其密切相关。本文首先对计算音系学及其研究对象进行详细介绍,接着详细分析了计算音系学的两种主要研究方法——有限状态模式和联结主义方法,最后依据国内外音系学研究现状,指出自然语言处理以及计算机科学研究应更多地关注和研究自然语言的音系现象,利用数学、逻辑学等工具,多维结合,共同推进人工智能的发展。 展开更多
关键词 计算音系学 有限状态模式 联结主义方法 自然语言处理
下载PDF
An Efficient Hybrid Model for Arabic Text Recognition
7
作者 Hicham Lamtougui Hicham El Moubtahij +1 位作者 Hassan Fouadi Khalid Satori 《Computers, Materials & Continua》 SCIE EI 2023年第2期2871-2888,共18页
In recent years,Deep Learning models have become indispensable in several fields such as computer vision,automatic object recognition,and automatic natural language processing.The implementation of a robust and effici... In recent years,Deep Learning models have become indispensable in several fields such as computer vision,automatic object recognition,and automatic natural language processing.The implementation of a robust and efficient handwritten text recognition system remains a challenge for the research community in this field,especially for the Arabic language,which,compared to other languages,has a dearth of published works.In this work,we presented an efficient and new system for offline Arabic handwritten text recognition.Our new approach is based on the combination of a Convolutional Neural Network(CNN)and a Bidirectional Long-Term Memory(BLSTM)followed by a Connectionist Temporal Classification layer(CTC).Moreover,during the training phase of the model,we introduce an algorithm of data augmentation to increase the quality of data.Our proposed approach can recognize Arabic handwritten texts without the need to segment the characters,thus overcoming several problems related to this point.To train and test(evaluate)our approach,we used two Arabic handwritten text recognition databases,which are IFN/ENIT and KHATT.The Experimental results show that our new approach,compared to other methods in the literature,gives better results. 展开更多
关键词 Deep learning arabic handwritten text recognition convolutional neural network(CNN) bidirectional long-term memory(BLSTM) connectionist temporal classification(CTC)
下载PDF
基于视频的中文连续手语识别算法 被引量:1
8
作者 刘诗瑶 张忠民 《应用科技》 CAS 2023年第3期44-49,共6页
连续手语识别是将视频序列转为符号序列的典型的弱监督问题,它只提供了句子级标签,没有提供有时间边界的帧级标签。为了克服这一问题,就需要使用连接时态分类(connectionist temporal classification,CTC),这也是目前应用最广泛的方法... 连续手语识别是将视频序列转为符号序列的典型的弱监督问题,它只提供了句子级标签,没有提供有时间边界的帧级标签。为了克服这一问题,就需要使用连接时态分类(connectionist temporal classification,CTC),这也是目前应用最广泛的方法。实验在特征提取阶段引入时间-空间注意力机制,并增加辅助对齐模块,利用聚合交叉熵(agregation cross-entropy,ACE)散度损失对特征提取部分进行训练。该模型采用端到端方式,结合ACE散度进行片段级特征学习和CTC进行全局序列特征学习的联合训练,此外,提出的随机掉帧机制还可以进一步缓解过拟合问题。在中文手语数据集CSLR上验证了改进方法的有效性,在验证集上获得了6.9%错误率,在测试集上获得了4.3%错误率。 展开更多
关键词 连续手语识别 注意力机制 时间-空间注意力机制 连接时态分类 联合训练 弱监督 跨模态 深度学习
下载PDF
使用Conformer增强的混合CTC/Attention端到端中文语音识别 被引量:5
9
作者 陈戈 谢旭康 +1 位作者 孙俊 陈祺东 《计算机工程与应用》 CSCD 北大核心 2023年第4期97-103,共7页
最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问... 最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问题,使用Conformer代替Transformer,提出Conformer-LAS模型。由于Attention过于灵活的对齐方式,使得在嘈杂环境中的效果急剧下降,采用连接时序分类(connectionist temporal classification,CTC)辅助训练以加快收敛,并加入音素级别的中间CTC损失联合优化,提出了效果更好的Conformer-LAS-CTC语音识别模型。在开源中文普通话Aishell-1数据集上对提出来的模型进行验证,实验结果表明,Conformer-LAS-CTC相对于采用的基线BLSTM-LAS和Transformer-LAS模型在测试集上的字错率分别相对降低了22.58%和48.76%,模型最终字错误率为4.54%。 展开更多
关键词 端到端 语音识别 CONFORMER LAS 连接时序分类
下载PDF
一种改进的线性注意力机制语音识别方法 被引量:1
10
作者 李宜亭 屈丹 +2 位作者 杨绪魁 张昊 沈小龙 《信号处理》 CSCD 北大核心 2023年第3期516-525,共10页
Conformer模型因其优越的性能,吸引了越来越多研究者的关注,逐渐成为语音识别领域的主流模型,但因其采用注意力机制从输入中提取信息,需要对输入序列中所有样本点进行交互计算,导致网络计算复杂度为输入序列长度的平方,因此在对长语音... Conformer模型因其优越的性能,吸引了越来越多研究者的关注,逐渐成为语音识别领域的主流模型,但因其采用注意力机制从输入中提取信息,需要对输入序列中所有样本点进行交互计算,导致网络计算复杂度为输入序列长度的平方,因此在对长语音进行识别时需要消耗更多计算资源,其识别速度较慢。针对此问题,本文提出一种线性注意力机制的语音识别方法。首先,提出一种新型门控线性注意力结构将多头注意力改进为单头,将注意力计算复杂度改进为序列长度的线性关系,以有效减少注意力计算复杂度。其次,为了弥补使用线性注意力导致的模型建模能力下降,在线性注意力求解过程中,综合使用局部注意力和全局注意力,联合线性注意力编码,提高模型识别精度。最后,为了进一步提升模型识别效果,在注意力损失和连接时序分类(connectionist temporal classification,CTC)损失的基础上使用注意力引导损失和中间CTC损失融合建模目标函数。在中文普通话数据集AISHELL-1和英文LibriSpeech数据集上的实验结果表明,改进模型的性能明显优于基线模型,且模型显存消耗下降,训练、识别速度得到较大提升。 展开更多
关键词 语音识别 端到端 高效注意力 连接时序分类 CONFORMER
下载PDF
基于CNN-GRU-CTC的藏族学生普通话发音偏误检测 被引量:1
11
作者 梁青青 周小燕 赵春艳 《兰州文理学院学报(自然科学版)》 2023年第5期47-51,共5页
为了提高藏族学生学习普通话的发音水平,根据普通话和藏语发音特点设计并录制了一个偏误语音语料库,并结合卷积神经网络(Convolutional Neural Network,CNN)、门控循环单元(Gated Recurrent Unit,GRU)技术和连接时序分类技术(Connection... 为了提高藏族学生学习普通话的发音水平,根据普通话和藏语发音特点设计并录制了一个偏误语音语料库,并结合卷积神经网络(Convolutional Neural Network,CNN)、门控循环单元(Gated Recurrent Unit,GRU)技术和连接时序分类技术(Connectionist Temporal Classification,CTC)搭建CNN-GRU-CTC声学模型,提出了一种发音偏误检测的方法.该方法将语音转换为一张图像作为输入,对完整的语谱图进行数据提取,利用深度全序列卷积神经网络进行建模,使用自动语音识别框架来进行发音偏误检测.实验结果表明:在该模型下,系统检测准确率为88.55%,错误拒绝率为7.16%,联合错误率为14.94%.该方法可以有效检测出错误发音,性能优于其他模型,可以用于检测和纠正藏族学生学习普通话时的错误发音,提高藏族学生的普通话发音水平. 展开更多
关键词 发音偏误检测 卷积神经网络 门控循环单元 连接时序分类
下载PDF
基于注意力多分支卷积和Transformer的手写文本识别
12
作者 郑晓旭 舒珊珊 文成玉 《成都信息工程大学学报》 2023年第6期649-655,共7页
手写体识别技术作为自动阅卷的关键一环受到广泛研究。针对中文手写文本字迹复杂的问题,提出一种文本定位和识别的手写汉字文本识别方法。在文本定位信息中使用透视变化纠正倾斜的文本,特征提取阶段使用注意力多分支卷积层提取文本图像... 手写体识别技术作为自动阅卷的关键一环受到广泛研究。针对中文手写文本字迹复杂的问题,提出一种文本定位和识别的手写汉字文本识别方法。在文本定位信息中使用透视变化纠正倾斜的文本,特征提取阶段使用注意力多分支卷积层提取文本图像关键区域特征以及多尺度特征融合,语义提取阶段通过时间卷积网络和Transformer编码器构建序列信息和建模上下文语义信息,最后以链接时序分类函数,实现序列特征和字符序列标签对齐。所提方法在公开数据集CASIA-HWDB上进行实验,结果表明,注意力分支卷积层和语义提取层有效提升算法性能,证明所提方法的可行性。 展开更多
关键词 手写文本识别 TRANSFORMER 注意力机制 链接时序分类
下载PDF
基于连续语音识别技术的猪连续咳嗽声识别 被引量:21
13
作者 黎煊 赵建 +3 位作者 高云 刘望宏 雷明刚 谭鹤群 《农业工程学报》 EI CAS CSCD 北大核心 2019年第6期174-180,共7页
针对现有基于孤立词识别技术的猪咳嗽声识别存在识别声音种类有限,无法反映实际患病猪连续咳嗽的问题,该文提出了基于双向长短时记忆网络-连接时序分类模型(birectional long short-termmemory-connectionist temporal classification,B... 针对现有基于孤立词识别技术的猪咳嗽声识别存在识别声音种类有限,无法反映实际患病猪连续咳嗽的问题,该文提出了基于双向长短时记忆网络-连接时序分类模型(birectional long short-termmemory-connectionist temporal classification,BLSTM-CTC)构建猪声音声学模型,进行猪场环境猪连续咳嗽声识别的方法,以此进行猪早期呼吸道疾病的预警和判断。研究了体质量为75 kg左右长白猪单个咳嗽声样本的持续时间长度和能量大小的时域特征,构建了声音样本持续时间在0.24~0.74 s和能量大于40.15 V^2·s的阈值范围。在此阈值范围内,利用单参数双门限端点检测算法对基于多窗谱的心理声学语音增强算法处理后的30 h猪场声音进行检测,得到222段试验语料。将猪场环境下的声音分为猪咳嗽声和非猪咳嗽声,并以此作为声学模型建模单元,进行语料的标注。提取26维梅尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)作为试验语段特征参数。通过BLSTM网络学习猪连续声音的变化规律,并利用CTC实现了端到端的猪连续声音识别系统。5折交叉验证试验平均猪咳嗽声识别率达到92.40%,误识别率为3.55%,总识别率达到93.77%。同时,以数据集外1 h语料进行了算法应用测试,得到猪咳嗽声识别率为94.23%,误识别率为9.09%,总识别率为93.24%。表明基于连续语音识别技术的BLSTM-CTC猪咳嗽声识别模型是稳定可靠的。该研究可为生猪健康养殖过程中猪连续咳嗽声的识别和疾病判断提参考。 展开更多
关键词 信号处理 声音信号 识别 生猪产业 连续咳嗽声 双向长短时记忆网络-连接时序分类模型 声学模型
下载PDF
不对称品牌联盟对弱势品牌稀释研究:“攀龙附凤”还是“引火烧身”? 被引量:10
14
作者 郭锐 严良 +1 位作者 苏晨汀 周南 《中国软科学》 CSSCI 北大核心 2010年第2期132-141,共10页
本研究借助最小均方联结模型来解释和分析不对称品牌联盟对弱势品牌的稀释作用。同时,利用实验证明了该种稀释作用的存在,而且可以利用业务多元化和品牌互补性来调节或减缓该负面作用。该研究对中国日益盛行的国内和国际品牌联盟提出警... 本研究借助最小均方联结模型来解释和分析不对称品牌联盟对弱势品牌的稀释作用。同时,利用实验证明了该种稀释作用的存在,而且可以利用业务多元化和品牌互补性来调节或减缓该负面作用。该研究对中国日益盛行的国内和国际品牌联盟提出警示即中国品牌与国际品牌的联合可能由"攀龙附凤"的惊喜落到"引火烧身"的恶果。 展开更多
关键词 品牌联盟非对称性 品牌稀释 最小均方模型(LMS) 业务多元化 品牌互补性
下载PDF
决策的选择偏好研究述评 被引量:19
15
作者 李艾丽莎 张庆林 《心理科学进展》 CSSCI CSCD 北大核心 2006年第4期618-624,共7页
决策的选择偏好具有可变性。当前主要有三类不同取向的解释。第一类观点以效用概念为核心,分别讨论了评价模式和效用折扣对选择偏好的影响。第二类观点以心理表征概念为基础,分别提出了建构水平和表征差别对选择偏好的影响。第三类观点... 决策的选择偏好具有可变性。当前主要有三类不同取向的解释。第一类观点以效用概念为核心,分别讨论了评价模式和效用折扣对选择偏好的影响。第二类观点以心理表征概念为基础,分别提出了建构水平和表征差别对选择偏好的影响。第三类观点以联结和人工神经网络概念为要素,分别探讨了心理场距离和规避损失偏向对选择偏好的影响。 展开更多
关键词 决策 选择偏好 效用 心理表征 联结网络
下载PDF
他人知觉的个体构念动态交互模型 被引量:16
16
作者 崔诣晨 王沛 《心理科学进展》 CSSCI CSCD 北大核心 2018年第4期678-687,共10页
他人知觉的个体构念动态交互模型关注在感知他人时不同信息加工水平之间的互动模式,主张低阶加工(如对面孔、声音和肢体运动线索的加工)、类别化加工、刻板印象激活与高阶认知加工之间的交互作用所形成的动态系统对他人知觉起着调控作... 他人知觉的个体构念动态交互模型关注在感知他人时不同信息加工水平之间的互动模式,主张低阶加工(如对面孔、声音和肢体运动线索的加工)、类别化加工、刻板印象激活与高阶认知加工之间的交互作用所形成的动态系统对他人知觉起着调控作用。该动态系统包含提示水平、类别水平、刻板印象水平和高阶水平。由于各加工水平之间的交互作用,这一动态系统在神经网络、加工水平以及加工时间维度上形成了一个具有动态建构特征的循环联结网络,该网络对他人知觉产生动态交互效应。正是这种动态交互效应使得他人印象在个体构念中变得有意义、有秩序和可预测。未来研究应从社会文化与情境互动模式出发,利用内隐社会认知测量与认知神经科学方法,进一步探测个体构念动态交互效应的认知神经基础和社会动因,为他人知觉个体构念的动态建构提供更为坚实的理论与实证依据。 展开更多
关键词 他人知觉 个体构念 循环联结网络 社会类别 刻板印象
下载PDF
学习控制系统 被引量:6
17
作者 邓志东 张再兴 孙增圻 《信息与控制》 CSCD 北大核心 1996年第2期94-103,共10页
一般性地论述了学习控制的基本理论问题,给出了学习与学习控制系统的若干定义,探讨了学习控制与智能控制的关系.基于学习控制的发展历史与研究现状,将学习控制系统划分为基于模式识别的学习控制、异步自学习控制及连接主义的学习控制等... 一般性地论述了学习控制的基本理论问题,给出了学习与学习控制系统的若干定义,探讨了学习控制与智能控制的关系.基于学习控制的发展历史与研究现状,将学习控制系统划分为基于模式识别的学习控制、异步自学习控制及连接主义的学习控制等,并给出了有关的研究进展及存在的问题.最后指出,与模糊逻辑、专家系统的进一步结合,是学习控制系统发展的必然趋势. 展开更多
关键词 学习控制 智能控制 模糊逻辑 专家系统
下载PDF
汉字阅读的联结主义模型 被引量:8
18
作者 杨剑峰 舒华 《心理学报》 CSSCI CSCD 北大核心 2008年第5期516-522,共7页
汉字与英语词汇阅读受到相同统计属性的影响,表现出阅读加工的普遍性,汉字独特的形-音对应关系又体现出阅读的语言特异性。模型1建构与英文阅读模型完全相同的计算机模型,设计汉字的字形与语音表征方案,成功模拟出汉字阅读的规则性、一... 汉字与英语词汇阅读受到相同统计属性的影响,表现出阅读加工的普遍性,汉字独特的形-音对应关系又体现出阅读的语言特异性。模型1建构与英文阅读模型完全相同的计算机模型,设计汉字的字形与语音表征方案,成功模拟出汉字阅读的规则性、一致性效应及其与频率的交互作用,得到与行为实验相同的结果模式;模型2改变声旁独立成字时的字形表征,结果规则性效应消失。模拟结果一方面表明汉字与英语词汇阅读可能具有普遍的加工机制,都是对输入语料的形-音对应关系统计学习的结果;另一方面表明输入语料的不同统计属性可能是汉字阅读的语言特异性来源。 展开更多
关键词 汉字阅读 联结主义 规则性 一致性
下载PDF
基于动态BLSTM和CTC的濒危语言语音识别研究 被引量:8
19
作者 于重重 陈运兵 +3 位作者 孙沁瑶 刘畅 徐世璇 尹蔚彬 《计算机应用研究》 CSCD 北大核心 2019年第11期3334-3337,共4页
针对低资源的濒危语言进行了端到端语音识别模型的建立与研究,能够为濒危语言的保护和传承探索出新的途径。采用动态双向长短时记忆网络与连接时序分类模型构造端到端的语音识别系统,在进行音素级别的识别训练时,传入模型的数据批量大... 针对低资源的濒危语言进行了端到端语音识别模型的建立与研究,能够为濒危语言的保护和传承探索出新的途径。采用动态双向长短时记忆网络与连接时序分类模型构造端到端的语音识别系统,在进行音素级别的识别训练时,传入模型的数据批量大小根据训练模型作自适应调整,不仅能够加快收敛速度,而且能够提高模型的泛化性。通过修改网络层次与结构参数,并提取不同的语音特征进行模型对比,实验结果表明在两种濒危语言——吕苏语和土家语的数据集上均取得了较好的识别效果。 展开更多
关键词 濒危语言语音识别 端到端 动态双向长短时记忆网络 连接时序分类模型
下载PDF
一种基于连接机制和时空经验的认知地图学习与导航方法(英文) 被引量:3
20
作者 刘娟 蔡自兴 涂春鸣 《控制理论与应用》 EI CAS CSCD 北大核心 2003年第2期161-167,共7页
提出了一种连接主义方法 ,利用移动机器人自身的时空经验 ,在缺乏全局坐标信息和环境先验模型的情况下 ,建立面向目标的认知地图 .在线形成的时序处理网络 (TSPN)可提供简洁的历史感知信息 ,以神经元激活特性保存空间知识 ,引导机器人运... 提出了一种连接主义方法 ,利用移动机器人自身的时空经验 ,在缺乏全局坐标信息和环境先验模型的情况下 ,建立面向目标的认知地图 .在线形成的时序处理网络 (TSPN)可提供简洁的历史感知信息 ,以神经元激活特性保存空间知识 ,引导机器人运动 .结合TSPN和反应式行为模块的导航系统可实现动态的路标及方向检测、路径学习和实时导航功能 .仿真和实际实验验证了系统的有效性和适应性 . 展开更多
关键词 移动机器人 仿真 认知地图学习 导航方法 连接机制 时空推理
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部