-
题名基于神经网络的语音信号识别与分类
被引量:1
- 1
-
-
作者
薛雅洁
贺红霞
杨祎
-
机构
西安邮电大学电子工程学院
-
出处
《现代电子技术》
2023年第24期79-84,共6页
-
基金
西安市科技计划项目(101/203010002)。
-
文摘
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
-
关键词
语音信号识别
深度全序列卷积神经网络
隐马尔可夫链
声学特征提取
梅尔倒谱系数
CTC损失函数
-
Keywords
speech signal recognition
deep full convolutional neural network
hidden Markov chain
acoustic feature extraction
Mel cepstrum coefficient
CTC loss function
-
分类号
TN912-34
[电子电信—通信与信息系统]
-
-
题名基于改进的全卷积网络的视频摘要算法
被引量:2
- 2
-
-
作者
王浩
彭力
-
机构
江南大学物联网工程学院
-
出处
《激光与光电子学进展》
CSCD
北大核心
2021年第22期407-415,共9页
-
基金
国家自然科学基金(61873112)。
-
文摘
面对海量的视频数据,视频摘要技术在视频检索、视频浏览等领域发挥着越来越重要的作用,其旨在通过生成简短的视频片段或选择关键帧集合来获取输入视频中的重要信息。现有的方法大多集中在研究视频摘要的代表性和多样性上,没有考虑到视频结构等多尺度上下文信息。针对上述问题,提出了一种基于全卷积序列网络的视频摘要模型,模型中利用时间金字塔池化对视频中的多尺度上下文信息进行提取,并利用全连接的条件随机场对视频帧序列进行标注。在SumMe和TVSum数据集上的实验表明,所提模型取得了比全卷积序列网络更好的性能,在这两个数据集上F分指标分别提高了1.6%和3.0%。
-
关键词
机器视觉
视频摘要
深度学习
全卷积序列网络
卷积神经网络
-
Keywords
machine vision
video summarization
deep learning
fully convolutional sequence networks
convolutional neural networks
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-