-
题名基于BERT条件随机场的标点预测模型
被引量:1
- 1
-
-
作者
陈芒
-
机构
深圳市轻生活科技有限公司
-
出处
《现代传输》
2023年第3期58-63,共6页
-
文摘
随着人工智能领域的快速发展,语音识别技术已经逐渐应用于各种场景,如电信客服,智能家居,实时翻译等领域。目前的语音识别应用需求,除了单纯高质量输出识别文本,为其识别结果添加合适语境的标点也是及其重要的。为提高文本自动标点的准确率,本文针对互联网数据提出了文本预处理方案,利用深层模型BERT提取隐含的上下文语义特征,并结合CRF加强对输出序列的约束,利用BERTCRF的融合模型进行标点预测,实验证明BERT-CRF在中文互联网测试集上平均F1分数相比BERT-Softmax提升了6.16%,并通过实验证实了CRF在标点预测任务起到关键作用。针对网络输入长度受限问题,本文提出了提出了截断式推理机制,使模型能够在保留预测效果的同时能够接受任意长度的输入,并通过实验得到模型最佳推理长度区间为60~80。
-
关键词
语音识别
标点预测
BERT
CRF
-
Keywords
Automatic Speech Recognition
Punctuation Prediction/Restoration
BERT
CRF
-
分类号
G63
[文化科学—教育学]
-
-
题名基于端到端建模的低资源连续语音关键词识别系统
- 2
-
-
作者
陈芒
-
机构
深圳市轻生活科技有限公司
-
出处
《现代传输》
2023年第4期60-66,共7页
-
文摘
语音关键词识别具有广阔的市场应用需求。在嵌入式领域,由于嵌入式设备资源有限,应用场景复杂多变,对语音关键词识别系统提出了资源占用少,低功耗,响应快,系统鲁棒性好等更高要求。本文设计实现的低资源连续语音关键词识别系统基于端到端声学建模,采用知识蒸馏、模型量化、模型剪枝的方法将模型占用资源压缩到了36.8K字节,系统运行资源占用约133K字节。本文提出的连续语音关键词解码算法相比于传统的孤立词解码算法,噪声环境下的召回绝对提升6.88%。系统在主频120M,内存256K字节的BK3288低功耗SOC平台上进行20个关键词的识别测试,达到安静环境下召回率96.86%,噪声环境召回率74.81%,虚警0.2次/小时的识别性能。
-
关键词
低资源
语音关键词识别
模型压缩
令牌传递
-
Keywords
low-resource
speech keyword spotting
model compression
token passing
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名浅谈离线语音识别技术及其在照明领域的应用
被引量:1
- 3
-
-
作者
陈芒
-
机构
深圳市轻生活科技有限公司
-
出处
《中国照明电器》
2023年第9期53-59,共7页
-
文摘
随着人工智能技术的快速发展,语音识别控制技术在智能客服、智能家居、实时翻译等领域得到了越来越广泛的应用。其中离线语音识别控制技术,在目前阶段更适合应用于智能家居领域的终端设备控制。本文介绍语音识别控制技术,尤其是离线语音识别控制技术的发展情况及其当前在各领域的应用。特别针对几大照明产品品类,分析了应用离线语控技术的创新思路及一些成功案例。最后提出一个观点:传统照明行业要适应产品智能化升级趋势,在将新技术应用于新产品中抢占新市场的同时,还应该制定新标准,为新市场保驾护航,让离线语音识别控制照明灯具市场能够持续地健康、快速增长。
-
关键词
离线语音识别控制
照明产品
标准
智能家居
-
Keywords
offline speech recognition control
lighting products
standards
smart home
-
分类号
TM923
[电气工程—电力电子与电力传动]
-