-
题名语音文本对齐技术构建蒙古语语音识别语料库研究
- 1
-
-
作者
甄兆博
张晖
-
机构
蒙古文智能信息处理技术国家地方联合工程研究中心
内蒙古自治区蒙古文信息处理技术重点实验室
内蒙古大学计算机学院
-
出处
《中央民族大学学报(自然科学版)》
2024年第1期12-19,共8页
-
文摘
目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本研究采用从这样的语料中提炼可供训练用的语料的技术路线,选择电视剧配音剧本和对应成片作为样例,将提炼工作看作是一个语音文本对齐问题。通过一系列自动化处理将剧本和对应的音频转换为适用于语音文本对齐处理的数据形式,利用迭代的对齐方法得到了语音文本对齐结果,利用这些结果生成了适用于蒙古语语音识别的逐句对齐的“语音—文本对”数据。通过对生成的数据进行抽样检查发现,生成的数据有较好的质量,与人工标注基本一致,节省了数据生产的成本。
-
关键词
语音识别
蒙古语
生语料
语音文本对齐
-
Keywords
speech recognition
Mongolian
raw corpus
speech-text alignment
-
分类号
TN391
[电子电信—物理电子学]
-
-
题名语料库辅助的文学作品主题分析
被引量:4
- 2
-
-
作者
董晓烨
柴静
-
机构
东北林业大学外国语学院
-
出处
《西安电子科技大学学报(社会科学版)》
2018年第3期106-111,共6页
-
基金
黑龙江省高等教育学会高等教育科学研究"十三五"规划课题"美国文学数据驱动教学模式研究"(编号:16Q022)
中央高校基本科研业务费专项资金项目"文学伦理学视域下的华裔美国文学研究"(编号:2572016CC02)阶段成果
-
文摘
语料库对英语学习具有极大的辅助作用。文学研究者在运用语料库进行作家文体分析方面已经取得了一定成果。本论文将数据和主题研究相结合,对文学主题进行语料库研究,考察通过检索词、句、篇章的频率、搭配和分布等信息研究如何借用生文本和标注文本来探讨文学作品主题的方法,试图将定量和定性分析相结合,提供了一种科学、系统、深入的文本解读方式。
-
关键词
语料库
主题研究
生文本
标注文本
-
Keywords
corpus
thematic study
raw text
tagged text
-
分类号
H08
[语言文字—语言学]
-
-
题名英语泛读语料库在教学中的作用
被引量:1
- 3
-
-
作者
侯红娟
-
机构
苏州市职业大学外国语与国际交流系
-
出处
《苏州教育学院学报》
2010年第4期102-105,共4页
-
基金
外语教学与研究出版社资助课题(2009320002)
-
文摘
英语泛读语料库的研究起步较晚,正逐渐改变以教师为中心的传统教学模式,代之以学生为中心的建构主义教学模式。让语料库走进英语泛读教学课堂不仅有助于词汇教学,而且有助于学生自主学习能力和阅读习惯的培养,提高他们的阅读速度。此外,通过辅助软件,语料库还可以及时反馈测试练习结果及控制语料易读度。
-
关键词
英语泛读语料库
语料
词汇教学
-
Keywords
English extensive reading corpus
raw texts
vocabulary teaching
-
分类号
H319
[语言文字—英语]
-
-
题名引导文教学法在食品原料学实验教学中的应用
- 4
-
-
作者
赵攀
-
机构
扬州大学旅游烹饪学院
-
出处
《现代食品》
2022年第24期128-130,共3页
-
文摘
引导文教学法是一种以学生为主体,注重培养学生独立学习能力的行为导向教学方法。为提升食品类专业基础课程食品原料学实验的教学水平,本文探讨了引导文教学法在该课程教学过程中的应用,分析了教学内容设计和教学活动实施的具体做法,并对教学过程中出现的问题进行反思,以期为食品科学与工程专业其他课程提供支撑和借鉴。
-
关键词
引导文
食品原料学实验
教学应用
-
Keywords
guiding text
experiment of food raw materials
teaching application
-
分类号
G642
[文化科学—高等教育学]
-