期刊文献+

口译多模态语料库建设中音视频数据处理研究

下载PDF
导出
摘要 口译多模态语料数据库是指语料由记录口译过程的文本、图片、音频和视频等多种文件组成,并能够通过多模态方式进行加工、检索和统计等操作的语料库。其中,音频和视频语料的采集、加工和检索是语料库建设的重点和难点之一。介绍了国内外多模态语料库建设和研究的现状,并针对音频和视频语料数据的采集、加工和检索进行初步的探索研究。数据加工过程中以满足内容完整性为基本的数据分割依据,对单个数据文件设置容量上限,并对单个数据文件进行基本信息编码,为检索提供条件。
作者 高亢
出处 《信息系统工程》 2023年第11期121-124,共4页
  • 相关文献

二级参考文献62

共引文献1399

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部