期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于词片的语言模型及在汉语语音检索中的应用 被引量:5
1
作者 郑铁然 韩纪庆 李海洋 《通信学报》 EI CSCD 北大核心 2009年第3期84-88,共5页
在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元——"词片"(word fragment),研究了最佳词片选择算法。汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,... 在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元——"词片"(word fragment),研究了最佳词片选择算法。汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,音节正确率有所提高,并取得了更好的语音检索性能。 展开更多
关键词 汉语语音检索 语言模型 词片 互信息
下载PDF
基于端点检测的蒙藏维语音片段数据集 被引量:1
2
作者 韦向峰 袁毅 +1 位作者 张全 吐尔逊·卡得 《中国科学数据(中英文网络版)》 CSCD 2019年第4期108-118,共11页
在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语... 在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语音片段756个,数据总量大小约为111 MB。通过软件自动切分和语言专家的多重审核校对得到高质量的蒙藏维多语种的语音片段数据,可应用于少数民族的语音识别、端点检测、语音增强、语音合成和语言教学等领域。 展开更多
关键词 语音片段 端点检测 蒙古语 藏语 维吾尔语 语音数据
下载PDF
东巴文记录语段向记录语词的发展趋势探析 被引量:2
3
作者 白小丽 《西北民族大学学报(哲学社会科学版)》 CSSCI 2012年第6期147-155,共9页
文字是用来记录语言的书写符号。东巴经是用东巴文书写的文献材料,其中记录语言的情况较为复杂。有的情况不是简单并存的共时现象,而是东巴文记录语言历时演变的结果。东巴文按记录语段的完整度大致可分为两种情况:省略式和包蕴式。二... 文字是用来记录语言的书写符号。东巴经是用东巴文书写的文献材料,其中记录语言的情况较为复杂。有的情况不是简单并存的共时现象,而是东巴文记录语言历时演变的结果。东巴文按记录语段的完整度大致可分为两种情况:省略式和包蕴式。二者各有其特点。就发展趋势而言,省略式是逐渐补充出未得到记录的音节符号,而包蕴式则更为复杂。发展的根本原因是一字一音节的推动。 展开更多
关键词 东巴文 语段 语词 发展趋势
下载PDF
汉语复句书读前后语言片段的非分句识别
4
作者 李琼 《安庆师范学院学报(社会科学版)》 2010年第1期111-114,119,共5页
为了建立一个面向中文信息处理的现代汉语复句精加工语料库,我们必须进行非分句语言片段的自动识别工作,目的是把这些语言片段排除在分句层次分析的范围之外。这项工作建立在自动分词和词性标注的基础上,主要分三个阶段进行。
关键词 书读前后非分句语言片段 词性 形式标记 语义
下载PDF
普通话儿童言语心理情绪与态度研究——以含有句末语气词“吧”的话语片段为例
5
作者 张笛 《佳木斯职业学院学报》 2018年第2期383-383,385,共2页
使用个案儿童一整年(每周一次不间断,共50个小时)的儿童家长话语交流语料,提取句末含有"吧"的489个话语片段进行整理,结合具体的例子,分析体现儿童心理认知态度的话语片段,考察普通话儿童话语交流时的具体心理情况。
关键词 话语片段 儿童言语 心理情绪 态度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部