-
题名基于子词PSPL的汉语语音文档索引
- 1
-
-
作者
陆明明
张连海
屈丹
-
机构
解放军信息工程大学信息工程学院
-
出处
《应用科学学报》
CAS
CSCD
北大核心
2013年第3期259-265,共7页
-
基金
国家自然科学基金(No.61175017)资助
-
文摘
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
-
关键词
语音文档检索
语音文档索引
子词pspl
词格
子词后验概率
-
Keywords
spoken document retrieval, spoken document indexing, subword-based position specific posterior lattices, lattice, subword posterior probability
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-