期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于子词PSPL的汉语语音文档索引
1
作者
陆明明
张连海
屈丹
《应用科学学报》
CAS
CSCD
北大核心
2013年第3期259-265,共7页
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词...
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
展开更多
关键词
语音文档检索
语音文档索引
子
词
PSPL
词
格
子
词后验概率
下载PDF
职称材料
基于后验概率词格的汉语自然对话语音索引
被引量:
2
2
作者
孟莎
余鹏
+1 位作者
Frank Seide
刘加
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期673-677,共5页
语音索引是语音检索任务的关键问题之一。该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法。采用后验概率形式表示的词格取代最优路径进行索引。根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于...
语音索引是语音检索任务的关键问题之一。该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法。采用后验概率形式表示的词格取代最优路径进行索引。根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格;在汉语自然对话语音关键词检测任务上,采用字、有调音节和无调音节作为子词单元,关键词检测指标品质因数相对基线系统分别提高了3.9%、4.4%和7.4%。根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,品质因数指标由基线系统的68.3%(用LV SCR得到的)和66.9%(用音节识别器得到的)提高到78.8%。
展开更多
关键词
语音检索
后验
概率
词
格
索引单元
原文传递
基于特征比较和最大熵模型的统计机器翻译错误检测
3
作者
杜金华
王莎
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第1期81-87,共7页
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率,分析其对错误检测性能的影响;然后,将其分别与语言学特征如词性、词及由LG句法分析器抽取...
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率,分析其对错误检测性能的影响;然后,将其分别与语言学特征如词性、词及由LG句法分析器抽取的句法特征等进行组合,利用最大熵分类器预测翻译错误,并在汉英NIST数据集上进行实验验证和比较。实验结果表明,不同的单词后验概率对分类错误率的影响是显著的,并且在词后验概率基础上加入语言学特征的组合特征可以显著降低分类错误率,提高译文错误预测性能。
展开更多
关键词
错误检测
词后验概率
语言学特征
最大熵分类器
下载PDF
职称材料
题名
基于子词PSPL的汉语语音文档索引
1
作者
陆明明
张连海
屈丹
机构
解放军信息工程大学信息工程学院
出处
《应用科学学报》
CAS
CSCD
北大核心
2013年第3期259-265,共7页
基金
国家自然科学基金(No.61175017)资助
文摘
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specificposterior lattices,PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL:然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索.实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.
关键词
语音文档检索
语音文档索引
子
词
PSPL
词
格
子
词后验概率
Keywords
spoken document retrieval, spoken document indexing, subword-based position specific posterior lattices, lattice, subword posterior probability
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于后验概率词格的汉语自然对话语音索引
被引量:
2
2
作者
孟莎
余鹏
Frank Seide
刘加
机构
清华大学电子工程系
微软亚洲研究院
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期673-677,共5页
基金
国家自然科学基金资助项目(60776800)
文摘
语音索引是语音检索任务的关键问题之一。该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法。采用后验概率形式表示的词格取代最优路径进行索引。根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格;在汉语自然对话语音关键词检测任务上,采用字、有调音节和无调音节作为子词单元,关键词检测指标品质因数相对基线系统分别提高了3.9%、4.4%和7.4%。根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,品质因数指标由基线系统的68.3%(用LV SCR得到的)和66.9%(用音节识别器得到的)提高到78.8%。
关键词
语音检索
后验
概率
词
格
索引单元
Keywords
speech retrieval
posterior lattice
indexing units
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于特征比较和最大熵模型的统计机器翻译错误检测
3
作者
杜金华
王莎
机构
西安理工大学自动化与信息工程学院
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013年第1期81-87,共7页
基金
国家自然科学基金(61100085)
陕西省教育厅专项科研计划项目(11JK1029)
西安理工大学青年科技研究计划项目(105211017)资助
文摘
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率,分析其对错误检测性能的影响;然后,将其分别与语言学特征如词性、词及由LG句法分析器抽取的句法特征等进行组合,利用最大熵分类器预测翻译错误,并在汉英NIST数据集上进行实验验证和比较。实验结果表明,不同的单词后验概率对分类错误率的影响是显著的,并且在词后验概率基础上加入语言学特征的组合特征可以显著降低分类错误率,提高译文错误预测性能。
关键词
错误检测
词后验概率
语言学特征
最大熵分类器
Keywords
error detection
word posterior probability
linguistic features
maximum entropy classifier
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于子词PSPL的汉语语音文档索引
陆明明
张连海
屈丹
《应用科学学报》
CAS
CSCD
北大核心
2013
0
下载PDF
职称材料
2
基于后验概率词格的汉语自然对话语音索引
孟莎
余鹏
Frank Seide
刘加
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008
2
原文传递
3
基于特征比较和最大熵模型的统计机器翻译错误检测
杜金华
王莎
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2013
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部