期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于Word Lattice结构的语音识别置信度算法
1
作者 付跃文 陈国平 刘浩杰 《计算机工程与应用》 CSCD 北大核心 2006年第36期51-54,共4页
wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前... wordlattice是与词图(wordgraph)结构类似但是结构没有词图致密的在小任务语音识别的情况下较为常见的一种中间输出结构,给出了在wordlattice结构上的语音识别置信度估计的一种算法。以lattice结构中的连接弧作为计算单元,给出了利用前后向算法高效计算lattice中每个弧的词后验概率及以其为基础计算每个词的置信度的算法。 展开更多
关键词 语音识别 置信度 word GRAPH
下载PDF
基于Lattice-LSTM的多粒度中文分词 被引量:17
2
作者 张文静 张惠蒙 +1 位作者 杨麟儿 荀恩东 《中文信息学报》 CSCD 北大核心 2019年第1期18-24,共7页
中文分词是中文信息处理领域中的一项关键基础技术,而多粒度分词是中文分词领域较新的研究方向。针对多粒度中文分词任务,该文提出一种基于Lattice-LSTM的多粒度中文分词模型,在传统基于字的多粒度中文分词模型基础上,加入了多分词粒度... 中文分词是中文信息处理领域中的一项关键基础技术,而多粒度分词是中文分词领域较新的研究方向。针对多粒度中文分词任务,该文提出一种基于Lattice-LSTM的多粒度中文分词模型,在传统基于字的多粒度中文分词模型基础上,加入了多分词粒度的词典信息。与传统模型相比,所提出的模型在网格结构的辅助下,对不同粒度的分词标准都有较强的捕捉能力,且不局限于单一的分词标准。实验表明,该文提出的方法在多粒度中文分词方向取得了目前最好的结果。 展开更多
关键词 中文分词 多粒度 lattice-LSTM
下载PDF
基于新词发现和Lattice-LSTM的中文医疗命名实体识别 被引量:8
3
作者 赵耀全 车超 张强 《计算机应用与软件》 北大核心 2021年第1期161-165,249,共6页
在医疗命名实体识别中,由于存在大量医学专业术语和语料中语言不规范的原因,识别的准确率不高。为了识别未登录的医学术语和应对语言不规范问题,提出一种基于N-grams新词发现的Lattice-LSTM的多粒度命名实体识别模型。在医疗对话语料中... 在医疗命名实体识别中,由于存在大量医学专业术语和语料中语言不规范的原因,识别的准确率不高。为了识别未登录的医学术语和应对语言不规范问题,提出一种基于N-grams新词发现的Lattice-LSTM的多粒度命名实体识别模型。在医疗对话语料中使用N-grams算法提取新词并构造一个医疗相关的词典,通过Lattice-LSTM模型将输入的字符和所有能在词典匹配的单词一起编码,其中门结构能够使模型选择最相关的字符和单词。Lattice-LSTM能够利用发现的新词信息识别未登录的医学术语,从而得到更好的实验识别结果。 展开更多
关键词 医疗命名实体识别 N-GRAMS 新词发现 lattice-LSTM
下载PDF
Linguistic Truth Values Lattice Implication Algebras
4
作者 潘小东 徐扬 《Journal of Donghua University(English Edition)》 EI CAS 2006年第6期101-104,109,共5页
In order to study uncertainty reasoning and automatic reasoning with linguistic terms, in this paper, the set of basic linguistic truth values and the set of modifiers are defined, according to common sense; partially... In order to study uncertainty reasoning and automatic reasoning with linguistic terms, in this paper, the set of basic linguistic truth values and the set of modifiers are defined, according to common sense; partially orderings are defined on them. Based on it, a lattice implication algebra model L18 of linguistic terms is built; furthermore, its some basic properties are discussed. 展开更多
关键词 linguistic truth value linguistic variable computing with words lattice implication algebra Subalgebra.
下载PDF
基于词片的语言模型及在汉语语音检索中的应用 被引量:5
5
作者 郑铁然 韩纪庆 李海洋 《通信学报》 EI CSCD 北大核心 2009年第3期84-88,共5页
在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元——"词片"(word fragment),研究了最佳词片选择算法。汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,... 在汉语语音检索研究中,为充分利用汉语中音节相互搭配的语言学知识,提出了一种新的汉语语言模型构造基元——"词片"(word fragment),研究了最佳词片选择算法。汉语语音识别实验和语音检索实验表明,采用基于词片的语音模型后,音节正确率有所提高,并取得了更好的语音检索性能。 展开更多
关键词 汉语语音检索 语言模型 词片 互信息
下载PDF
联机手写体汉字识别后处理技术的研究 被引量:5
6
作者 徐志明 王晓龙 +1 位作者 张凯 关毅 《计算机研究与发展》 EI CSCD 北大核心 1999年第5期608-612,共5页
文中提出了一种规则和统计相结合的计算语言模型应用于联机手写体汉字识别后处理的技术,把基于统计的大词表Markov语言模型与语言规则量化模型,通过词网格技术集成在一个语言解码器.这种后处理方法由3个阶段组成:词网格生成... 文中提出了一种规则和统计相结合的计算语言模型应用于联机手写体汉字识别后处理的技术,把基于统计的大词表Markov语言模型与语言规则量化模型,通过词网格技术集成在一个语言解码器.这种后处理方法由3个阶段组成:词网格生成、语言解码、基于Cache的自学习机制.语言解码器采用Viterbi搜索算法求解最优语句候选.该项技术已应用于HPC(手持机)手写电脑的联机汉字手写体识别系统中,汉字识别率为91.3%. 展开更多
关键词 联机手写体汉字 汉字识别 后处理 计算机
下载PDF
基于词形的汉语文本切分方法 被引量:4
7
作者 付国宏 王晓龙 《情报学报》 CSSCI 北大核心 1999年第3期235-240,共6页
本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数... 本文在分析汉语分词一般模型基础上,引入词形概率、词整合系数和词形网格等概念,提出了一个基于词形的汉语文本切分模型,并实现了一个反向动态规划和正向栈解码相结合的二次扫描的汉语文本切分算法。由于引入了词形概率、词整合系数,本模型不仅反映了词形统计构词规律,而且在一定程度上体现了长词优先的切分原则。初步测试表明,本方法的切分准确率和消歧率分别可达996%和9344%。 展开更多
关键词 汉语分词 词形概率 整合系数 词形网格 信息处理
下载PDF
一种新型低复杂度的IIR格型滤波器 被引量:4
8
作者 于爱华 黄朝耿 +2 位作者 李刚 徐红 常丽萍 《电子学报》 EI CAS CSCD 北大核心 2013年第9期1703-1709,共7页
格型结构具有良好的抗有限字长效应能力而被应用于很多实时性较高的场合.归一化格型结构具备正交的特性,然而,对于一个N阶数字滤波器,它需要5N+1个乘法器.为了降低其实现复杂度,并保留正交的特性,本文基于单,双,三乘法器格型单元导出了... 格型结构具有良好的抗有限字长效应能力而被应用于很多实时性较高的场合.归一化格型结构具备正交的特性,然而,对于一个N阶数字滤波器,它需要5N+1个乘法器.为了降低其实现复杂度,并保留正交的特性,本文基于单,双,三乘法器格型单元导出了其对应的新型格型单元和格型结构.仿真结果表明,当采用单乘法器新型格型单元时,新结构抵抗有限字长误差的能力与归一化格型结构非常接近,但由于其只需2N+1个乘法器,新结构在实时信号处理中具有更大的实用价值. 展开更多
关键词 数字滤波器 格型结构 信号功率比 灵敏度函数 有限字长
下载PDF
适用于特定领域机器翻译的汉语分词方法 被引量:4
9
作者 苏晨 张玉洁 +1 位作者 郭振 徐金安 《中文信息学报》 CSCD 北大核心 2013年第5期184-190,共7页
在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高。这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量。为解决这个问题,该文实现了基于... 在特定领域的汉英机器翻译系统开发过程中,大量新词的出现导致汉语分词精度下降,而特定领域缺少标注语料使得有监督学习技术的性能难以提高。这直接导致抽取的翻译知识中出现很多错误,严重影响翻译质量。为解决这个问题,该文实现了基于生语料的领域自适应分词模型和双语引导的汉语分词,并提出融合多种分词结果的方法,通过构建格状结构(Lattice)并使用动态规划算法得到最佳汉语分词结果。为了验证所提方法,我们在NTCIR-10的汉英数据集上进行了评价实验。实验结果表明,该文提出的融合多种分词结果的汉语分词方法在分词精度F值和统计机器翻译的BLEU值上均得到了提高。 展开更多
关键词 汉语分词 领域适应 双语引导 lattice 机器翻译
下载PDF
语音识别中统计与规则结合的语言模型 被引量:6
10
作者 王轩 王晓龙 张凯 《自动化学报》 EI CSCD 北大核心 1999年第3期309-315,共7页
在分析语音识别系统中,基于规则方法和统计方法的语言模型,提出了一种对规则进行量化的合成语言模型.该模型既避免了规则方法无法适应大规模真实文本处理的缺点,同时也提高了统计模型处理远距离约束关系和语言递归现象的能力.合成... 在分析语音识别系统中,基于规则方法和统计方法的语言模型,提出了一种对规则进行量化的合成语言模型.该模型既避免了规则方法无法适应大规模真实文本处理的缺点,同时也提高了统计模型处理远距离约束关系和语言递归现象的能力.合成语言模型使涵盖6万词条的非特定人孤立词的语音识别系统的准确率比单独使用词的TRIGRAM模型提高了4.9%(男声)和3.5%(女声). 展开更多
关键词 语音识别 统计语言模型 马尔可夫模型 词网格
下载PDF
多孔介质内流体流动的大涡格子Boltzmann方法研究 被引量:6
11
作者 周昊 芮淼 岑可法 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第9期1660-1665,共6页
为研究多孔介质内流动随Re数变化的特点,采用结合Smagorinsky亚格子模型的格子Boltzmann方法(LES-LBM)对多孔介质内流动进行了数值模拟.结果表明:多孔介质内的单相流动在高Re数时会表现出复杂的非线性现象;LES-LBM克服了传统LBGK方法模... 为研究多孔介质内流动随Re数变化的特点,采用结合Smagorinsky亚格子模型的格子Boltzmann方法(LES-LBM)对多孔介质内流动进行了数值模拟.结果表明:多孔介质内的单相流动在高Re数时会表现出复杂的非线性现象;LES-LBM克服了传统LBGK方法模拟高Re数流动时容易产生数值不稳定的缺点,能清晰地描述出多孔介质内流动存在的3个区域,即低速时的线性达西区、过渡区和高速时的非线性二次区;不同Re下的流线图还说明微观的惯性作用最终导致了多孔介质宏观上的非线性现象,多孔介质流动呈现明显的多尺度特征.进一步分析计算结果可以证明:LES-LBM方法能准确地验证Darcy-Forchhimer阻力方程,Darcy-Forchhimer总阻力随Re数增加而增加,随孔隙率增加而减小,并且小孔隙率下的Forchhimer阻力占总阻力比例小于大孔隙率时的比例. 展开更多
关键词 格子BOLTZMANN方法 大涡模拟 亚格子模型 非达西流 Darcy-Forchhimer阻力
下载PDF
基于格型结构的IIR数字滤波器硬件实现 被引量:3
12
作者 徐红 叶丰 黄朝耿 《浙江工业大学学报》 CAS 北大核心 2018年第2期143-146,共4页
注入式和抽头式相结合的格型结构具有低有限字长效应,采用遗传算法可以高效地找到合适的离散参数,用较低的复杂度实现期望的滤波器性能指标.基于该结构提出一种IIR(无限冲激响应)数字滤波器的硬件实现方法,采用Verilog HDL语言进行编程... 注入式和抽头式相结合的格型结构具有低有限字长效应,采用遗传算法可以高效地找到合适的离散参数,用较低的复杂度实现期望的滤波器性能指标.基于该结构提出一种IIR(无限冲激响应)数字滤波器的硬件实现方法,采用Verilog HDL语言进行编程,并通过Quartus II软件进行仿真验证.该方法有助于IIR滤波器的高效低成本实现,促进其进一步实用化. 展开更多
关键词 IIR数字滤波器 格型结构 有限字长效应 FPGA
下载PDF
下推格值自动机词的计算 被引量:1
13
作者 吴静杰 方丽娟 《西南民族大学学报(自然科学版)》 CAS 2006年第3期581-585,共5页
在格半群意义下,提出基于词计算的下推格值自动机模型,它的输入是输入字母表的模糊子集,即词串,对应的是具有模糊性的自然语言.并研究下推格值自动机识别的格值词语言,利用格半群的性质证明了下推格值自动机基于词的计算可以通过基于值... 在格半群意义下,提出基于词计算的下推格值自动机模型,它的输入是输入字母表的模糊子集,即词串,对应的是具有模糊性的自然语言.并研究下推格值自动机识别的格值词语言,利用格半群的性质证明了下推格值自动机基于词的计算可以通过基于值的计算实现. 展开更多
关键词 下推格值自动机 格半群
下载PDF
下推格值自动机接受词语言两种方式的等价性 被引量:1
14
作者 吴静杰 鲁来凤 《西安工业大学学报》 CAS 2008年第6期601-604,共4页
在格半群框架下,针对下推格值自动机模型的特点,提出其两种接受词语言的方式,并利用格半群的代数性质和自动机理论,证明了这两种方式接受词语言的等价性.
关键词 下推格值自动机 格半群 模糊状态转移函数
下载PDF
一种有限脉冲响应滤波器格型结构优化方法及灵敏度分析 被引量:2
15
作者 庄陵 张文静 《电子与信息学报》 EI CSCD 北大核心 2022年第2期686-693,共8页
有限脉冲响应(FIR)滤波器是无线通信研究中多载波调制系统的主要组成单元。针对有限字长效应导致FIR滤波器性能下降问题,该文提出一种FIR滤波器格型结构改善因量化导致的滤波器系数误差,即降低系数灵敏度,利用状态空间结构表示相应改进... 有限脉冲响应(FIR)滤波器是无线通信研究中多载波调制系统的主要组成单元。针对有限字长效应导致FIR滤波器性能下降问题,该文提出一种FIR滤波器格型结构改善因量化导致的滤波器系数误差,即降低系数灵敏度,利用状态空间结构表示相应改进格型结构系数,并推导分析其系数灵敏度表达式。仿真实例验证理论推导结果,即改进格型结构系数灵敏度与采样周期相关。与传统格型结构相比,在量化字长和采样周期约束下,改进格型结构频响特性曲线更接近理想频响特性曲线,系数灵敏度更小,抗有限字长效应能力更好。 展开更多
关键词 有限脉冲响应滤波器 有限字长 格型结构 状态空间 系数灵敏度
下载PDF
基于混合字词网格的汉语音字转换问题的求解 被引量:5
16
作者 章森 《计算机学报》 EI CSCD 北大核心 2007年第7期1145-1153,共9页
汉语音字转换是中文键盘输入、汉语语音识别和中文信息处理的基础,也是一个非常具有挑战性的问题.文中分析了汉语音字转换的研究现状和存在的问题,提出了基于混合字词网格的汉语音字转换方法,给出了系统实现的架构,研究了混合2-gram模... 汉语音字转换是中文键盘输入、汉语语音识别和中文信息处理的基础,也是一个非常具有挑战性的问题.文中分析了汉语音字转换的研究现状和存在的问题,提出了基于混合字词网格的汉语音字转换方法,给出了系统实现的架构,研究了混合2-gram模型的有关问题以及字词网格的求解算法,最后讨论了自动预测与系统学习功能的实现.在此基础上设计了原型系统并与Windows XP上的微软拼音输入系统进行了比较,在拼音到汉字的自动转换正确率方面有显著的提高. 展开更多
关键词 汉语音字转换 N-GRAM语言模型 MARKOV模型 字词网格 用户行为
下载PDF
液晶显示模块FM12232C的原理及其在数控切割系统中的应用 被引量:1
17
作者 杨恢先 杨穗 +1 位作者 王子菡 陶霞 《电子器件》 CAS 2004年第3期443-447,共5页
本文介绍通过扩展 I/O口实现 FM1 2 2 3 2 C液晶模块与单片机的接口。通过自制字库 ,用单片机实现汉字和数字的显示。在数控切割系统中 ,应用该液晶模块实现人机界面的正确显示。该图形点阵液晶显示模块具有功耗低 ,体积小、价格低、使... 本文介绍通过扩展 I/O口实现 FM1 2 2 3 2 C液晶模块与单片机的接口。通过自制字库 ,用单片机实现汉字和数字的显示。在数控切割系统中 ,应用该液晶模块实现人机界面的正确显示。该图形点阵液晶显示模块具有功耗低 ,体积小、价格低、使用方便、接口简单等特点 ,适于推广 ,能广泛使用于一些小型的数控系统、自动控制。 展开更多
关键词 图形点阵液晶显示模块 扩展I/O接口 自制字库 汉字显示
下载PDF
四音格联绵词语音模式分析——以汉赋为例的探讨 被引量:1
18
作者 李春艳 《天津大学学报(社会科学版)》 CSSCI 北大核心 2013年第4期344-349,共6页
汉藏语系语言普遍具有四音格词。汉语中四音格联绵词也极其丰富,但学界多将研究集中在双音节联绵词上,对语音造词方式产生的四音格联绵词却关注较少。我们以汉赋作为关注点,发现在汉赋中存在丰富的四音格联绵词,通过对这些四音格联绵词... 汉藏语系语言普遍具有四音格词。汉语中四音格联绵词也极其丰富,但学界多将研究集中在双音节联绵词上,对语音造词方式产生的四音格联绵词却关注较少。我们以汉赋作为关注点,发现在汉赋中存在丰富的四音格联绵词,通过对这些四音格联绵词语音的分析,发现它们在语音上存在着整齐的语音模式,对其语音模式进行了较为细致的描写与归纳。 展开更多
关键词 汉赋 四音格词 联绵词 语音模式
下载PDF
高放废物晶格固化用LaMgAl(11)O(19)材料的制备及其稳定性 被引量:1
19
作者 陆浩然 汪长安 《核科学与工程》 CSCD 北大核心 2017年第6期992-999,共8页
高放废物的固化是防止核废料放射性扩散的第一道安全屏障。磁铁铅矿结构的LaMgAl_(11)O_(19)材料,因其高包容性、高致密、低核素浸出率、抗辐照稳定性等优点,被认为是核燃料循环后端克服玻璃固化技术固有缺陷、最具应用前景的新一代高... 高放废物的固化是防止核废料放射性扩散的第一道安全屏障。磁铁铅矿结构的LaMgAl_(11)O_(19)材料,因其高包容性、高致密、低核素浸出率、抗辐照稳定性等优点,被认为是核燃料循环后端克服玻璃固化技术固有缺陷、最具应用前景的新一代高放废物晶格固化候选陶瓷材料之一。本文采用柠檬酸溶胶-凝胶湿化学工艺制备了LaMgAl_(11)O_(19)陶瓷材料,借助X射线衍射、扫描电子显微镜及高分辨投射电子/选取衍射技术对材料的化学组分、微观形貌及电子衍射花样进行了表征;对LaMgAl_(11)O_(19)陶瓷材料经去离子水浸泡前后的组分、微观形貌、抗潮解性能进行了分析。结果表明,LaMgAl_(11)O_(19)陶瓷材料具有单一的六方磁铁铅矿型结构;经谢乐公式计算并结合扫描电子显微镜表征结果,1 500℃下保温4h样品的平均晶粒粒径为89.4nm;经去离子水浸泡48h后的LaMgAl_(11)O_(19)材料发生了潮解,因Mg^(2+)离子的溶出造成磁铁铅矿结构的失稳。本研究为后续商用高放废物晶格固化候选材料的实践应用提供了理论依据。 展开更多
关键词 高放废物 晶格固化 磁铁铅矿结构 化学稳定性
下载PDF
使用无监督网络MLLR自适应改进算法的语音识别
20
作者 潘复平 赵庆卫 颜永红 《数据采集与处理》 CSCD 北大核心 2007年第1期8-13,共6页
介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点... 介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点是计算量极大,较难实用,对此本文提出了两个改进技术:(1)利用后验概率压缩词网;(2)利用单词的时间信息限制状态统计量的计算范围。实验测定Lattice-MLLR的误识率比传统MLLR相对下降了3.5%,改进技术使Lattice-MLLR计算量下降幅度超过了87.9%。 展开更多
关键词 语音识别 无监督自适应 最大似然线性回归 词网 后验概率
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部