期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
唇读识别中的基本口型分类 被引量:3
1
作者 柴秀娟 姚鸿勋 +1 位作者 高文 王瑞 《计算机科学》 CSCD 北大核心 2002年第2期130-133,共4页
1引言自然人机交互方式使得人同计算机的交流不再局限于键盘、鼠标等外设.而是通过语言及手势、表情、唇动等形体语言来进行,从而使得人机交互变得像人与人之间的交流一样轻松自如.唇读通常被视为说话过程中伴随的辅助信息,它有助于对... 1引言自然人机交互方式使得人同计算机的交流不再局限于键盘、鼠标等外设.而是通过语言及手势、表情、唇动等形体语言来进行,从而使得人机交互变得像人与人之间的交流一样轻松自如.唇读通常被视为说话过程中伴随的辅助信息,它有助于对说话者提供信息的更准确理解.减弱噪音干扰. 展开更多
关键词 唇读识别 口型分类 语音识别 计算机
下载PDF
语音识别中基于SFCM模糊聚类的矢量量化方法 被引量:4
2
作者 李晶皎 孙杰 姚天顺 《计算机研究与发展》 EI CSCD 北大核心 1999年第3期263-267,共5页
模糊聚类分析算法用隶属度确定样本所属类别,因其良好的效果而被广泛用于语音识别领域.文中提出了一种模糊聚类分析算法SFCM,并将其用于语音特征的矢量量化,最终形成码本尺寸为128的码本.用SFCM算法得到的码本分布合理... 模糊聚类分析算法用隶属度确定样本所属类别,因其良好的效果而被广泛用于语音识别领域.文中提出了一种模糊聚类分析算法SFCM,并将其用于语音特征的矢量量化,最终形成码本尺寸为128的码本.用SFCM算法得到的码本分布合理,没有空类.采用此码本的语音识别实验表明了这种量化方法对语音识别的有效性. 展开更多
关键词 模糊聚类分析 语音识别 矢量量化 SFCM
下载PDF
煤岩显微组分组图像自动识别系统与关键技术 被引量:18
3
作者 宋孝忠 张群 《煤炭学报》 EI CAS CSCD 北大核心 2019年第10期3085-3097,共13页
煤化程度和显微组分组成决定着煤的物理化学性质和工艺性质。煤的镜质组反射率和显微组分的煤岩自动化测定,不仅可以减少传统人工测定产生的差异,而且速度快、效率高,使煤岩测定结果应用于煤炭分类、煤炭加工利用等领域成为可能。国内... 煤化程度和显微组分组成决定着煤的物理化学性质和工艺性质。煤的镜质组反射率和显微组分的煤岩自动化测定,不仅可以减少传统人工测定产生的差异,而且速度快、效率高,使煤岩测定结果应用于煤炭分类、煤炭加工利用等领域成为可能。国内外在煤岩自动化测定方面开展过大量研究工作,实现了镜质组反射率自动测定。但是由于煤岩显微组成和煤化程度影响的复杂性,显微组分的自动识别和图像分析测定仍然面临诸多难题。针对以上问题:①研制了煤岩显微图像自动采集硬件平台,具有显微镜自动聚焦、自动扫描和显微图像自动采集三大功能模块,建立了煤岩显微组分组图像自动识别工作流程;②开发了显微图像去噪预处理技术,可实现黏结剂与壳质组有效分割、受下方煤颗粒反射影响变亮黏结剂等的有效剔除,形成了基于Prewitt算子的煤岩显微组分假边界图像剔除技术;③开发出基于K均值聚类的煤岩显微组分组图像自动分割和识别技术;④形成了烟煤的煤岩显微组分组图像自动识别系统。应用本文研发的技术,对我国不同变质阶段烟煤的代表性煤样进行煤岩显微图像自动采集和显微组分组自动识别测定,并将测定结果与国内资深煤岩专家人工鉴定的标准结果进行比对。结果表明,两种方法测定的45个样品镜质组、惰质组、壳质组的极差平均值分别仅有2.3%,2.3%,1.5%;按照国家标准GB/T 18510—2001给出的准确度分析方法,获得3个显微组分组的统计量t c<t t。 展开更多
关键词 显微组分组 自动识别 图像分析 K均值聚类算法 软件系统
下载PDF
基于改进的子类判决分析的SAR目标特征提取与识别 被引量:4
4
作者 胡利平 刘宏伟 吴顺君 《电子与信息学报》 EI CSCD 北大核心 2009年第9期2264-2268,共5页
针对大多文献中假设合成孔径雷达(SAR)数据服从单模分布带来的问题,该文提出改进的子类判决分析(ICDA),它假设SAR目标数据服从更合理更实际的多模分布。首先采用快速全局k-均值聚类算法找到每类目标的子类划分,然后基于子类判决分析(CDA... 针对大多文献中假设合成孔径雷达(SAR)数据服从单模分布带来的问题,该文提出改进的子类判决分析(ICDA),它假设SAR目标数据服从更合理更实际的多模分布。首先采用快速全局k-均值聚类算法找到每类目标的子类划分,然后基于子类判决分析(CDA)准则寻找最优的投影矢量,使得投影后不同类别的子类样本之间距离最大而每个子类内部的样本散布最小。用美国运动和静止目标获取与识别(MSTAR)计划录取的SAR地面静止目标数据的实验结果表明,ICDA可获得较好的对真实目标的分类性能和对干扰目标的拒判能力。 展开更多
关键词 合成孔径雷达 自动目标识别 子类判决分析 快速全局k-均值聚类算法
下载PDF
一种基于语义分析的汉语语音识别纠错方法 被引量:2
5
作者 韦向峰 张全 熊亮 《计算机科学》 CSCD 北大核心 2006年第10期152-155,共4页
汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文... 汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文分析了语音识别产生语音和文字方面的错误的原因和类型,在概念层次网络语言模型的基础上提出了一种基于语句语义分析和混淆音矩阵的语音识别纠错方法。通过三个发音人、5万字的声音语料和216句实验语句的纠错测试,本文的纠错系统在纠正语义搭配型错误方面有比较好的表现,可克服N-gram语言模型带来的一些缺陷。本文提出的纠错方法还可以融合到语音识别系统中,以便更好地为语音识别的纠错处理服务。 展开更多
关键词 语音识别 纠错 语义分析 语言模型 概念层次网络
下载PDF
SFCM模糊聚类在语音矢量量化中的应用 被引量:1
6
作者 李晶皎 孙杰 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 1998年第6期595-598,共4页
提出了一种模糊聚类分析算法SFCM,并将其用于语音特征的矢量量化,最终形成码本尺寸为256的码本.用SFCM算法得到的码本分布合理,没有空类.采用此码本的语音识别实验表明了这种量化方法对语音识别的有效性.
关键词 模糊聚类分析 语音识别 矢量量化 SFCM
下载PDF
基于改进能量比值的普通话翘舌音与平舌音区分 被引量:1
7
作者 吴昊 鲁周迅 《计算机工程与设计》 CSCD 北大核心 2010年第15期3451-3454,共4页
针对普通话语音识别中翘舌音与平舌音的区分,主要研究了在基于子音音素语谱的能量比值作为新特征时,系统识别率的改善方法。在传统梅尔倒谱系数和对数能量的特征中,加入子音段高频部分与低频部分的能量比值作为新特征以提高识别的准确... 针对普通话语音识别中翘舌音与平舌音的区分,主要研究了在基于子音音素语谱的能量比值作为新特征时,系统识别率的改善方法。在传统梅尔倒谱系数和对数能量的特征中,加入子音段高频部分与低频部分的能量比值作为新特征以提高识别的准确性。以频带能量序列的差分为基础,提出一种基于距离聚类分析的最佳比例获取方法,使翘舌音与平舌音能量比值间的差异最大化。隐马尔可夫模型实验结果表明,该方法能直接获得最佳比例,有效地改善需通过反复训练测试才能获得最佳比例的不足。 展开更多
关键词 语音识别 翘舌音 能量比值 聚类分析 普通话
下载PDF
潜在语义分析在连续语音识别中的应用
8
作者 欧建林 林茜 史晓东 《计算机工程与应用》 CSCD 北大核心 2009年第32期111-113,共3页
研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术,在此基础上利用WSJ0文本语料库上构建LSA模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度... 研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术,在此基础上利用WSJ0文本语料库上构建LSA模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度函数初始化质心的k-means聚类算法对LSA模型的向量空间进行聚类。WSJ0语料库上的连续语音识别实验结果表明:LSA+3-gram混合模型能够使识别的词错误率相比较于标准的3-gram下降13.3%。 展开更多
关键词 潜在语义分析 N元文法 K均值聚类 连续语音识别
下载PDF
基于线性预测倒谱系数的地震相分析 被引量:12
9
作者 解滔 郑晓东 张? 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2016年第11期4266-4277,共12页
本文借鉴语音识别技术中的线性预测倒谱系数(LPCC系数)特征参数提取方法对地震数据进行分解,这种方法的优点是:可以获得将子波和反射系数信息分离的地震语音特征参数,对地质现象边界具有较好的描述能力,使我们可以从不同维度更细致地观... 本文借鉴语音识别技术中的线性预测倒谱系数(LPCC系数)特征参数提取方法对地震数据进行分解,这种方法的优点是:可以获得将子波和反射系数信息分离的地震语音特征参数,对地质现象边界具有较好的描述能力,使我们可以从不同维度更细致地观察隐藏在地震数据中的地质特征.理论模型分析表明,基于LPCC系数的地震分析具有较高的地震相划分能力.实际地震资料应用表明,LPCC系数对储层特征的描述比常规三瞬属性更为细致,不同阶次LPCC系数在描述储层不同特征时也保持了内在的联系.采用K均值聚类方法对提取的12阶和24阶LPCC系数进行聚类分析,聚类结果与目的层段古地形较为吻合,较好地反映了研究区的断裂、礁滩相带、深水扇和储层的分布特征,说明在地震相分析中采用LPCC系数作为特征参数是可行和有效的. 展开更多
关键词 线性预测倒谱系数 地震相分析 储层预测 K均值聚类 语音识别
全文增补中
一种应用模糊聚类分析的目标识别效果评估方法
10
作者 李彦鹏 黎湘 庄钊文 《电子对抗技术》 2005年第3期10-13,共4页
针对识别效果评估,选取了评估指标及测度方法,将模糊聚类分析引入识别效果评估,建立了一种开放的评估模型,该模型可以给出客观的、定量化的评估结果。最后,结合实测数据完成了仿真。
关键词 模糊聚类分析 评估方法 识别效果 应用 效果评估 测度方法 评估指标 评估模型 实测数据 定量化
下载PDF
基于AIS数据的船舶运动模式识别与应用 被引量:26
11
作者 魏照坤 周康 +1 位作者 魏明 史国友 《上海海事大学学报》 北大核心 2016年第2期17-22,71,共7页
船舶运动模式的提取是轨迹数据分析的重要任务,它可以为船舶异常行为的检测提供参考依据,同时也可以作为航路规划和定线制设计的技术指标.针对现存的聚类算法大多为了追求效率而忽略了运动轨迹特征的问题,对聚类算法中的轨迹结构距离进... 船舶运动模式的提取是轨迹数据分析的重要任务,它可以为船舶异常行为的检测提供参考依据,同时也可以作为航路规划和定线制设计的技术指标.针对现存的聚类算法大多为了追求效率而忽略了运动轨迹特征的问题,对聚类算法中的轨迹结构距离进行改进,将其作为轨迹相似度的评价标准.采用无监督DBSCAN聚类算法实现船舶运动模式的提取.利用琼州海峡船舶自动识别系统(Automatic Identification System,AIS)数据,对该水域的船舶运动模式进行提取,获得行驶于该水域的船舶运动轨迹分布以及各类轨迹中转向区域的分布,其中船舶运动轨迹包括从琼州海峡东峡口向西航行的船舶轨迹,从琼州海峡西峡口向东航行的船舶轨迹,从秀英港前往海安港的船舶轨迹,从海安港前往秀英港的船舶轨迹和从琼州海峡东峡口前往海口港的船舶轨迹.将最终的聚类结果应用于电子海图显示与信息系统(Electronic Chart Display and Information System,ECDIS)上,实现了对船舶的动态监控仿真. 展开更多
关键词 船舶自动识别系统(AIS) 模式识别 聚类分析 电子海图显示与信息系统(ECDIS) 琼州海峡
下载PDF
基于k-means聚类的快速LDA算法在语音识别上的应用 被引量:4
12
作者 王春洁 岳萍 《科技通报》 北大核心 2013年第10期118-120,共3页
线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训... 线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训练样本,然后再利用LDA算法进行分类。由于通过聚类算法有效地压缩了训练样本集的规模,因此算法具有更高的效率。在语音识别数据集上的实验充分验证了本文算法具有较好的分类性能,而且效率更高。 展开更多
关键词 线性判别分析 计算复杂度 K-MEANS聚类 语音识别
下载PDF
基于局部特征优化的语音情感识别 被引量:2
13
作者 隋小芸 朱廷劭 汪静莹 《中国科学院大学学报(中英文)》 CSCD 北大核心 2017年第4期431-438,共8页
情感识别在人机交互领域具有广阔前景。由于情感表达在时间上具有一定的持续性,统计特征更能体现不同情绪语音的差异和动态变化,大多数语音情感识别研究都使用全局特征(如最大值、最小值等),并没有充分挖掘局部特征(如单帧的短时能量、... 情感识别在人机交互领域具有广阔前景。由于情感表达在时间上具有一定的持续性,统计特征更能体现不同情绪语音的差异和动态变化,大多数语音情感识别研究都使用全局特征(如最大值、最小值等),并没有充分挖掘局部特征(如单帧的短时能量、过零率等)中的信息。提出一种基于局部特征优化的方法,对每个情感语音样本做进一步提纯,通过聚类分析对情感特征相对不显著的帧进行过滤,在此基础上进行统计计算和分类,以提高预测的准确率。实验结果表明,基于优化后的样本进行情感分类,3个语料库的平均准确率提高5%~17%。进一步的研究发现这种优化方法可能更适合于语音长度较长的情感识别场景。 展开更多
关键词 语音情感识别 局部特征 全局特征 聚类分析 数据优化
下载PDF
基于语音识别的演讲教学系统 被引量:2
14
作者 戴瑾 巫丰 《计算机应用》 CSCD 北大核心 2020年第S01期289-292,共4页
针对用户演讲与口才表达能力提高的需求以及语音识别应用中用户口音、习惯用词等个性化因素所造成的识别困难和耗时长的问题,提出一种基于语音识别的演讲教学安卓App。该系统在提供教学视频的同时,利用语音识别技术为用户提供了演讲稿... 针对用户演讲与口才表达能力提高的需求以及语音识别应用中用户口音、习惯用词等个性化因素所造成的识别困难和耗时长的问题,提出一种基于语音识别的演讲教学安卓App。该系统在提供教学视频的同时,利用语音识别技术为用户提供了演讲稿的语音文字转换、储存以及数据分析,并为用户演讲能力的改进提供实时指导。系统利用词法分析筛选出用户常用词,采用热词优先识别算法,使识别结果贴近用户的想法和个人风格,进而提高语音识别的准确率和用户体验。测试结果表明系统的语音文字转化速率达到每分钟180字,语音识别准确率高于95%。所提系统能够有效提高演讲语音识别速度和准确率,提高用户的体验质量。 展开更多
关键词 自动语音识别 演讲表达 词法分析 语音文字转换 App
下载PDF
孤立词语音识别系统的一种实用精简算法 被引量:1
15
作者 李挺 《江南大学学报(自然科学版)》 CAS 2003年第2期142-144,共3页
提出了一种以降低识别计算代价为目标的孤立词语音识别系统的设计算法.语音识别系统要求具有很强的实时性,同时应保证较好的识别率.该设计对语音信号采用了处理速度较快的时间轴和幅值上规正化的数据压缩算法,并采用加权离散度法进行识... 提出了一种以降低识别计算代价为目标的孤立词语音识别系统的设计算法.语音识别系统要求具有很强的实时性,同时应保证较好的识别率.该设计对语音信号采用了处理速度较快的时间轴和幅值上规正化的数据压缩算法,并采用加权离散度法进行识别,算法精确、简便、可靠,适合作为小型语音识别产品的主要算法. 展开更多
关键词 语音识别系统 孤立词 聚类分析 特征抽取 数据压缩 加权离散度法
下载PDF
Feature Extraction of Radar Range Profiles Based on Normalized Central Moments
16
作者 傅雄军 高梅国 《Journal of Beijing Institute of Technology》 EI CAS 2004年第S1期17-20,共4页
The normalized central moments are widely used in pattern recognition because of scale and translation invariance. The moduli of normalized central moments of the 1-dimensional complex range profiles are used here as ... The normalized central moments are widely used in pattern recognition because of scale and translation invariance. The moduli of normalized central moments of the 1-dimensional complex range profiles are used here as feature vector for radar target recognition. The common feature extraction method for high resolution range profile obtained by using Fourier-modified direct Mellin transform is inefficient and unsatisfactory in recognition rate And. generally speaking, the automatic target recognition method based on inverse synthetic aperture radar 2-dimensional imaging is not competent for real time object identification task because it needs complicated motion compensation which is sometimes too difficult to carry out. While the method applied here is competent for real-time recognition because of its computational efficiency. The result of processing experimental data indicates that this method is good at recognition. 展开更多
关键词 radar range profile: automatic target recognition: normalized central moment: clustering analysis: nearest neighbor classifier
下载PDF
基于语音识别APP的同声传译能力培养教学模式建构与研究——以科大讯飞语记APP为例 被引量:18
17
作者 李霄垅 王梦婕 《外语电化教学》 CSSCI 北大核心 2018年第1期12-18,共7页
本研究以科大讯飞的语记APP为例,探索语音识别APP在同传课堂中的应用,尝试构建由教师、学生和语音识别APP组成的口译能力培养的新型教学模式。开展将语音识别APP运用于口译教学的实验,检验语音识别APP辅助下的口译教学模式的效果。通过... 本研究以科大讯飞的语记APP为例,探索语音识别APP在同传课堂中的应用,尝试构建由教师、学生和语音识别APP组成的口译能力培养的新型教学模式。开展将语音识别APP运用于口译教学的实验,检验语音识别APP辅助下的口译教学模式的效果。通过对八组学生进行四组实验项目,使用主成分分析对口译质量课堂数据对比发现,八组学生口译水平的均值均有所提高,说明语音识别APP能显著提高口译实践效率。 展开更多
关键词 同声传译 语音识别 主成分分析 科大讯飞语记
原文传递
全景钻孔图像自动识别技术在工程实践中的应用研究 被引量:1
18
作者 邹先坚 王川婴 宋欢 《应用基础与工程科学学报》 EI CSCD 北大核心 2022年第1期246-256,共11页
数字全景摄像技术在钻孔工程实践中已经得到广泛应用.利用数字全景钻孔摄像系统获得的大量高清全景钻孔图像,采用基于聚类和特征函数的自动识别方法进行了智能分析和自动识别研究,并成功应用在乌东德水电站获得的实际全景钻孔图像中.结... 数字全景摄像技术在钻孔工程实践中已经得到广泛应用.利用数字全景钻孔摄像系统获得的大量高清全景钻孔图像,采用基于聚类和特征函数的自动识别方法进行了智能分析和自动识别研究,并成功应用在乌东德水电站获得的实际全景钻孔图像中.结果表明,该自动识别方法能够全面快速地全自动识别出整个钻孔图像中大部分重要结构面及其位置、倾向、倾角和隙宽等特征参数信息,并对结构面特征进行了初步归类和统计分析.在12个约50m深的钻孔当中,每个孔所获全景钻孔图像主要结构面的自动识别率约为90%、准确率约为85%、全孔耗时约为3h,精度偏差小于4%.全景钻孔图像自动识别技术的应用极大地提高了实践工作效率,缩短了工程时间,避免了较多的人为因素干扰,实现了全孔图像结构面形态参数的自动识别与实践应用,有利于推动钻孔摄像技术智能化的进一步发展. 展开更多
关键词 钻孔图像 自动识别 结构面 工程应用 聚类 正弦曲线 乌东德水电站
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部