期刊文献+

二次检索

题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
共找到19篇文章
< 1 >
每页显示 20 50 100
A Novel Visualization Tool for Manual Annotation when Building Large Speech Corpora
1
作者 SHE Kun CHEN Shuzhen YANG Shen ZOU Lian 《Wuhan University Journal of Natural Sciences》 CAS 2006年第2期381-384,共4页
A novel visualized sound description, called sound dendrogram is proposed to make manual annotation easier when building large speech corpora. It is a lattice structure built from a group of "seed regions" and throu... A novel visualized sound description, called sound dendrogram is proposed to make manual annotation easier when building large speech corpora. It is a lattice structure built from a group of "seed regions" and through an iterative procedure of mergence. A simple but reliable extraction method of "seed regkms" and advanced distance metric are adopted to construct the sound dendrogram, so that it can present speech's structure character ranging from coarse to fine in a visualized way. Tests show that all phonemic boundaries are contained in the lattice structure of sound dendrogram and very easy to identify. Sound dendrogram can be a powerful assistant tool during the process of speech corporals manual annotation. 展开更多
关键词 sound dedrogram speech corpora manual annotation computer aid tool
下载PDF
Design of Hierarchical Classifier to Improve Speech Emotion Recognition 被引量:1
2
作者 P.Vasuki 《Computer Systems Science & Engineering》 SCIE EI 2023年第1期19-33,共15页
Automatic Speech Emotion Recognition(SER)is used to recognize emotion from speech automatically.Speech Emotion recognition is working well in a laboratory environment but real-time emotion recognition has been influen... Automatic Speech Emotion Recognition(SER)is used to recognize emotion from speech automatically.Speech Emotion recognition is working well in a laboratory environment but real-time emotion recognition has been influenced by the variations in gender,age,the cultural and acoustical background of the speaker.The acoustical resemblance between emotional expressions further increases the complexity of recognition.Many recent research works are concentrated to address these effects individually.Instead of addressing every influencing attribute individually,we would like to design a system,which reduces the effect that arises on any factor.We propose a two-level Hierarchical classifier named Interpreter of responses(IR).Thefirst level of IR has been realized using Support Vector Machine(SVM)and Gaussian Mixer Model(GMM)classifiers.In the second level of IR,a discriminative SVM classifier has been trained and tested with meta information offirst-level classifiers along with the input acoustical feature vector which is used in primary classifiers.To train the system with a corpus of versatile nature,an integrated emotion corpus has been composed using emotion samples of 5 speech corpora,namely;EMO-DB,IITKGP-SESC,SAVEE Corpus,Spanish emotion corpus,CMU's Woogle corpus.The hierarchical classifier has been trained and tested using MFCC and Low-Level Descriptors(LLD).The empirical analysis shows that the proposed classifier outperforms the traditional classifiers.The proposed ensemble design is very generic and can be adapted even when the number and nature of features change.Thefirst-level classifiers GMM or SVM may be replaced with any other learning algorithm. 展开更多
关键词 speech emotion recognition hierarchical classifier design ENSEMBLE emotion speech corpora
下载PDF
Resources for Development of Hindi Speech Synthesis System: An Overview
3
作者 Archana Balyan 《Open Journal of Applied Sciences》 2017年第6期233-241,共9页
Most of the information in digital world is accessible to few who can read or understand a particular language. The speech corpus acquisition is an essential part of all spoken technology systems. The quality and the ... Most of the information in digital world is accessible to few who can read or understand a particular language. The speech corpus acquisition is an essential part of all spoken technology systems. The quality and the volume of speech data in corpus directly affect the accuracy of the system. However, there are a lot of scopes to develop speech technology system using Hindi language which is spoken primarily in India. To achieve such an ambitious goal, the collection of standard database is a prerequisite. This paper summarizes the Hindi corpus and lexical resources being developed by various organizations across the country. 展开更多
关键词 speech Database corpora LEXICON speech Synthesis LINGUISTICS Natural Language Processing
下载PDF
语音情感识别研究进展综述 被引量:170
4
作者 韩文静 李海峰 +1 位作者 阮华斌 马琳 《软件学报》 EI CSCD 北大核心 2014年第1期37-50,共14页
对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望.从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识别算法研究和语音情感识别技术应... 对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望.从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识别算法研究和语音情感识别技术应用,旨在尽可能全面地对语音情感识别技术进行细致的介绍与分析,为相关研究人员提供有价值的学术参考;最后,立足于研究现状的分析与把握,对当前语音情感识别领域所面临的挑战与发展趋势进行了展望.侧重于对语音情感识别研究的主流方法和前沿进展进行概括、比较和分析. 展开更多
关键词 人机交互 情感计算 情感描述模型 情感语音库 情感声学特征 语音情感识别
下载PDF
采用语音的抑郁症诊断研究述评 被引量:9
5
作者 周爱保 鲁小勇 +1 位作者 吴文意 徐世鹏 《小型微型计算机系统》 CSCD 北大核心 2017年第11期2619-2624,共6页
采用语音声学特征作为客观指标对抑郁症进行诊断研究,是近年来新兴的交叉研究课题之一.本文介绍了近年来国外抑郁症语音研究的状况,阐述了现有各种抑郁症诊断的方法,总结了具有代表性的抑郁症语音数据库.并在此基础上归纳了基于语音的... 采用语音声学特征作为客观指标对抑郁症进行诊断研究,是近年来新兴的交叉研究课题之一.本文介绍了近年来国外抑郁症语音研究的状况,阐述了现有各种抑郁症诊断的方法,总结了具有代表性的抑郁症语音数据库.并在此基础上归纳了基于语音的抑郁症诊断研究中常用的各类特征参数,对当前基于语音的抑郁症诊断研究领域所面临的挑战进行了展望,旨在尽可能全面地揭示抑郁症和语音特征的密切关系,为相关研究人员提供有价值的学术参考. 展开更多
关键词 抑郁症 抑郁语音数据库 声学特征 诊断指标
下载PDF
Web新闻语料分词和标注错误分析 被引量:4
6
作者 张永奎 张彦 +1 位作者 安增波 刘睿 《计算机工程与应用》 CSCD 北大核心 2007年第15期166-169,共4页
通过分析Web突发事件语料库文本的加工统计得出11类错误类型,并对其中的一些错误提出了解决方案。研究结果不仅对语料库加工初期分词、标注方法的改进有启发作用,而且对中文的自动校对方法,提供一定的借鉴。
关键词 中文信息处理 分词 词性标注 错误类型 Web突发事件新闻语料库
下载PDF
基于语料库的双语词典编纂中的词性标注方法 被引量:1
7
作者 刘红蕾 《中北大学学报(社会科学版)》 2002年第3期63-65,共3页
语科库作为自然发生的语言资料的集合 ,它反映了某一种语言的用法特征及其多样性 ;它为词典编篡提供了翔实可靠的依据。利用英语语言学研究的成果 ,结合语料库中常见的词性标注方法 ,对运用于双语词典编纂的 CONU L EXID语料库系统中的... 语科库作为自然发生的语言资料的集合 ,它反映了某一种语言的用法特征及其多样性 ;它为词典编篡提供了翔实可靠的依据。利用英语语言学研究的成果 ,结合语料库中常见的词性标注方法 ,对运用于双语词典编纂的 CONU L EXID语料库系统中的语料词性标注问题进行了初步的探讨。 展开更多
关键词 词性标注 语料库 双语词典编纂
下载PDF
新闻语篇中的转述言语形式研究 被引量:1
8
作者 李玉 《鸡西大学学报(综合版)》 2015年第5期146-148,共3页
转述言语作为新闻报道的关键要素,在新闻语篇中广泛存在,成为人们关注和研究的重点。拟从转述类型的角度,借助语料库工具,对新闻语篇中的转述言语进行定量和定性分析。针对筛选的部分对新闻语篇进行统计和分析,可以从中发现,间接转述是... 转述言语作为新闻报道的关键要素,在新闻语篇中广泛存在,成为人们关注和研究的重点。拟从转述类型的角度,借助语料库工具,对新闻语篇中的转述言语进行定量和定性分析。针对筛选的部分对新闻语篇进行统计和分析,可以从中发现,间接转述是新闻语篇中出现频度最高的转述类型,其次是直接转述,而其余的三种转述类型自由直接转述、自由间接转述以及叙述性转述则出现频度相对较少。在将语言学、新闻话语分析、语用学等理论应用于转述言语分析的基础上,引入语料库技术和工具,不但有助于加深读者对转述语言的认识,还进一步丰富了转述言语的研究方法和视角,同时对于英汉教学和新闻传播实践也具有一定的参考价值和启示意义。 展开更多
关键词 转述言语 转述类型 语料库
下载PDF
学习者语音库韵律标注理据与标注系统——以HELSCOM为例
9
作者 刘希瑞 《郑州航空工业管理学院学报(社会科学版)》 2016年第4期70-73,共4页
文章在回顾传统英美语调标注体系和To BI及IVi E韵律标注系统的基础上,结合学习者英语语音特点,构建了河南口音英语学习者语音库(HELSCOM)的韵律标注系统。该系统包括语调层(intonation tier)、音高事件层(pitch events tier)、停顿指数... 文章在回顾传统英美语调标注体系和To BI及IVi E韵律标注系统的基础上,结合学习者英语语音特点,构建了河南口音英语学习者语音库(HELSCOM)的韵律标注系统。该系统包括语调层(intonation tier)、音高事件层(pitch events tier)、停顿指数层(break-index tier)、杂类层(miscellaneous tier)等四层,实现了传统英美语调标注体系与ToBI及IVi E韵律标注系统的完美融合。 展开更多
关键词 学习者语音库 韵律标注 ToBI&IViE
下载PDF
利用人类计算技术的语音语料库标注方法及其实现 被引量:2
10
作者 沈映泉 刘勇进 +1 位作者 蔡骏 史晓东 《智能系统学报》 2009年第3期270-277,共8页
提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算... 提出一种基于人类计算的语音语料库标注方法.该标注方法的主要思路是通过一个基于Web的语言学习系统来收集由大量学习者(用户)输入的词汇标注和音标标注,并从中选择出现概率最大的用户输入作为语料的正确标注.为了保证通过这种人类计算方法获得的标注文本的质量,使用了一些计算机辅助机制来校验收集到的标注的可靠性.采用这种方法实现语音语料库标注的主要优点在于将语料库标注和语言学习相结合,无需专门投入大量的人力来进行枯燥乏味的语料库标注工作,从而节省了语料库标注的成本.对这种基于人类计算的语音语料库标注技术进行了探讨,说明了用于收集用户输入的语言学习系统的设计以及标注生成系统的设计.系统的应用表明,该标注方法能够有效、低成本地生成语音语料库的词汇标注和音标标注. 展开更多
关键词 语音语料库标注 人类计算 分布式知识获取 基于Web的语言学习
下载PDF
车载语音导航系统的语音语料库构建探究
11
作者 王大鹏 《电子测试》 2013年第4期4-6,共3页
探讨车载语音导航系统的语音语料库开发思路、核心设计理念和所应用的计算初技术。从理论和实践两方面探讨其语音语料库构建的可行性。
关键词 语音语料库 语音导航系统 SQL C-ToBI
下载PDF
车载语音导航系统的语音语料库构建探究
12
作者 王大鹏 《电子测试》 2013年第3X期94-95,共2页
探讨车载语音导航系统的语音语料库开发思路、核心设计理念和所应用的计算机技术。从理论和实践两方面探讨其语音语料库构建的可行性。
关键词 语音语料库 语音导航系统 SQL C-ToBI
下载PDF
面向口译教学的视频语料资源库深度开发机制研究 被引量:6
13
作者 邓军涛 刘梦莲 《外语教育研究前沿》 CSSCI 2020年第1期37-43,88,共8页
语料库在语言研究、外语教学、翻译学研究、词典编纂等领域已有广泛应用。与此同时,语料库,尤其是视频语料库,在口译教学中的应用价值日益受到关注。基于语料库开发面向口译教学的语料资源库必须秉持由研究驱动向教学驱动转化的理念,且... 语料库在语言研究、外语教学、翻译学研究、词典编纂等领域已有广泛应用。与此同时,语料库,尤其是视频语料库,在口译教学中的应用价值日益受到关注。基于语料库开发面向口译教学的语料资源库必须秉持由研究驱动向教学驱动转化的理念,且需要综合考虑素材、职业、教学法、语境等因素。在实践层面,本文以欧盟委员会"虚拟现实口译"项目的视频语料资源库为例,从素材选取、语料切分、信息标注与场景模拟四个方面阐述其深度开发机制,并探讨其对我国口译教学语料资源建设的启示。 展开更多
关键词 视频语料库 口译教学 语料资源库 深度开发 虚拟现实口译
下载PDF
语料库在口笔译教学中的应用研究
14
作者 宫静萍 刘萍 《湖北第二师范学院学报》 2017年第7期29-32,共4页
语言学研究上经常使用的语料库,近十几年来已慢慢应用在翻译教学与研究领域,不过仍以欧洲语言的应用为主。本文以英汉、汉英翻译为例,介绍语料库如何应用在翻译教学及研究上。内容涵盖语料库种类、语料库检索工具、各种潜在用途、相关... 语言学研究上经常使用的语料库,近十几年来已慢慢应用在翻译教学与研究领域,不过仍以欧洲语言的应用为主。本文以英汉、汉英翻译为例,介绍语料库如何应用在翻译教学及研究上。内容涵盖语料库种类、语料库检索工具、各种潜在用途、相关翻译语料库之建构建议,以及设计以语料库为辅之翻译教学课程。 展开更多
关键词 语料库 语料检索 语料标记 以语料库为辅的翻译教学
下载PDF
基于FP-Growth算法的词性标注规则获取方法
15
作者 莫礼平 黄永琨 《吉首大学学报(自然科学版)》 CAS 2021年第4期38-43,共6页
为了提高词性标注模型训练语料的质量,设计了一种利用FP-Growth算法从训练语料库中自动获取词性标注规则的方法,并将该方法与基于Apriori算法的词性标注规则获取方法进行了对比实验.实验结果显示,对于0.1万、0.2万和1万词级的小规模语料... 为了提高词性标注模型训练语料的质量,设计了一种利用FP-Growth算法从训练语料库中自动获取词性标注规则的方法,并将该方法与基于Apriori算法的词性标注规则获取方法进行了对比实验.实验结果显示,对于0.1万、0.2万和1万词级的小规模语料库,2种方法获取的词性标注规则条数均相同,但基于FP-Growth算法的时间耗费分别仅为基于Apriori算法的0.013866%,0.010399%,0.003132%;对于10万、100万词级的训练语料库,基于Apriori算法无法获取任何规则,但基于FP-Growth算法依然可以在合理时间内获取有效的规则.这说明,基于FP-Growth算法的词性标注规则获取方法是可行且高效的,满足在优化训练语料库时能从不同规模的语料库中自动获取词性标注规则的实际需求. 展开更多
关键词 词性标注规则 语料库 关联规则挖掘 APRIORI算法 FP-GROWTH算法
下载PDF
自然灾害新闻报道转述动词批评性研究——基于中英美自建报刊语料库的对比
16
作者 陈居强 《江苏海洋大学学报(人文社会科学版)》 2012年第10期73-75,共3页
通过对比中、英、美三国主流媒体在自然灾害新闻报道中转述引语使用的差异,揭示其中隐含的意识形态对读者的影响。以批评语篇分析为理论框架,结合语料库定量研究方法,选取中、英、美三国自然灾害新闻报道资料分别建立语料库,通过整理、... 通过对比中、英、美三国主流媒体在自然灾害新闻报道中转述引语使用的差异,揭示其中隐含的意识形态对读者的影响。以批评语篇分析为理论框架,结合语料库定量研究方法,选取中、英、美三国自然灾害新闻报道资料分别建立语料库,通过整理、分析、对比所得数据,发现三个语料库在转述动词使用上存在显著差异,对读者产生了潜在影响。 展开更多
关键词 转述引语 批评语篇分析 报刊英语语料库
下载PDF
中美企业社会责任报告董事长致辞的多维分析 被引量:2
17
作者 胡春雨 卢春梅 《外语教学》 CSSCI 北大核心 2022年第6期38-44,共7页
企业社会责任报告(以下简称CSR报告)中的董事长致辞,是企业与利益相关者进行沟通的重要渠道。本研究基于自建语料库,对中美企业董事长致辞的语域特征进行多维分析。研究发现:1)与通用语篇相比,董事长致辞主要呈现较强的指称明晰性特征,... 企业社会责任报告(以下简称CSR报告)中的董事长致辞,是企业与利益相关者进行沟通的重要渠道。本研究基于自建语料库,对中美企业董事长致辞的语域特征进行多维分析。研究发现:1)与通用语篇相比,董事长致辞主要呈现较强的指称明晰性特征,而其在叙述性和显性劝说性上较弱;2)与美企相比,中企董事长致辞主要属于偏叙述及指称明晰类语篇,而其在交互性、即席信息组织精细度上相对较弱;3)中美企业董事长致辞的维度特征差异,具体表现在55项语言特征共现频率上。董事长致辞提升企业合法性的交际目的,形成了其特有的语域特征;中美两国社会文化语境(权力距离高低、长期与短期导向)与中美作者在英语语言熟练度等方面的差异,导致了中美企业董事长致辞的语域特征差异。本研究对提升我国企业对外传播质量及CSR报告语类的教学具有一定启示作用。 展开更多
关键词 语料库 企业社会责任报告 董事长致辞 企业身份 语域研究 多维分析
原文传递
汉语中介语语音库的文本设计 被引量:7
18
作者 王玮 张劲松 《世界汉语教学》 CSSCI 北大核心 2019年第1期104-116,共13页
中介语语音库的构建面临一个文本设计问题:既要涵盖目的语的基本语音要素,又要严控其大小。因为文本过大,单人收录成本过高,不利于收集更多的话者被试。本文介绍我们面向汉语中介语语音库构建所提出的一套文本方案:在控制文本集大小的... 中介语语音库的构建面临一个文本设计问题:既要涵盖目的语的基本语音要素,又要严控其大小。因为文本过大,单人收录成本过高,不利于收集更多的话者被试。本文介绍我们面向汉语中介语语音库构建所提出的一套文本方案:在控制文本集大小的前提下,最大限度地涵盖更多的语音要素。除了单音节、音韵平衡双音节文本外,该方案还包含一个覆盖音段、声调、调联三音子、焦点语调且文本难度适中的最小句子集合,该句子集合由计算机算法从大语料库中搜索产生。我们认为基于这个录音文本,不仅能够收集到二语习得研究所关注的各种语音现象,还能够比较方便地获得大量的话者数量,从而更好地服务于语音习得及计算机辅助语音教学研究。 展开更多
关键词 汉语中介语语音 语音语料库 文本设计
原文传递
语料库语言学及语言科技发展国际会议综述
19
作者 王艳伟 《外语教育》 2019年第1期174-178,共5页
语料库语言学及语言科技发展国际会议(2015)上,来自世界各地的学者和研究团队报告了各自在语言学、语言学习和翻译研究中采用的各种新的技术和方法。研究主题集中在:语料库分析工具的开发及应用;语料库的设计与研制;基于语料库的多模态... 语料库语言学及语言科技发展国际会议(2015)上,来自世界各地的学者和研究团队报告了各自在语言学、语言学习和翻译研究中采用的各种新的技术和方法。研究主题集中在:语料库分析工具的开发及应用;语料库的设计与研制;基于语料库的多模态话语分析;语料库、对比研究和翻译;基于语料库的计算语言学;语料库、语言习得与教学及英语作为通用语的语料库研究等领域。会议穿插安排了专家主旨报告(特邀报告)、分会场报告、研讨会和在线专题讨论会。会议的一个重要特色是在闭幕前利用"简化广播技术,四位大会发言人以"当全球英语遭遇全球华语"为题,进行了90分钟的在线专题讨论会。 展开更多
关键词 语料库 语料库语言学及语言科技发展国际会议(2015) 主旨报告 研讨会 在线专题讨论会
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部