期刊文献+
共找到47篇文章
< 1 2 3 >
每页显示 20 50 100
Chinese spoken language understanding in SHTQS
1
作者 毛家菊 郭荣 陆汝占 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2005年第2期225-230,共6页
Spoken dialogue systems are an active research field with wide applications. But the differences in the Chinese spoken dialogue system are not as distinct as that of English. In Chinese spoken dialogues, there are man... Spoken dialogue systems are an active research field with wide applications. But the differences in the Chinese spoken dialogue system are not as distinct as that of English. In Chinese spoken dialogues, there are many language phenomena. Firstly, most utterances are ill-formed. Secondly, ellipsis, anaphora and negation are also widely used in Chinese spoken dialogue. Determining how to extract semantic information from incomplete sentences and resolve negation, anaphora and ellipsis is crucial. SHTQS (Shanghai Transportation Query System) is an intelligent telephone-based spoken dialogue system providing information about the best route between any two sites in Shanghai. After a brief description of the system, the natural language processing is emphasized. Speech recognition sentences unavoidably contain errors. In language sequence processing procedures, these errors can be easily passed to the later parts and take on a ripple effect. To detect and recover these from errors as early as possible, language-processing strategies are specially considered. For errors resulting from divided words in speech recognition, segmentation and POS Tagging approaches that can rectify these errors are designed. Since most of the inquiry utterances are ill-formed and negation, anaphora and ellipsis are common language phenomena, the language understanding must be adequately adaptive. So, a partial syntactic parsing scheme is adopted and a chart algorithm is used. The parser is based on unification grammar. The semantic frame that extracts from the best arc set of the chart is used to represent the meaning of sentences. The negation, anaphora and ellipsis are also analyzed and corresponding processing approaches are presented. The accuracy of the language processing part is 88.39% and the testing result shows that the language processing strategies are rational and effective. 展开更多
关键词 spoken dialogue system natural language understanding syntactic parsing
下载PDF
SHTQS: a telephonebased Chinese spoken dialogue system
2
作者 Mao Jiaju Chen Qiulin Gao Feng Guo Rong Lu Ruzhan 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第4期881-885,共5页
SHTQS is an intelligent telephone-besed spoken dialyze system providing the infomation about the best route between two sites in Shanghai. Instead of separated parts of speech decoding and language parsing, a close co... SHTQS is an intelligent telephone-besed spoken dialyze system providing the infomation about the best route between two sites in Shanghai. Instead of separated parts of speech decoding and language parsing, a close cool,ration is carded out in SHTQS by integrating automatic speech recognizer (AS,R), language understanding, dialogue management and speech generatot. In such a way, the erroneous analysis and uncertainty happening in the preceding stages would be recovered and determined acourately with high-level knowledge, Moreover, instead of shallow word-level analysis or simply keyword or key phrase matching, a deeper analysis is performed in our system by integrating a robust parser and a semantic interpreter. The robust parser is particularly important for spontanecos speech inputs because most of the inquiry sentences/phrases are ill-formed. In addition, in designinga mixed-initiative dialogue system, understanding users' inquiries is essential; however, simply matching keywords and/or key phrases can hardly achieve this. Therefore, a semantic interpreter is incorporated in oar system. The performnce of is also evaluated. The dialogue efficiency is 4.4 sentences per query on an average and the case precision rate of language understanding module is up to 81%. The results are satisfactory. 展开更多
关键词 spoken dialogue system ASR natural language understanding NLG TTS.
下载PDF
联合多意图识别与语义槽填充的双向交互模型 被引量:3
3
作者 李实 孙镇鹏 《计算机工程与应用》 CSCD 北大核心 2024年第5期130-138,共9页
意图识别与语义槽填充是口语理解的两个主要任务,两者具有高度相关性,通常进行联合训练。随着口语理解任务的深入,研究发现用户在现实场景中的话语往往含有多个意图。但部分联合模型只能识别用户话语中的单个意图,未能充分建模多个意图... 意图识别与语义槽填充是口语理解的两个主要任务,两者具有高度相关性,通常进行联合训练。随着口语理解任务的深入,研究发现用户在现实场景中的话语往往含有多个意图。但部分联合模型只能识别用户话语中的单个意图,未能充分建模多个意图和语义槽之间的关联性。考虑到话语中多个意图的信息可以引导语义槽填充,语义槽信息也可以帮助意图更好的识别,模型采用图注意力网络建立意图和语义槽之间的双向交互。具体的,将两个任务双向关联以便模型能够挖掘多个意图与语义槽之间的关系,同时引入两个任务的标签信息使模型能够学习到话语上下文和标签的关系,从而提高意图识别与语义槽填充的准确率,优化口语理解的整体性能。实验表明,模型在MixATIS和MixSNIPS两个多意图数据集上对比其他模型性能得到了显著提升。 展开更多
关键词 口语理解 多意图识别 语义槽填充 联合模型
下载PDF
医疗领域对话系统口语理解综述 被引量:1
4
作者 任芳慧 郭熙铜 +1 位作者 彭昕 杨锦锋 《中文信息学报》 CSCD 北大核心 2024年第1期24-35,共12页
ChatGPT引发了新一轮的科技革命,使得对话系统成为研究热点。口语理解(Spoken Language Understanding,SLU)作为任务型对话系统的第一部分,对系统整体的表现具有重要影响。在最近几年中,得益于大规模语言模型的成功,口语理解任务取得了... ChatGPT引发了新一轮的科技革命,使得对话系统成为研究热点。口语理解(Spoken Language Understanding,SLU)作为任务型对话系统的第一部分,对系统整体的表现具有重要影响。在最近几年中,得益于大规模语言模型的成功,口语理解任务取得了较大的发展。然而,现有工作大多基于书面语数据集完成,无法很好地应对真实口语场景。为此,该文面向与书面语相对的口语,重点关注医疗领域这一应用场景,对现有的医疗领域对话系统口语理解任务进行综述。具体地,该文阐述了医疗口语理解任务的难点与挑战,并从数据集、算法和应用的层面梳理了医疗口语理解的研究现状及不足之处。最后,该文结合生成式大模型的最新进展,给出了医疗口语理解问题新的研究方向。 展开更多
关键词 任务型对话系统 口语理解 医疗领域 生成式大模型
下载PDF
基于小样本学习的口语理解方法综述
5
作者 刘纳 郑国风 +3 位作者 徐贞顺 林令德 李晨 杨杰 《郑州大学学报(工学版)》 北大核心 2024年第1期78-89,共12页
小样本口语理解是目前对话式人工智能亟待解决的问题之一。结合国内外最新研究现状,系统地梳理了口语理解任务的相关文献。简要介绍了在非小样本场景中口语理解任务建模的经典方法,包括无关联建模、隐式关联建模、显式关联建模以及基于... 小样本口语理解是目前对话式人工智能亟待解决的问题之一。结合国内外最新研究现状,系统地梳理了口语理解任务的相关文献。简要介绍了在非小样本场景中口语理解任务建模的经典方法,包括无关联建模、隐式关联建模、显式关联建模以及基于预训练范式的建模方法;重点阐述了在小样本口语理解任务中为解决训练样本受限问题而提出的基于模型微调、基于数据增强和基于度量学习3类方法,介绍了如ULMFiT、原型网络和归纳网络等代表性模型。在此基础上对不同模型的语义理解能力、可解释性、泛化能力等性能进行分析对比。最后对口语理解任务面临的挑战和未来发展方向进行讨论,指出零样本口语理解、中文口语理解、开放域口语理解以及跨语言口语理解等研究内容是该领域的研究难点。 展开更多
关键词 口语理解 小样本学习 模型微调 数据增强 度量学习
下载PDF
一种基于窗口机制的口语理解异构图网络
6
作者 张启辰 王帅 李静梅 《软件学报》 EI CSCD 北大核心 2024年第4期1885-1898,共14页
口语理解(spoken language understanding,SLU)是面向任务的对话系统的核心组成部分,旨在提取用户查询的语义框架.在对话系统中,口语理解组件(SLU)负责识别用户的请求,并创建总结用户需求的语义框架,SLU通常包括两个子任务:意图检测(int... 口语理解(spoken language understanding,SLU)是面向任务的对话系统的核心组成部分,旨在提取用户查询的语义框架.在对话系统中,口语理解组件(SLU)负责识别用户的请求,并创建总结用户需求的语义框架,SLU通常包括两个子任务:意图检测(intent detection,ID)和槽位填充(slot filling,SF).意图检测是一个语义话语分类问题,在句子层面分析话语的语义;槽位填充是一个序列标注任务,在词级层面分析话语的语义.由于意图和槽之间的密切相关性,主流的工作采用联合模型来利用跨任务的共享知识.但是ID和SF是两个具有强相关性的不同任务,它们分别表征了话语的句级语义信息和词级信息,这意味着两个任务的信息是异构的,同时具有不同的粒度.提出一种用于联合意图检测和槽位填充的异构交互结构,采用自注意力和图注意力网络的联合形式充分地捕捉两个相关任务中异构信息的句级语义信息和词级信息之间的关系.不同于普通的同构结构,所提模型是一个包含不同类型节点和连接的异构图架构,因为异构图涉及更全面的信息和丰富的语义,同时可以更好地交互表征不同粒度节点之间的信息.此外,为了更好地适应槽标签的局部连续性,利用窗口机制来准确地表示词级嵌入表示.同时结合预训练模型(BERT),分析所提出模型应用预训练模型的效果.所提模型在两个公共数据集上的实验结果表明,所提模型在意图检测任务上准确率分别达到了97.98%和99.11%,在槽位填充任务上F1分数分别达到96.10%和96.11%,均优于目前主流的方法. 展开更多
关键词 对话系统 口语理解 异构图 窗口机制 意图检测 槽位填充
下载PDF
基于多任务学习的意图检测和槽位填充联合方法
7
作者 尚爱国 朱欣娟 《计算机应用》 CSCD 北大核心 2024年第3期690-695,共6页
随着预训练语言模型在自然语言处理(NLP)任务上的应用,意图检测(ID)和槽位填充(SF)联合建模提高了口语理解的性能。现有方法大多关注意图和槽位的相互作用,忽略了差异文本序列建模对口语理解(SLU)任务的影响。因此,提出一种基于多任务... 随着预训练语言模型在自然语言处理(NLP)任务上的应用,意图检测(ID)和槽位填充(SF)联合建模提高了口语理解的性能。现有方法大多关注意图和槽位的相互作用,忽略了差异文本序列建模对口语理解(SLU)任务的影响。因此,提出一种基于多任务学习的意图检测和槽位填充联合方法(IDSFML)。首先,使用随机掩盖mask策略构造差异文本,设计结合自编码器和注意力机制的神经网络(AEA)结构,为口语理解任务融入差异文本序列的特征;其次,设计相似性分布任务,使差异文本和原始文本的表征相似;最后,联合训练ID、SF和差异文本序列相似性分布三个任务。在航班旅行信息系统(ATIS)和SNIPS数据集上的实验结果表明,IDSFML与表现次优的基线方法SASGBC(Self-Attention and Slot-Gated on top of BERT with CRF)相比,槽位填充F1值分别提升了1.9和1.6个百分点,意图检测准确率分别提升了0.2和0.4个百分点,提高了口语理解任务的准确率。 展开更多
关键词 意图检测 槽位填充 多任务学习 口语理解 注意力机制
下载PDF
旅游领域意图识别和槽位填充联合建模方法研究
8
作者 厉雯 古丽拉·阿东别克 +1 位作者 樊诗雨 任方日 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第2期75-82,共8页
构建了基于BERT的双向连接模式BERT-based Bi-directional Association Model(BBAM)以实现在意图识别和槽位填充之间建立双向关系的目标,来实现意图识别与槽位填充的双向关联,融合两个任务的上下文信息,对意图识别与槽位填充两个任务之... 构建了基于BERT的双向连接模式BERT-based Bi-directional Association Model(BBAM)以实现在意图识别和槽位填充之间建立双向关系的目标,来实现意图识别与槽位填充的双向关联,融合两个任务的上下文信息,对意图识别与槽位填充两个任务之间的联系进行深度挖掘,从而优化问句理解的整体性能.为了验证模型在旅游领域中的实用性和有效性,通过远程监督和人工校验构建了旅游领域问句数据集TFQD(Tourism Field Question Dataset),BBAM模型在此数据集上的槽填充任务F 1值得分为95.21%,意图分类准确率(A)为96.71%,整体识别准确率(A_(sentence))高达89.62%,显著优于多种基准模型.所提出的模型在ATIS和Snips两个公开数据集上与主流联合模型进行对比实验后,结果表明其具备一定的泛化能力. 展开更多
关键词 自然语言理解 口语理解 问句理解 旅游领域 智能问答 意图识别 槽位填充 联合建模
下载PDF
融合标签特征和胶囊注意力的口语理解方法
9
作者 李丹涛 曾碧 +1 位作者 魏鹏飞 蔡佳 《计算机工程与设计》 北大核心 2024年第8期2484-2491,共8页
针对目前意图检测和槽位填充联合学习中未充分考虑交互前标签特征信息的有效提取和融合,缺乏对交互后标签特征的提炼问题,提出一种融合标签特征和胶囊注意力的口语理解方法。主要由意图与槽位标签特征融合交互(label feature fusion int... 针对目前意图检测和槽位填充联合学习中未充分考虑交互前标签特征信息的有效提取和融合,缺乏对交互后标签特征的提炼问题,提出一种融合标签特征和胶囊注意力的口语理解方法。主要由意图与槽位标签特征融合交互(label feature fusion interactive, LFFI)和多头胶囊注意力机制(multi-head capsule attention, MHCA)两大关键模组组成。LFFI-MHCA通过LFFI提取序列中有效的意图和槽位标签信息,对两者进行融合和交互;利用MHCA对交互过程中产生的不同子空间信息进行提炼,获得更为精确的意图和槽位标签特征。该模型在ATIS和SNIPS数据集上进行实验,句子准确率分别为88.1%和89.0%,验证了该模型的有效性。 展开更多
关键词 口语理解 意图检测 槽位填充 标签特征融合交互 多头胶囊注意力机制 深度学习 自然语言处理
下载PDF
校园导航系统Easy Nav的设计与实现 被引量:23
10
作者 黄寅飞 郑方 +2 位作者 燕鹏举 徐明星 吴文虎 《中文信息学报》 CSCD 北大核心 2001年第4期35-40,共6页
本文介绍了校园导航口语对话系统EasyNav的设计与实现。在分析了口语对话系统的特点和要求之后 ,我们提出了适合于对话系统的基于规则的语言理解流程。在这一流程中 ,句法分析使用GLR分析器处理上下文无关文法 (CFG) ,获取句子结构特征... 本文介绍了校园导航口语对话系统EasyNav的设计与实现。在分析了口语对话系统的特点和要求之后 ,我们提出了适合于对话系统的基于规则的语言理解流程。在这一流程中 ,句法分析使用GLR分析器处理上下文无关文法 (CFG) ,获取句子结构特征以便为语义分析服务 ,句法规则照顾到覆盖率和准确率间的平衡。语义分析使用考虑句法约束条件的模板匹配方法 ,以获取话者意图为目标 ,并消除句法分析引入的歧义。这一设计的优点是系统容易搭建 。 展开更多
关键词 口语对话系统 语音理解 句法分析 模板匹配 校园导航系统 语音识别 设计 EasyNav
下载PDF
基于上下文信息的口语意图检测方法 被引量:5
11
作者 徐扬 王建成 +1 位作者 刘启元 李寿山 《计算机科学》 CSCD 北大核心 2020年第1期205-211,共7页
近年来,随着人工智能的发展与智能设备的普及,人机智能对话技术得到了广泛的关注。口语语义理解是口语对话系统中的一项重要任务,而口语意图检测是口语语义理解中的关键环节。由于多轮对话中存在语义缺失、框架表示以及意图转换等复杂... 近年来,随着人工智能的发展与智能设备的普及,人机智能对话技术得到了广泛的关注。口语语义理解是口语对话系统中的一项重要任务,而口语意图检测是口语语义理解中的关键环节。由于多轮对话中存在语义缺失、框架表示以及意图转换等复杂的语言现象,因此面向多轮对话的意图检测任务十分具有挑战性。为了解决上述难题,文中提出了基于门控机制的信息共享网络,充分利用了多轮对话中的上下文信息来提升检测性能。具体而言,首先结合字音特征构建当前轮文本和上下文文本的初始表示,以减小语音识别错误对语义表示的影响;其次,使用基于层级化注意力机制的语义编码器得到当前轮和上下文文本的深层语义表示,包含由字到句再到多轮文本的多级语义信息;最后,通过在多任务学习框架中引入门控机制来构建基于门控机制的信息共享网络,使用上下文语义信息辅助当前轮文本的意图检测。实验结果表明,所提方法能够高效地利用上下文信息来提升口语意图检测效果,在全国知识图谱与语义计算大会(CCKS2018)技术评测任务2的数据集上达到了88.1%的准确率(Acc值)和88.0%的综合正确率(F1值),相比于已有的方法显著提升了性能。 展开更多
关键词 口语语义理解 意图检测 上下文信息 门控神经网络
下载PDF
中文口语理解中关键语义类模糊匹配方法的研究 被引量:2
12
作者 李艳玲 颜永红 《小型微型计算机系统》 CSCD 北大核心 2014年第9期2182-2186,共5页
针对人机交互过程中语音识别引起的发音变异以及用户表达关键信息不完整情况,提出一种模糊匹配方法.该方法分两步,第一步,通过条件随机场进行序列标注,定位查询语句中的关键语义概念,并得到其初步类别;第二步,利用几种相似度计算方法,... 针对人机交互过程中语音识别引起的发音变异以及用户表达关键信息不完整情况,提出一种模糊匹配方法.该方法分两步,第一步,通过条件随机场进行序列标注,定位查询语句中的关键语义概念,并得到其初步类别;第二步,利用几种相似度计算方法,寻找与领域词典中发音相似度最大的字符串对错误的语义概念进行替换,并标注出具体类别.另外针对最优模糊匹配结果不一定满足用户需要,进行了多个候选的实验.实验结果证明:无论使用哪种相似度计算方法,基于拼音的模糊匹配方法比基于字的模糊匹配方法在语音识别的文本上都具有更好的性能,而且在多候选的结果上也仍旧适用,说明该方法对于提高口语理解系统的鲁棒性上是有效的. 展开更多
关键词 模糊匹配 条件随机场 口语理解 命名实体识别 相似度函数
下载PDF
中文口语理解弱监督训练方法 被引量:2
13
作者 李艳玲 颜永红 《计算机应用》 CSCD 北大核心 2015年第7期1965-1968,1974,共5页
标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键语义概念识别中获取语义类特征子集和句子本身的字特征子集分... 标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键语义概念识别中获取语义类特征子集和句子本身的字特征子集分别作为两个"视角"的特征进行协同训练。通过在中文口语语料上进行的实验表明:结合主动学习和自训练的方法与被动学习、主动学习相比较,可以最大限度地降低人工标注量;而协同训练在很少的初始标注数据的前提下,利用两个特征子集进行协同训练,最终使得单一字特征子集上的分类错误率平均下降了0.52%。 展开更多
关键词 意图识别 口语理解 弱监督训练 协同训练 主动学习
下载PDF
统计中文口语理解执行策略的研究 被引量:4
14
作者 李艳玲 颜永红 《计算机科学与探索》 CSCD 北大核心 2017年第6期980-987,共8页
口语理解的语义框架包括两个决策——关键语义概念识别和意图识别,主要针对这两个决策的执行策略进行研究。首先研究了并联型和级联型两种策略;然后在此基础上提出了联合型结构进行中文口语理解,即通过三角链条件随机场对意图以及关键... 口语理解的语义框架包括两个决策——关键语义概念识别和意图识别,主要针对这两个决策的执行策略进行研究。首先研究了并联型和级联型两种策略;然后在此基础上提出了联合型结构进行中文口语理解,即通过三角链条件随机场对意图以及关键语义概念共同建模,用一个单独的图模型结构共同表示它们的依赖关系。通过与其他几种策略进行比较实验得出结论:该模型可以将两个任务一次完成,在关键语义概念识别任务上性能优于其他的执行策略。 展开更多
关键词 口语理解 三角链条件随机场 关键语义概念识别 意图识别 执行策略
下载PDF
单通道与多通道自适应方向性麦克风助听器对正常成年人噪声下言语识别率的影响 被引量:1
15
作者 胡旭君 应俊 史靓 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2009年第5期488-490,共3页
目的比较噪声环境下单通道和多通道自适应麦克风助听器的指向性对正常成年人言语识别率的影响。方法30例(60耳)正常青年人(男、女各15例)分别双耳配戴Diva9(单通道自适应麦克风指向性模式)和Inteo9(多通道自适应麦克风指向性模式)耳背机... 目的比较噪声环境下单通道和多通道自适应麦克风助听器的指向性对正常成年人言语识别率的影响。方法30例(60耳)正常青年人(男、女各15例)分别双耳配戴Diva9(单通道自适应麦克风指向性模式)和Inteo9(多通道自适应麦克风指向性模式)耳背机,在不同信噪比的动态噪声漫射声场中进行言语识别率测试,对助听效果进行评估。结果单通道自适应方向性麦克风(Diva9)及多通道自适应方向性麦克风(Inteo9)L50值[达到50%言语识别率所需的信噪比(dB)]分别为0.63和-4.63dB,两者比较差异有显著统计学意义(P<0.001)。结论自适应方向性麦克风系统的多通道极性最优化模式可显著提高配戴者的言语识别能力。 展开更多
关键词 多通道自适应方向性麦克风 助听器 信噪比 言语可懂度
下载PDF
利用领域信息的基于字的鲁棒中文口语理解研究 被引量:1
16
作者 包长春 徐为群 +2 位作者 李亚丽 潘接林 颜永红 《微计算机应用》 2010年第6期1-7,共7页
鲁棒性是口语理解研究最具挑战性的关键问题之一。本文采用两个策略提高口语解析的鲁棒性:一是使用浅层统计理解框架,将口语解析简化为实体识别,并且以字取代词作为基本处理单元;二是在统计框架下,分别从特征提取和语料扩充两个角度充... 鲁棒性是口语理解研究最具挑战性的关键问题之一。本文采用两个策略提高口语解析的鲁棒性:一是使用浅层统计理解框架,将口语解析简化为实体识别,并且以字取代词作为基本处理单元;二是在统计框架下,分别从特征提取和语料扩充两个角度充分利用领域信息。实验结果显示上述方法能有效提升语义解析性能。对于人机对话的测试集,当输入为语音识别结果时,解析性能(F1值)由75.27提升至90.24,输入为人工转抄结果时,性能由80.59提升至97.14。 展开更多
关键词 中文口语理解 领域信息 鲁棒性
下载PDF
利用知识强化语言模型的口语理解方法
17
作者 刘高军 王岳 +2 位作者 段建勇 何丽 王昊 《计算机工程》 CAS CSCD 北大核心 2023年第3期73-79,共7页
基于预训练的语言模型在口语理解(SLU)任务中具有优异的性能表现。然而,与人类理解语言的方式相比,单纯的语言模型只能建立文本层级的上下文关联,缺少丰富的外部知识来支持其完成更为复杂的推理。提出一种针对SLU任务的基于Transformer... 基于预训练的语言模型在口语理解(SLU)任务中具有优异的性能表现。然而,与人类理解语言的方式相比,单纯的语言模型只能建立文本层级的上下文关联,缺少丰富的外部知识来支持其完成更为复杂的推理。提出一种针对SLU任务的基于Transformer的双向编码器表示(BERT)的联合模型。引入单词级别的意图特征并使用注意力机制为BERT融合外部知识。此外,由于SLU包含意图检测和槽填充2个相互关联的子任务,模型通过联合训练捕捉2个子任务间的关联性,充分运用这种关联性增强外部知识对于SLU任务的性能提升效果,并将外部知识转化为可用于特定子任务的特征信息。在ATIS和Snips 2个公开数据集上的实验结果表明,该模型句子级别的语义准确率分别为89.1%和93.3%,与BERT模型相比,分别提升了0.9和0.4个百分点,能够有效利用外部知识提升自身性能,在SLU任务中拥有比BERT更为优秀的性能表现。 展开更多
关键词 口语理解 外部知识 语言模型 意图检测 槽填充 联合训练
下载PDF
航班预定口语对话系统的设计与实现
18
作者 陈振锋 杨晓昊 +2 位作者 吴蔚澜 刘加 夏善红 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2015年第2期252-258,共7页
介绍一个航班预定口语对话系统的设计与实现,该系统允许用户通过普通话进行航班信息查询与预定.重点介绍口语对话系统中的口语语言理解.为了克服语音识别引入的识别错误导致语义理解错误的问题,提出基于词混淆网络的两阶段中文口语语言... 介绍一个航班预定口语对话系统的设计与实现,该系统允许用户通过普通话进行航班信息查询与预定.重点介绍口语对话系统中的口语语言理解.为了克服语音识别引入的识别错误导致语义理解错误的问题,提出基于词混淆网络的两阶段中文口语语言理解方法:首先从词混淆网络中选择N元文法作为分类特征,进行主题分类,并通过语义分类模型解析获取对应的语义树结构;然后利用基于规则的语义槽填充器抽取相应的语义槽属性-值.该方法是数据驱动的,训练数据的标记比较容易.实验在汉语航班预定领域进行,结果表明,在语音识别字错误率很高的情况下,该方法比传统的基于语法规则的语言理解方法更加鲁棒,在语义理解正确率方面有明显改善. 展开更多
关键词 口语对话系统 口语语言理解 语义理解 词混淆网络 对话管理
下载PDF
基于条件随机场的自然口语语义理解方法
19
作者 李成华 张世娟 +1 位作者 刘磊 江小平 《中南民族大学学报(自然科学版)》 CAS 北大核心 2017年第2期60-65,共6页
采用条件随机场技术将面向智能手机用户的自然口语语义理解分为操作任务分类和语义组块提取两个主要步骤,收集并分析了口语语料库的特征,根据归纳出的任务种类和语义组块特征规律设计了任务分类标记集和语义组块标记集;通过基于规则的... 采用条件随机场技术将面向智能手机用户的自然口语语义理解分为操作任务分类和语义组块提取两个主要步骤,收集并分析了口语语料库的特征,根据归纳出的任务种类和语义组块特征规律设计了任务分类标记集和语义组块标记集;通过基于规则的组块分析得到了中间语义表示格式,从而实现了对用户口语语义理解的目的.实验结果表明:任务分类准确率及语义组块提取平均正确率分别达到98.85%和94.53%,系统综合性能测试的准确率达到91.86%. 展开更多
关键词 人工智能 自然语言处理 口语理解 条件随机场 中间语义表示格式(IF)
下载PDF
基于词嵌入扩充的口语对话文本领域分类
20
作者 杨萌萌 黄浩 《新疆大学学报(自然科学版)》 CAS 北大核心 2016年第2期209-214,220,共7页
针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌... 针对口语对话系统领域分类任务中传统领域分类方法如SVM需要进行大量人工标注的问题,将LDA(Latent Dirichlet Allocation)模型应用于口语对话系统领域分类;针对口语对话内容少、长度短、数据稀疏等问题,在LDA模型基础上提出了基于词嵌入文本扩充的口语对话系统领域分类方法.该方法主要特点是:1)使用词嵌入方法word2vec对类似于短文本的语音识别后的口语对话文本进行语义扩充,将短文本转化为长文本,使主题模型LDA更加有效地估计口语对话文本的隐含主题;2)采用无监督的概率生成模型LDA对扩充后的口语对话文本进行建模以及领域分类,从而降低人工标注成本.实验结果表明,与直接使用LDA模型进行口语对话系统领域分类方法对比,适当扩充长度的word2vec文本扩充方法在口语对话系统领域分类中的平均准确率、平均召回率和平均F1值分别提高了26.1%、25.5%、27.2%,且该方法具有一定的鲁棒性.. 展开更多
关键词 口语对话系统 口语理解 潜在狄利克雷分布 主题模型 文本扩充
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部