针对民航陆空通话领域语料难以获取、实体分布不均,以及意图信息提取中实体规范不足且准确率有待提升等问题,为了更好地提取陆空通话意图信息,提出一种融合本体的基于双向转换编码器(bidirectional encoder representations from transf...针对民航陆空通话领域语料难以获取、实体分布不均,以及意图信息提取中实体规范不足且准确率有待提升等问题,为了更好地提取陆空通话意图信息,提出一种融合本体的基于双向转换编码器(bidirectional encoder representations from transformers,BERT)与生成对抗网络(generative adversarial network,GAN)的陆空通话意图信息挖掘方法,并引入航班池信息对提取的部分信息进行校验修正,形成空中交通管制(air traffic control,ATC)系统可理解的结构化信息。首先,使用改进的GAN模型进行陆空通话智能文本生成,可有效进行数据增强,平衡各类实体信息分布并扩充数据集;然后,根据欧洲单一天空空中交通管理项目定义的本体规则进行意图的分类与标注;之后,通过BERT预训练模型生成字向量并解决一词多义问题,利用双向长短时记忆(bidirectional long short-term memory,BiLSTM)网络双向编码提取上下句语义特征,同时将该语义特征送入条件随机场(conditional random field,CRF)模型进行推理预测,学习标签的依赖关系并加以约束,以获取全局最优结果;最后,根据编辑距离(edit distance,ED)算法进行意图信息合理性校验与修正。对比实验结果表明,所提方法的宏平均F_(1)值达到了98.75%,在民航陆空通话数据集上的意图挖掘性能优于其他主流模型,为其加入数字化进程奠定了基础。展开更多
目的探究嗓音障碍患者的元音声学特征,以及普通话体系下的元音空间面积(vowel space area,VSA)合理的施测方式和语料。方法招募年龄和性别相匹配的嗓音障碍患者和正常健康对照组受试者各20例,在不同语料(单个元音/a/、/i/、/u/、/o/、/e...目的探究嗓音障碍患者的元音声学特征,以及普通话体系下的元音空间面积(vowel space area,VSA)合理的施测方式和语料。方法招募年龄和性别相匹配的嗓音障碍患者和正常健康对照组受试者各20例,在不同语料(单个元音/a/、/i/、/u/、/o/、/e/和长句)以及不同元音顶点个数(3个、4个、5个)下的VSA进行差异分析。结果嗓音障碍组与正常组之间在单元音和长句语料下VSA都有极显著差异,但两种语料类型间VSA差异不显著,两种语料均可用于VSA的测量。4个元音顶点与3个元音顶点及5个元音顶点下的VSA差异极显著,选择5个元音用于普通话体系下VSA的测量更加合适。结论嗓音障碍患者的元音发音较正常人清晰度下降。在普通话体系下采用5个元音顶点测量VSA相对较精准,更能测得口腔的运动能力。单个元音和连续语音两种语料均适用于VSA的测量。展开更多
文摘针对民航陆空通话领域语料难以获取、实体分布不均,以及意图信息提取中实体规范不足且准确率有待提升等问题,为了更好地提取陆空通话意图信息,提出一种融合本体的基于双向转换编码器(bidirectional encoder representations from transformers,BERT)与生成对抗网络(generative adversarial network,GAN)的陆空通话意图信息挖掘方法,并引入航班池信息对提取的部分信息进行校验修正,形成空中交通管制(air traffic control,ATC)系统可理解的结构化信息。首先,使用改进的GAN模型进行陆空通话智能文本生成,可有效进行数据增强,平衡各类实体信息分布并扩充数据集;然后,根据欧洲单一天空空中交通管理项目定义的本体规则进行意图的分类与标注;之后,通过BERT预训练模型生成字向量并解决一词多义问题,利用双向长短时记忆(bidirectional long short-term memory,BiLSTM)网络双向编码提取上下句语义特征,同时将该语义特征送入条件随机场(conditional random field,CRF)模型进行推理预测,学习标签的依赖关系并加以约束,以获取全局最优结果;最后,根据编辑距离(edit distance,ED)算法进行意图信息合理性校验与修正。对比实验结果表明,所提方法的宏平均F_(1)值达到了98.75%,在民航陆空通话数据集上的意图挖掘性能优于其他主流模型,为其加入数字化进程奠定了基础。
文摘目的探究嗓音障碍患者的元音声学特征,以及普通话体系下的元音空间面积(vowel space area,VSA)合理的施测方式和语料。方法招募年龄和性别相匹配的嗓音障碍患者和正常健康对照组受试者各20例,在不同语料(单个元音/a/、/i/、/u/、/o/、/e/和长句)以及不同元音顶点个数(3个、4个、5个)下的VSA进行差异分析。结果嗓音障碍组与正常组之间在单元音和长句语料下VSA都有极显著差异,但两种语料类型间VSA差异不显著,两种语料均可用于VSA的测量。4个元音顶点与3个元音顶点及5个元音顶点下的VSA差异极显著,选择5个元音用于普通话体系下VSA的测量更加合适。结论嗓音障碍患者的元音发音较正常人清晰度下降。在普通话体系下采用5个元音顶点测量VSA相对较精准,更能测得口腔的运动能力。单个元音和连续语音两种语料均适用于VSA的测量。