期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于预训练语言模型的旅游评论文本方面级情感分析研究
1
作者 谢宇欣 肖克晶 +2 位作者 曹少中 张寒 姜丹 《现代信息科技》 2024年第7期141-145,150,共6页
为了促进旅游行业的消费和经济发展,对游客在线上平台发表的景区评论文本进行分析,深入挖掘其中的细粒度情感信息,以更好地迎合游客的偏好。在实际场景中,一个句子会涉及多个实体词,致使难以准确识别它们对应的情感属性关系;且旅游场景... 为了促进旅游行业的消费和经济发展,对游客在线上平台发表的景区评论文本进行分析,深入挖掘其中的细粒度情感信息,以更好地迎合游客的偏好。在实际场景中,一个句子会涉及多个实体词,致使难以准确识别它们对应的情感属性关系;且旅游场景下的数据集存在稀缺和样本不平衡问题。由此构建了基于深度学习和提示知识的预训练语言模型,通过构建离散提示模板联合训练两个子任务,并对数据集中的少数样本进行了数据增强处理,同时在训练阶段为损失函数设置不同的权重。实验结果显示,模型在旅游评论文本数据集和公开数据集SemEval2014_Restaruant上取得了显著效果,F1值分别达到了80.81%和83.71%,有助于旅游机构实现对每个城市景点的个性化分析。 展开更多
关键词 语言模型 提示学习 方面级情感分析 预训练模型
下载PDF
融合背景知识的异构图虚假新闻检测方法研究
2
作者 何迈 肖克晶 +2 位作者 曹少中 张寒 姜丹 《计算机科学与应用》 2024年第3期178-185,共8页
如今虚假新闻检测任务越来越受人们重视。本文考虑到不同的新闻具有涉及领域众多、隐含背景信息丰富的特点,提出利用新闻中的实体链接到领域广、信息全的维基百科,挖掘新闻潜在的背景信息与结构化三元组信息组成异构图,丰富新闻的表示... 如今虚假新闻检测任务越来越受人们重视。本文考虑到不同的新闻具有涉及领域众多、隐含背景信息丰富的特点,提出利用新闻中的实体链接到领域广、信息全的维基百科,挖掘新闻潜在的背景信息与结构化三元组信息组成异构图,丰富新闻的表示。为了学习并更新建模后新闻异构图的特征向量,在图卷积网络的基础上,提出了一个基于语义距离的图卷积网络注意力模型DGAT (Distance Graph Attention Network, DGAT)。具体的,通过赋予异构图中不同类型节点不同的变化矩阵,将不同类型的节点映射到相同的公共空间中,解决了GCN模型不能直接应用在异构图上的局限。针对本文建模的新闻异构图特点,引入了基于新闻语义距离的注意力机制,以捕获融合了外部知识后,新闻与背景知识的语义一致性,最终输入分类器中进行虚假新闻检测。在公开数据集上进行的实验表明了本文方法的有效性。 展开更多
关键词 虚假新闻检测 异构图 图卷积网络模型
下载PDF
面向中文长文本摘要混合模型方法研究
3
作者 王炜琦 姜丹 +2 位作者 曹少中 张寒 肖克晶 《北京印刷学院学报》 2024年第6期14-21,共8页
在自然语言处理领域,中文长文本摘要生成一直是自动摘要领域的难题,中文因其丰富的语法结构、多义词汇以及词序对句子含义的影响,自动摘要的难度较大。针对中文长文本摘要这一难题,提出了一种混合式摘要模型,首先对文本进行向量化,然后... 在自然语言处理领域,中文长文本摘要生成一直是自动摘要领域的难题,中文因其丰富的语法结构、多义词汇以及词序对句子含义的影响,自动摘要的难度较大。针对中文长文本摘要这一难题,提出了一种混合式摘要模型,首先对文本进行向量化,然后利用抽取式摘要模型进行信息提取,最后利用生成式摘要模型进行文章摘要的生成,其中采用更适配中文语境的词表和分词器,提升摘要句准确率。实验结果表明,抽取—生成式混合模型在针对中文长文本摘要时表现出色,生成的摘要文本更加流畅、连贯,具有更好的可读性和理解性。 展开更多
关键词 中文长文本摘要 混合模型 BERT DGCNN T5-PEGASUS
下载PDF
基于Transformer的多语种字音转换
4
作者 张亚停 张寒 +2 位作者 曹少中 姜丹 肖克晶 《计算机科学与应用》 2023年第3期510-517,共8页
字音转换(Grapheme-to-Phoneme, G2P)是语音合成前端的重要部分,影响着语音合成的质量。现如今,大多数的字音转换的研究是针对于单一语种的,而在实际应用中,单一语种合成的语音远没有多语种的实用性高。因此,本文利用Transformer架构研... 字音转换(Grapheme-to-Phoneme, G2P)是语音合成前端的重要部分,影响着语音合成的质量。现如今,大多数的字音转换的研究是针对于单一语种的,而在实际应用中,单一语种合成的语音远没有多语种的实用性高。因此,本文利用Transformer架构研究了在文本交叉混合条件下多语种(英、日、韩)的字音转换,使用音素错误率(Phoneme Error Rate, PER)和单词错误率(Word Error Rate, WER)作为评价指标。英文在基于美国英语的CMUDict数据集进行评估,韩语和日语则是先对SIGMORPHON 2021字音转换任务上的韩语及日语数据集进行了数据扩充,并在扩充后的数据集上进行评估。实验结果表明,在文本交叉混合条件下,基于Transformer架构的英、日、韩字音转换在音素错误率和单词错误率方面与基于Transformer架构的英、日、韩三个语言的单一语种相比都大大降低了。 展开更多
关键词 字音转换 TRANSFORMER 多语种 交叉混合
下载PDF
基于BP神经网络的食品安全抽检数据挖掘 被引量:21
5
作者 王星云 左敏 +1 位作者 肖克晶 刘婷 《食品科学技术学报》 CAS 2016年第6期85-90,共6页
数据挖掘技术在食品安全领域拥有巨大的应用价值和潜力。通过分析逆向传播(BP)神经网络算法,说明使用该方法的可行性和优越性。以抽检数据为对象,阐述了数据预处理过程,设计并实现了数据挖掘实验。最后利用挖掘结果进行食品检验结论预测... 数据挖掘技术在食品安全领域拥有巨大的应用价值和潜力。通过分析逆向传播(BP)神经网络算法,说明使用该方法的可行性和优越性。以抽检数据为对象,阐述了数据预处理过程,设计并实现了数据挖掘实验。最后利用挖掘结果进行食品检验结论预测,验证了方法的实用价值和指导意义。实验表明,基于BP神经网络的数据挖掘方法具有良好的过程健壮性和较高的结果准确性。通过预判不合格食品的出现,可以指导实际食品安全抽检工作,从而杜绝食品安全问题的发生。 展开更多
关键词 数据挖掘 食品安全 抽检数据 检验结论 BP神经网络
下载PDF
改进的关联规则在食品安全预警上的应用 被引量:4
6
作者 肖克晶 左敏 +1 位作者 王星云 刘婷 《食品科学技术学报》 CAS 2017年第2期89-94,共6页
为将海量的食品检测数据有效地应用于食品安全预警,首先分析了食品检测数据的特点,以及传统的Apriori算法在挖掘食品检测数据上的不足,进而提出过滤算法,并将其作为Apriori算法的前置组件对算法进行改进,然后建立了食品安全预警模型,最... 为将海量的食品检测数据有效地应用于食品安全预警,首先分析了食品检测数据的特点,以及传统的Apriori算法在挖掘食品检测数据上的不足,进而提出过滤算法,并将其作为Apriori算法的前置组件对算法进行改进,然后建立了食品安全预警模型,最后将实际的食用油检测数据用改进后的算法进行挖掘,发现其存在的潜在安全隐患进而做出风险预警。通过实验对比Apriori算法,发现改进后的算法摒弃了大量的伪关联规则,能有效提高食品安全预警的效率和准确度,具有十分重要的实际意义。 展开更多
关键词 关联规则 频繁项集 稀疏数据 过滤算法
下载PDF
视觉问答研究综述 被引量:12
7
作者 包希港 周春来 +1 位作者 肖克晶 覃飙 《软件学报》 EI CSCD 北大核心 2021年第8期2522-2544,共23页
视觉问答是计算机视觉领域和自然语言处理领域的交叉方向,近年来受到了广泛关注.在视觉问答任务中,算法需要回答基于特定图片(或视频)的问题.自2014年第一个视觉问答数据集发布以来,若干大规模数据集在近5年内被陆续发布,并有大量算法... 视觉问答是计算机视觉领域和自然语言处理领域的交叉方向,近年来受到了广泛关注.在视觉问答任务中,算法需要回答基于特定图片(或视频)的问题.自2014年第一个视觉问答数据集发布以来,若干大规模数据集在近5年内被陆续发布,并有大量算法在此基础上被提出.已有的综述性研究重点针对视觉问答任务的发展进行了总结,但近年来,有研究发现,视觉问答模型强烈依赖语言偏见和数据集的分布,特别是自VQA-CP数据集发布以来,许多模型的效果大幅度下降.主要详细介绍近年来提出的算法以及发布的数据集,特别是讨论了算法在加强鲁棒性方面的研究.对视觉问答任务的算法进行分类总结,介绍了其动机、细节以及局限性.最后讨论了视觉问答任务的挑战及展望. 展开更多
关键词 视觉问答 交叉方向 语言偏见 数据集分布 鲁棒性
下载PDF
基于PFM改进模型对中国非上市银行的信用风险评估 被引量:5
8
作者 陈俐伶 蒋静好 肖克晶 《中国市场》 2015年第29期211-216,共6页
在介绍基本的PFM模型的基础上,根据中国的实际情况对模型进行调整和完善,并选择深、沪上市的商业银行和11家非上市银行作为研究对象,基于2013年样本银行的财务数据和股票交易数据,检验和实证该模型在中国非上市银行信用风险的适用性。... 在介绍基本的PFM模型的基础上,根据中国的实际情况对模型进行调整和完善,并选择深、沪上市的商业银行和11家非上市银行作为研究对象,基于2013年样本银行的财务数据和股票交易数据,检验和实证该模型在中国非上市银行信用风险的适用性。实证结果表明改进的PFM模型对中国非上市银行的信用评估具有一定的预测能力。 展开更多
关键词 PFM 信用风险 非上市银行
下载PDF
基于语义的汉语普通话电子喉语音转换增强 被引量:1
9
作者 钱兆鹏 肖克晶 +1 位作者 刘蝉 孙悦 《电子学报》 EI CAS CSCD 北大核心 2020年第5期840-845,共6页
电子喉语音存在基频单一、发声机械、辐射噪声大等多种缺陷,这严重影响了电子喉语音可懂度和自然度,特别是对汉语普通话之类的声调语言,问题尤其严重.汉语普通话电子喉语音识别存在辅音混淆的问题并且识别结果没有声调,因此本文在识别... 电子喉语音存在基频单一、发声机械、辐射噪声大等多种缺陷,这严重影响了电子喉语音可懂度和自然度,特别是对汉语普通话之类的声调语言,问题尤其严重.汉语普通话电子喉语音识别存在辅音混淆的问题并且识别结果没有声调,因此本文在识别结果的基础之上设计了拼音拼写修正器和声调标注工具,再结合基于Tacotron-2的TTS实现了电子喉语音向正常语音的转换.客观评价实验结果表明,拼音拼写修正器可以提高拼音准确率,声调标注在有上下文的语义环境中具有较高准确率.主观听力测试结果表明,本文所提方法在不同语言水平上提高了汉语普通话电子喉语音的可懂度和自然度.研究结果表明,本文设计的方法可以将不带声调的电子喉语音转换为正常语音,相比于传统语音转换方法具有更高的性能. 展开更多
关键词 电子喉语音 拼音修正 拼音声调标注 语音转换
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部