期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于UniLM预训练的改进数学问答模型

下载PDF

导出

摘要自然语言处理(NLP)技术,在个性化内容推荐系统、对话式人工智能等多个领域发挥着重要作用。在NLP领域,词嵌入和长短时记忆网络(LSTM)等神经网络模型取得了显著进展,提升了自然语言处理的能力。尽管这些模型在实际应用中表现出色,但它们通常需要大量数据来进行训练,这在一定程度上限制了模型训练的效果和泛化能力。因此,研究者们一直在探索新的方法来提高模型的训练效率,同时减少对大规模数据集的依赖。研究提出了一种改进的统一预训练语言模型(UniLM),它结合了Transformer和注意力机制模型的优势,能够完成从单向到双向的多种语言预测任务。在大规模数学问答数据集的实验中,改进的模型展现出比传统模型更优的性能,准确率最高达80.56%,证明了其在自然语言处理任务中的能力。

作者林云

机构地区厦门大学嘉庚学院

出处《物联网技术》 2024年第10期120-122,125,共4页 Internet of things technologies

关键词自然语言处理自然语言生成无监督预训练有监督微调 UniLM 双向预测

分类号 TP3-0 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献9

1王超,孔祥辉.大型预训练语言模型在网络健康信息鉴别中的应用探讨[J].农业图书情报学报,2023,35(6):51-59. 被引量：8
2沈凌云,乐小虬.文本神经语义解析方法研究进展[J].数据分析与知识发现,2023,7(12):1-21. 被引量：1
3李政.基于神经网络语言模型的统计机器翻译应用分析[J].信息与电脑,2022,34(22):109-111. 被引量：1
4李沅静,叶仁玉,冷婷.基于二阶隐马尔可夫模型的中文分词在文本情感分析中的应用[J].安庆师范大学学报（自然科学版）,2023,29(3):44-48. 被引量：1
5CHEN Guanzhou,LIU Sheng,XU Jingting.Memory-boosting RNN with dynamic graph for event-based action recognition[J].Optoelectronics Letters,2023,19(10):629-634. 被引量：2
6马占海,张俊超,田光欣.电网人机对话系统短文本用户意图自动识别方法[J].电子设计工程,2023,31(17):128-131. 被引量：1
7刘斐瑜,俞卫琴.融合BERT与注意力的文本情感分析模型[J].软件导刊,2023,22(8):66-71. 被引量：1
8赵逢达,郭凡,李贤善,门旭静,王彬.ASE-ERNIE:一种基于ERNIE的中文指令动作序列生成方法[J].计算机集成制造系统,2024,30(5):1745-1753. 被引量：1
9曾江峰,刘园园,程征,段尧清.基于UniLM模型的学术文摘观点自动生成研究[J].图书情报工作,2023,67(2):131-139. 被引量：1

二级参考文献76

1张帆,甄岩,尼加提·帕尔哈提.面向电力无线专网的授权用户调制信号识别算法研究[J].科技通报,2021,37(1):65-68. 被引量：1
2严驰腾,何利力.基于BERT的双通道神经网络模型文本情感分析研究[J].智能计算机与应用,2022,12(5):16-22. 被引量：4
3常军林,吴笑伟,吴芬芬,刘磊.基于特征和隐马尔可夫模型的文本信息抽取[J].河南科技大学学报（自然科学版）,2008,29(2):55-57. 被引量：3
4奉国和,郑伟.国内中文自动分词技术研究综述[J].图书情报工作,2011,55(2):41-45. 被引量：104
5王江南,胡广朋.知识图在问答系统中的应用[J].电子设计工程,2012,20(1):27-29. 被引量：1
6陆文星,王燕飞.中文文本情感分析研究综述[J].计算机应用研究,2012,29(6):2014-2017. 被引量：31
7冯志伟.机器翻译与人工智能的平行发展[J].外国语,2018,41(6):35-48. 被引量：85
8CHENG Gaofeng,LI Xin,YAN Yonghong.Using Highway Connections to Enable Deep Small-footprint LSTM-RNNs for Speech Recognition[J].Chinese Journal of Electronics,2019,28(1):107-112. 被引量：8
9陈旻,朱凡微,吴明晖,应晶.观点挖掘综述[J].浙江大学学报（工学版）,2014,48(8):1461-1472. 被引量：4
10孔令富,高胜男,吴培良.面向室内服务的中文语音指令深层信息解析系统[J].高技术通讯,2014,24(11):1101-1107. 被引量：2

共引文献8

1潘雪峰,王超,卢智增.ChatGPT在健康谣言鉴别中的实证探讨与应用展望[J].情报探索,2024(1):45-49. 被引量：4
2奉静.基于投资者情绪的创业板股票收益率预测研究[J].科技和产业,2024,24(4):48-55.
3潘雪峰,王超.学者撰写与AI生成内容的差异性与识别研究--以图书馆健康服务研究领域为例[J].图书情报导刊,2024,9(3):54-60.
4徐文博,穆兰,吉丽君.基于ChatGPT大语言模型的食品安全教育创新研究[J].食品工业,2024,45(5):343-346.
5魏晓,陈茂清,曹小琴,许芳婷.预训练大语言模型发展对中国数字创意产业的启示[J].科技管理研究,2024,44(12):123-129.
6彭秋阳,程振涛.国产大模型App在机械工厂品管的应用试验[J].机电工程技术,2024,53(8):258-262.
7徐文博,周晓平.类ChatGPT大语言模型在护理课程考核中的应用探索——基于ChatGPT、文心一言、讯飞星火测试[J].中国医学教育技术,2024,38(5):567-571.
8穆兰,徐文博,王学通.类ChatGPT大语言模型在护理教育中应用的实证探讨与前景展望[J].卫生职业教育,2024,42(20):4-7.

1张建霞.浅谈智慧课堂下的小学数学问答思维[J].安徽教育科研,2022(20):121-122.
2罗相如.生成式AI浪潮下县级融媒体中心的创新发展路径[J].新闻世界,2024(10):26-29.
3吴穗湘,任江涛,嵇志国.NLP在高速公路信息发布内容审核中的应用[J].中国交通信息化,2024(9):117-120.
4全湛威.人工智能赋能高校文化传播的研究[J].传播与版权,2024(18):65-68.
5谭翔鹂.中职英语教学口语交际能力培养策略探析[J].海外英语,2024(18):219-221.
6刘源.融媒体时代记者型主持人的角色构建[J].卫星电视与宽带多媒体,2024(18):100-102.
7卫洁.新媒体环境下高校思政教育话语体系的转化与优化研究[J].西部广播电视,2024,45(11):45-48.

物联网技术

2024年第10期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部