-
题名CFB:金融领域大模型评估方法
- 1
-
-
作者
李毅
李浩
许骁哲
杨一凡
-
机构
山西财经大学信息学院
山西财经大学统计学院
太原理工大学机械工程学院
中南财经政法大学信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第12期3272-3287,共16页
-
基金
教育部人文社会科学研究规划基金项目(20YJA910004)
全国统计科学研究计划项目(2022LZ14)
+3 种基金
山西省基础研究计划杰青项目(202303021223010)
国家自然科学基金青年项目(72304176)
山西省留学人员科技活动择优资助重点项目(20220025)
中央引导地方科技发展资金项目(YDZJSX20231A057)。
-
文摘
随着大语言模型(LLM)在金融领域的应用潜力不断显现,评估金融大模型的性能变得尤为重要。然而,由于当下的金融评估方法评估任务单一、评测数据集覆盖面不足以及测评基准数据污染等方面的局限,大模型在金融领域的潜力尚未得到充分探索。基于此,提出了中文金融大模型评估方法CFB,构建36个数据集,涵盖24个金融任务,涉及多项问答、术语解释、文本生成、文本翻译、分类任务、语步识别、预测决策7个金融大模型测评任务,并构建了相应的测评基准。CFB提出的新思路包括:更广泛的任务和数据范围,引入了基于LLM的基准去污方法以及基于指令微调、知识检索增强和提示词工程3种方法的评估。并对包括GPT-4o、ChatGPT和Gemini在内的12个LLM进行了评估,实验结果显示,虽然LLM在信息提取和文本分析方面表现出色,但在高级推理和复杂任务方面存在困难。GPT-4o在信息提取和股票交易方面表现突出,而Gemini在文本生成和预测方面更胜一筹。经过指令微调的LLM在文本分析上有所提升,但对复杂任务提供的益处有限。
-
关键词
金融大模型
评估基准
提示词工程
知识检索增强
指令微调
-
Keywords
financial large models
evaluation benchmark
prompt engineering
knowledge retrieval enhancement
instruction fine-tuning
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于SSL-DDPM的脑电疲劳状态检测方法
- 2
-
-
作者
张麟华
郭彩萍
许骁哲
富丽贞
邢珍珍
-
机构
太原工业学院计算机工程系
山西文旅集团山投信息有限公司
中北大学软件学院
-
出处
《现代电子技术》
北大核心
2024年第21期40-45,共6页
-
基金
国家自然科学基金青年科学基金资助项目(61602427)
山西省科技厅重点研发计划(201903D121171)
山西省教育厅科技创新项目(2023L352)。
-
文摘
疲劳检测对日常生活是至关重要的,尤其对于驾驶领域。基于脑电(EEG)信号的疲劳驾驶检测已吸引了众多学者的关注,但由于高质量带标签的EEG样本稀少问题严重阻碍了疲劳检测领域的发展。因此,文中首次将自监督学习(SSL)与扩散模型(DDPM)相结合应用于EEG的疲劳检测研究中,提出一种基于SSL-DDPM的脑电疲劳状态检测方法。该方法分为预训练和下游任务两部分,预训练阶段中首先对原始信号进行DDPM扩增,然后以ResNeXt代替ResNet为骨干网络对扩增前后的EEG信号进行特征提取,最后对提取的特征进行信号重构。下游任务的网络以共享预训练网络参数为主,对扩增前后的信号进行疲劳检测。通过SEED数据集和Multi-channel数据集进行实验验证,最终分类准确率分别达到88.23%和86.14%,验证了文中疲劳状态检测方法的有效性。
-
关键词
脑电信号
疲劳检测
自监督学习
扩散模型
骨干网络
信号重构
-
Keywords
EEG signal
fatigue detection
self-supervised learning
diffusion model
backbone network
signal reconstruction
-
分类号
TN911.7-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-