1
|
大语言模型“数据为王”:训练数据的价值、迷思与数字传播的未来挑战 |
胡泳
刘纯懿
|
《西北师大学报(社会科学版)》
CSSCI
北大核心
|
2024 |
6
|
|
2
|
基于增强优化预训练语言模型的电力数据实体识别方法 |
田雪涵
董坤
赵剑锋
郭希瑞
|
《智慧电力》
北大核心
|
2024 |
2
|
|
3
|
基于生成式预训练语言模型的学者画像构建研究 |
柳涛
丁陈君
姜恩波
许睿
陈方
|
《数字图书馆论坛》
CSSCI
|
2024 |
0 |
|
4
|
面向真实世界的知识挖掘与知识图谱补全研究(四):真实世界数据标注平台搭建及基于预训练语言模型的自动化抽取方法探索 |
阎思宇
谭杰骏
朱海锋
黄桥
王诗淳
马文昊
石涵予
王永博
任相颖
胡文斌
靳英辉
|
《医学新知》
CAS
|
2024 |
0 |
|
5
|
基于预训练语言模型的歌词生成方法 |
范菁
张珣
刘祥根
|
《西南民族大学学报(自然科学版)》
CAS
|
2024 |
0 |
|
6
|
结合数据增强方法的藏文预训练语言模型 |
色差甲
班马宝
才让加
柔特
|
《中文信息学报》
CSCD
北大核心
|
2024 |
0 |
|
7
|
生成式大模型训练数据的法律规制——以比例原则为分析视角 |
钟海燕
黄运康
|
《信息安全与通信保密》
|
2024 |
0 |
|
8
|
基于电力设备大数据的预训练语言模型构建和文本语义分析 |
孙振东
梁誉锵
曹仲南
石和熹
王怡
|
《中国科技期刊数据库 工业A》
|
2024 |
0 |
|
9
|
预训练大语言模型发展对中国数字创意产业的启示 |
魏晓
陈茂清
曹小琴
许芳婷
|
《科技管理研究》
CSSCI
|
2024 |
0 |
|
10
|
Lacmia:抗混淆的多民族语言生成式摘要模型 |
翁彧
罗皓予
刘征
超木日力格
刘轩
董俊
|
《中文信息学报》
CSCD
北大核心
|
2024 |
0 |
|
11
|
融合TF-IDF算法和预训练模型的文本数据增强 |
胡荣笙
车文刚
张龙
戴庞达
|
《计算机仿真》
|
2024 |
1
|
|
12
|
基于序列到序列预训练语言模型的楹联自动生成算法 |
乔露
|
《微型电脑应用》
|
2022 |
1
|
|
13
|
基于预训练模型的受控文本生成研究综述 |
周强伟
施水才
王洪俊
|
《软件导刊》
|
2024 |
1
|
|
14
|
大语言模型数据隐私保护的难点与探索 |
施敏
杨海军
|
《大数据》
|
2024 |
2
|
|
15
|
基于多模态大语言模型的攻击性模因解释生成方法 |
林萌
戴程威
郭涛
|
《计算机研究与发展》
EI
CSCD
北大核心
|
2024 |
1
|
|
16
|
以ChatGPT为代表的自然语言AI在数据库内容检索与生成中的应用——以全国报刊索引为例 |
戴梦菲
|
《情报探索》
|
2024 |
1
|
|
17
|
基于对抗训练策略的语言模型数据增强技术 |
张一珂
张鹏远
颜永红
|
《自动化学报》
EI
CSCD
北大核心
|
2018 |
19
|
|
18
|
预训练语言模型在科学类QA方向的探索研究——基于ARC数据集 |
夏秀坤
张曼琳
|
《河北软件职业技术学院学报》
|
2022 |
0 |
|
19
|
一种基于预训练模型掩码Aspect术语的数据增强方法 |
石晓瑞
|
《信息技术与信息化》
|
2024 |
0 |
|
20
|
基于预训练语言模型和标签指导的文本复述生成方法 |
梁佳音
谢志鹏
|
《计算机科学》
CSCD
北大核心
|
2023 |
0 |
|