期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

潘多拉的魔盒:人工智能训练数据的来源、使用与治理——面向100位AI开发者的扎根研究被引量：13

原文传递

导出

摘要厘清当前阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态是进一步探讨AI训练数据治理的基础与前提。本研究在扎根理论的指导下,以滚雪球抽样法获得的100位AI开发者为研究对象,通过半结构化访谈结合非正式沟通、现实观察、内部与公开资料搜集等方式获取研究数据并提炼概念与范畴,勾勒出现阶段人工智能训练数据在AI开发者端口的来源渠道与使用情态,主要结论包括:(1)AI开发者群体将经由自行采集、公开数据、爬取数据、第三方购买与模拟产生等不同渠道获取的人工智能训练数据用于数据标注、算法验证等常规用途,但存在猎奇分享、窥探心理等异化用途;(2)AI开发者群体对数据使用边界的心理认知主要包括数据泄露/冒用作假、隐私贩卖/侥幸心理、算法偏见/个人主观、干扰社会事务及心理伤害;(3)个人道德、协议约束、法律担忧与媒介监督等因素警示AI开发者对于数据边界问题保持清醒与冷静;(4)将法律、监管、媒体等哲社制衡方案嵌入到AI开发者的数据来源渠道及操作使用层面,进而寻求创新与伦理间的平衡已成为AI数据治理的关键。

作者高泽晋

机构地区清华大学新闻与传播学院

出处《新闻记者》 CSSCI 北大核心 2022年第1期86-96,共11页 Shanghai Journalism Review

关键词人工智能训练数据数据来源使用情态数据治理

分类号 G201 [文化科学—传播学]

引文网络
相关文献

参考文献21

1蔡曙山.生命进化与人工智能——对生命3.0的质疑[J].上海师范大学学报（哲学社会科学版）,2020,49(3):83-99. 被引量：10
2曹建峰,方龄曼.欧盟人工智能伦理与治理的路径及启示[J].人工智能,2019(4):39-47. 被引量：33
3程金福.当代中国媒介权力与政治权力的结构变迁——一种政治社会学的分析[J].新闻大学,2010(3):22-29. 被引量：13
4陈力丹.“第四权力”[J].新闻传播,2003(3):13-13. 被引量：17
5费小冬.扎根理论研究方法论：要素、研究程序和评判标准[J].公共行政评论,2008,1(3):23-43. 被引量：342
6高奇琦,张结斌.社会补偿与个人适应:人工智能时代失业问题的两种解决[J].江西社会科学,2017,37(10):25-34. 被引量：17
7高泽晋.创新扩散视角下对百度Apollo智能驾驶开放平台的观察与研究[J].中国科技论坛,2020(11):147-152. 被引量：3
8郭环.社交媒体时代的美国政治投票解析[J].青年记者,2020(26):31-32. 被引量：2
9郭珂静,张悦晨.“赛托邦”与“赛维坦”:人工智能的媒介呈现——以人民日报与纽约时报的报道为例[J].青年记者,2020(14):33-34. 被引量：4
10无.《中华人民共和国数据安全法》将于9月1日起施行[J].国家图书馆学刊,2021,30(4):63-63. 被引量：5

二级参考文献151

1芮必峰.人际传播:表演的艺术——欧文·戈夫曼的传播思想[J].安徽大学学报（哲学社会科学版）,2004,28(4):64-70. 被引量：88
2童天湘.人工智能与第N代计算机[J].哲学研究,1985(5):12-20. 被引量：9
3钱学森.现代科学技术与法学研究和法制建设[J].政法论坛,1985,3(3):4-9. 被引量：25
4张昆.毛泽东党报理论述要[J].毛泽东思想研究,1991(1):1-5. 被引量：7
5徐晓林,周立新.数字治理在城市政府善治中的体系构建[J].管理世界,2004,20(11):140-141. 被引量：99
6蔡曙山.论符号学三分法对语言哲学和语言逻辑的影响[J].北京大学学报（哲学社会科学版）,2006,43(3):50-58. 被引量：12
7田金萍.人工智能发展综述[J].科技广场,2007(1):230-232. 被引量：28
8蔡曙山.关于哲学、心理学和认知科学的12个问题——与约翰·塞尔教授的对话[J].学术界,2007(3):7-17. 被引量：33
9赵文词涂肇庆林益民.五代美国社会学者对中国国家与社会关系的研究[A].涂肇庆,林益民.改革开放与中国社会[C].香港:牛津大学出版社,1999..
10李咏.舆论监督的法理问题[A].见:展江.中国社会转型的守望者--新世纪新闻舆论监督的语境与实践[C].北京:中国海关出版社.2002.

共引文献767

1寇枫阳.人工智能与法学的博弈和共生:现状与冲突、回应与未来[J].华中师范大学研究生学报,2019(4):46-50. 被引量：1
2陈兵.通用人工智能创新发展带来的风险挑战及其法治应对[J].知识产权,2023(8):53-73. 被引量：15
3辛如镜,王皓.职教本科学生专业志趣成长机制的扎根分析[J].职业教育,2023(30):12-18.
4马文婷.智能时代传统媒体面临的机遇与挑战[J].新闻传播,2021(24):13-15.
5王益君,董韵美.公众对人工智能的认知与情感态度——以ChatGPT为例[J].知识管理论坛,2024(1):16-29.
6杨学敏,孔楚利,连雨璐.公共数据治理中的隐私风险应对——基于“认知-技术-治理”三重维度[J].数字治理评论,2023(1):105-120. 被引量：1
7王田,周达,谢志勇,刘坚.小学生数学建模能力结构模型的建构研究[J].数学教育学报,2023,32(6):72-80. 被引量：2
8李天宇,陆林,张晓瑶.旅游驱动乡村社会重构的特征与机制研究——以湖州顾渚村为例[J].中国生态旅游,2021(3):332-348. 被引量：9
9顾国达,马文景.人工智能综合发展指数的构建及应用[J].数量经济技术经济研究,2021,38(1):117-134. 被引量：36
10邓建鹏,庞博.综合立法和差异化规制:个人生物识别信息保护研究[J].私法,2022(1):121-140.

同被引文献286

1叶韦明,侯忻妤.亲密关系的麦当劳化与游戏化:情感学习社群的网络民族志研究[J].浙江学刊,2021(3):143-152. 被引量：8
2刘宪权.生成式人工智能对数据法益刑法保护体系的影响[J].中国刑事法杂志,2023(4):20-34. 被引量：14
3申卫星.论数据产权制度的层级性:“三三制”数据确权法[J].中国法学,2023(4):26-48. 被引量：90
4王禄生.ChatGPT类技术:法律人工智能的改进者还是颠覆者?[J].政法论坛,2023,41(4):49-62. 被引量：26
5支振锋.生成式人工智能大模型的信息内容治理[J].政法论坛,2023,41(4):34-48. 被引量：85
6李爱君.训练数据主体权益保护的新型数据财产权构建[J].政法论丛,2023(6):73-85. 被引量：8
7沙垚,李倩楠.重建在地团结——基于中部某贫困村乡村直播的田野调查[J].新闻大学,2022(2):84-96. 被引量：17
8胡凌.生成式人工智能知识产权侵权的司法考量[J].数字法治,2023(5):20-25. 被引量：9
9王利明.论数据来源者权利[J].法制与社会发展,2023,29(6):36-57. 被引量：38
10徐翔,董洁芸.社交网络内容生产中用户“信息茧房”的情感偏向研究[J].全球传媒学刊,2022,9(4):78-99. 被引量：10

引证文献13

1李森.风险防范视阈下生成式人工智能数据安全的治理路径——以GPT类模型为例[J].西藏民族大学学报（哲学社会科学版）,2023,44(6):139-145. 被引量：2
2姚佳.人工智能的训练数据制度——以“智能涌现”为观察视角[J].贵州社会科学,2024(2):51-57. 被引量：3
3《国际新闻界》传播学年度课题组.2022年中国的传播学研究[J].国际新闻界,2023,45(1):25-49. 被引量：10
4王競一,狄心悦,张洪忠.2022年智能传播研究综述[J].教育传媒研究,2023(1):20-22. 被引量：2
5刘霜,张潇月.生成式人工智能数据风险的法律保护与规制研究——以ChatGPT潜在数据风险为例[J].贵州大学学报（社会科学版）,2023,41(5):87-97. 被引量：18
6欧阳林洁,张永红.生成式人工智能应用的意识形态风险:命题由来、生成机制与治理进路[J].学术探索,2023(11):7-16. 被引量：5
7王昀,李芊芊.人机交流发展下数字亲密关系的社会争议与研究前景[J].青年记者,2024(1):60-64. 被引量：1
8田鑫妍.生成式人工智能的政治经济学研究[J].南方论刊,2024(3):26-29.
9时诚.通用人工智能训练数据的权利配置——以ChatGPT类大模型为例[J].湖北大学学报（哲学社会科学版）,2024,51(4):132-142. 被引量：1
10罗明东,周安平.人工智能学习中的出版者权益保护路径探究[J].中国版权,2024(3):88-103.

二级引证文献41

1戴明瑞,陈功.变革、挑战、发展:ChatGPT影响新闻生产的三重维度[J].新媒体研究,2024,10(4):7-11.
2葛孟玲."传播学概论"课程教学改革探索[J].科教导刊,2023(31):145-147.
3任吴炯.智能传播技术在主流媒体重大主题宣传中的应用分析[J].现代视听,2023(2):14-19.
4王婷.论媒介的“意义邀约”:从经典阅读探讨“界面”问题[J].教育传媒研究,2023(3):42-46.
5胡玉.城市纪录片与城市空间的意义互构——以《城市24小时》为例[J].科技传播,2023,15(13):92-94.
6张洛嘉.围观、认同、沉浸:不同情绪传播过程中游戏行为的探究[J].新闻研究导刊,2023,14(13):4-6.
7许中缘,郑煌杰.ChatGPT类应用风险的治理误区及其修正——从“重构式规制”到“阶段性治理”[J].河南社会科学,2023,31(10):50-62. 被引量：7
8张洪忠,王彦博,任吴炯,刘绍强.乌合之众的超级节点?AI大模型使用的人机网络结构分析[J].新闻界,2023(10):12-19. 被引量：7
9张爱军,杨程曦.可供、可及、可见:ChatGPT赋能下的无障碍视听传播前景展望[J].泰山学院学报,2023,45(5):127-136. 被引量：1
10阎晋虎,于晓梅,张业安,孙浩.人机交互情景下的体育健康传播:受众风险与疏解路径[J].广州体育学院学报,2023,43(4):107-114. 被引量：2

1吕滨卓,林虹男.观察类慢综艺节目的叙事策略——以《我家那闺女》为例[J].传媒论坛,2021,4(15):64-65. 被引量：1
2赵川.大象安全套：打造“难以启齿”的品牌文化[J].销售与市场,2020,0(2):26-26.
3张岳.试论感恩教育在小学德育中的价值与实施[J].小学生（多元智能大王）,2021(10):30-30.
4杨洁.人物访谈类节目的场景转变——以《仅三天可见》为例[J].卫星电视与宽带多媒体,2021(23):149-150.
5杨克.沂蒙精神的概念模型:沂蒙老区百岁老人社会记忆的扎根研究[J].理论学刊,2021(6):32-41. 被引量：6
6史支焱.大众媒介法治报道的双面性影响及规制探究[J].上海广播电视研究,2021(4):60-67.
7蓝天.对真人秀节目中受众窥私心理的探析[J].西部广播电视,2020,41(4):121-122. 被引量：3
8倪海波.智造“顶天立地”的机器人--记东南大学电气仪器控制学部主任宋爱国[J].科学中国人,2021(30):16-21.
9唐蓉,陈小菊,罗慧,张丽梅.护理人员死亡应对能力现状及影响因素研究[J].循证护理,2021,7(17):2336-2341. 被引量：8
10陈华.小学数学教学中学生逻辑思维能力的培养探究[J].新智慧,2021(30):126-128.

新闻记者

2022年第1期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部