人工智能价值对齐的路径探析

An Analytical Exploration of Pathways for Value Alignment in Artificial Intelligence

下载PDF

导出

摘要价值对齐作为人工智能技术良善发展的有效手段和必经之路,旨在让大模型的能力、行为与人类的真实意图、价值观以及社会道德准则相一致。现有人工智能价值对齐的技术路径和伦理进路虽具备可行性,但存在局限与不足。价值对齐的技术路径缺乏有效性与可拓展性,受限于人类主观偏好,而弱进路价值对齐路径存在“对齐鸿沟”、价值观难以统一和静态价值观等问题,强进路价值对齐路径则存在道德无法化约为一种能力、情感计算技术的困境和多元主体对齐的复杂性等难题。交互式价值对齐路径是实现人工智能价值对齐的有效路径,赋予人工智能交互主体性是价值对齐的前提,情境化价值共识是交互式价值对齐的关键,通过人机合作和社会场景模拟来实现价值对齐。

作者李思雯 Li Siwen

机构地区华中农业大学马克思主义学院长沙新一代人工智能伦理治理与公共政策实验室

出处《伦理学研究》北大核心 2024年第5期99-108,共10页 Studies in Ethics

基金中央高校基本科研业务费专项基金项目“数字化时代身体问题研究”(2662023MYQD001) 华中农业大学研究生培养条件建设项目“《科技伦理专题》探究式教学示范课堂”(2023KC06)的阶段性成果。

关键词人工智能人机交互关系交互式价值对齐

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

1魏昕昕.从“同感”问题说开去——论梅洛-庞蒂的交互主体性诗学[J].湖北美术学院学报,2024(3):66-72.
2刘炜,姚诗琦,谢艺.风景园林工程与技术课程实景教学改革与实践——以景观照明章节教学为例[J].灯与照明,2024,48(3):56-60.
3刘珍珍.利用多媒体技术提升高中英语教学效果的探索与实践[J].科研成果与传播,2024(4):0047-0049.
4杨和平.“写”的课堂教学创意设计[J].语文教学通讯,2024(38):22-25.
5徐衍会,陈浩维,胡俊杰.光伏电解水制氢典型工况及质子交换膜电解堆性能衰减研究[J].电工技术学报,2024,39(19):6228-6243.
6王炜,方健霖.论但明伦《聊斋志异》评点中对“奇”的阐释[J].哈尔滨工业大学学报（社会科学版）,2024,26(5):85-91.
7樊拥军,任梓铭.县级融媒体中心嵌入智慧社区的集成服务创新路向[J].当代传播,2024(4):51-54.
8严峻.高等医科院校护理专业英语教学改革现状及对策探析[J].英语教师,2024,24(19):61-63.
9金溪,穆延.暴雨内涝下城市路网抗涝韧性评估[J].交通运输系统工程与信息,2024,24(5):226-236.
10姜晨曦.单边人权制裁的合法性审视——以信息和通信技术产业为视角[J].人权研究（辑刊）,2023(2):182-206.

伦理学研究

2024年第5期

浏览历史

内容加载中请稍等...

人工智能价值对齐的路径探析

相关作者

相关机构

相关主题

浏览历史