摘要
价值对齐作为人工智能技术良善发展的有效手段和必经之路,旨在让大模型的能力、行为与人类的真实意图、价值观以及社会道德准则相一致。现有人工智能价值对齐的技术路径和伦理进路虽具备可行性,但存在局限与不足。价值对齐的技术路径缺乏有效性与可拓展性,受限于人类主观偏好,而弱进路价值对齐路径存在“对齐鸿沟”、价值观难以统一和静态价值观等问题,强进路价值对齐路径则存在道德无法化约为一种能力、情感计算技术的困境和多元主体对齐的复杂性等难题。交互式价值对齐路径是实现人工智能价值对齐的有效路径,赋予人工智能交互主体性是价值对齐的前提,情境化价值共识是交互式价值对齐的关键,通过人机合作和社会场景模拟来实现价值对齐。
出处
《伦理学研究》
北大核心
2024年第5期99-108,共10页
Studies in Ethics
基金
中央高校基本科研业务费专项基金项目“数字化时代身体问题研究”(2662023MYQD001)
华中农业大学研究生培养条件建设项目“《科技伦理专题》探究式教学示范课堂”(2023KC06)的阶段性成果。