期刊文献+

生成式人工智能内容安全风险分析与安全机制探讨 被引量:1

下载PDF
导出
摘要 生成式人工智能对人类生活方式、工作方式乃至认知方式产生了深远影响。未来,AIGC将成为内容生产的主力军之一。通过回顾生成式人工智能大模型的发展和应用情况,总结了当前生成式人工智能面临的法律风险、道德风险、歧视和偏见、虚假信息和模型自身安全风险等相关安全风险,分析了各类安全风险产生的原因,并阐述了生成式人工智能内容安全机制的必要性和重要性。生成式人工智能内容安全机制的常见方法包括基于人类反馈的强化学习、基于AI反馈的强化学习、有监督的安全微调、专家对抗、遗忘学习、敏感信息过滤、监督监管策略等。安全无小事,内容安全机制可以为生成式人工智能的规模化安全应用保驾护航。
作者 张庆国
出处 《人工智能》 2024年第2期79-86,共8页 Artificial Intelligence View
基金 中国科技期刊卓越行动计划(WKZB1911BJM501173/02)。
  • 相关文献

同被引文献8

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部