In the diverse array of work investigating the nature of human values from psychology, philosophy and social sciences, there is a clear consensus that values guide behaviour. More recently, a recognition that values provide a means to engineer ethical AI has emerged. Indeed, Stuart Russell proposed shifting AI's focus away from simply ``intelligence'' towards intelligence ``provably aligned with human values''. This challenge -- the value alignment problem -- with others including an AI's learning of human values, aggregating individual values to groups, and designing computational mechanisms to reason over values, has energised a sustained research effort. Despite this, no formal, computational definition of values has yet been proposed. We address this through a formal conceptual framework rooted in the social sciences, that provides a foundation for the systematic, integrated and interdisciplinary investigation into how human values can support designing ethical AI.


翻译:在心理学、哲学和社会科学对人类价值观本质的广泛研究中,一个明确的共识是:价值观指导行为。最近,人们逐渐认识到价值观为构建符合伦理的人工智能提供了一种途径。事实上,斯图尔特·罗素曾提出,应将人工智能的关注点从单纯的“智能”转向“可证明与人类价值观一致”的智能。这一挑战——即价值对齐问题——连同其他问题,包括人工智能对人类价值观的学习、将个体价值观聚合为群体价值观,以及设计计算机制以对价值观进行推理,已经推动了一项持续的研究努力。尽管如此,目前尚未提出一个形式化的、可计算的价值定义。我们通过一个植根于社会科学的形式化概念框架来解决这一问题,该框架为系统化、集成化和跨学科地研究人类价值观如何支持设计符合伦理的人工智能奠定了基础。

0
下载
关闭预览

相关内容

《在单智能体与多智能体AI系统中融入人类合理性》100页
大语言模型价值观对齐研究与展望
专知会员服务
37+阅读 · 2024年3月19日
人工智能伦理计算
专知会员服务
38+阅读 · 2023年10月13日
哈工大秦兵教授 | 大语言模型之人类价值观对齐
专知会员服务
62+阅读 · 2023年8月4日
联合国教科文组织发布《人工智能伦理建议书》
专知会员服务
51+阅读 · 2021年12月7日
专知会员服务
43+阅读 · 2021年9月28日
专知会员服务
63+阅读 · 2021年7月5日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
最新《可解释人工智能》概述,50页ppt
专知
12+阅读 · 2021年3月17日
情感计算综述
人工智能学家
34+阅读 · 2019年4月6日
人工智能的现状与未来(附PPT)
人工智能学家
76+阅读 · 2019年3月27日
类脑计算的前沿论文,看我们推荐的这7篇
人工智能前沿讲习班
21+阅读 · 2019年1月7日
【混合智能】人机混合智能的哲学思考
产业智能官
12+阅读 · 2018年10月28日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
VIP会员
相关VIP内容
《在单智能体与多智能体AI系统中融入人类合理性》100页
大语言模型价值观对齐研究与展望
专知会员服务
37+阅读 · 2024年3月19日
人工智能伦理计算
专知会员服务
38+阅读 · 2023年10月13日
哈工大秦兵教授 | 大语言模型之人类价值观对齐
专知会员服务
62+阅读 · 2023年8月4日
联合国教科文组织发布《人工智能伦理建议书》
专知会员服务
51+阅读 · 2021年12月7日
专知会员服务
43+阅读 · 2021年9月28日
专知会员服务
63+阅读 · 2021年7月5日
相关资讯
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
最新《可解释人工智能》概述,50页ppt
专知
12+阅读 · 2021年3月17日
情感计算综述
人工智能学家
34+阅读 · 2019年4月6日
人工智能的现状与未来(附PPT)
人工智能学家
76+阅读 · 2019年3月27日
类脑计算的前沿论文,看我们推荐的这7篇
人工智能前沿讲习班
21+阅读 · 2019年1月7日
【混合智能】人机混合智能的哲学思考
产业智能官
12+阅读 · 2018年10月28日
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员