A computational framework for human values - 专知论文

会员服务 ·

0

人类价值 · 计算框架 · 形式化 · 设计 · 人工智能 ·

A computational framework for human values

翻译：人类价值观的计算框架

Nardine Osman,Mark d'Inverno

In the diverse array of work investigating the nature of human values from psychology, philosophy and social sciences, there is a clear consensus that values guide behaviour. More recently, a recognition that values provide a means to engineer ethical AI has emerged. Indeed, Stuart Russell proposed shifting AI's focus away from simply ``intelligence'' towards intelligence ``provably aligned with human values''. This challenge -- the value alignment problem -- with others including an AI's learning of human values, aggregating individual values to groups, and designing computational mechanisms to reason over values, has energised a sustained research effort. Despite this, no formal, computational definition of values has yet been proposed. We address this through a formal conceptual framework rooted in the social sciences, that provides a foundation for the systematic, integrated and interdisciplinary investigation into how human values can support designing ethical AI.

翻译：在心理学、哲学和社会科学对人类价值观本质的广泛研究中，一个明确的共识是：价值观指导行为。最近，人们逐渐认识到价值观为构建符合伦理的人工智能提供了一种途径。事实上，斯图尔特·罗素曾提出，应将人工智能的关注点从单纯的“智能”转向“可证明与人类价值观一致”的智能。这一挑战——即价值对齐问题——连同其他问题，包括人工智能对人类价值观的学习、将个体价值观聚合为群体价值观，以及设计计算机制以对价值观进行推理，已经推动了一项持续的研究努力。尽管如此，目前尚未提出一个形式化的、可计算的价值定义。我们通过一个植根于社会科学的形式化概念框架来解决这一问题，该框架为系统化、集成化和跨学科地研究人类价值观如何支持设计符合伦理的人工智能奠定了基础。

0

相关内容

人类价值

《在单智能体与多智能体AI系统中融入人类合理性》100页

《在单智能体与多智能体AI系统中融入人类合理性》100页

专知会员服务

31+阅读 · 2025年5月10日

《人类-人工智能握手框架：人与人工智能合作的双向方法》

《人类-人工智能握手框架：人与人工智能合作的双向方法》

专知会员服务

39+阅读 · 2025年2月5日

大语言模型价值观对齐研究与展望

大语言模型价值观对齐研究与展望

专知会员服务

37+阅读 · 2024年3月19日

人工智能伦理计算

人工智能伦理计算

专知会员服务

39+阅读 · 2023年10月13日

哈工大秦兵教授 | 大语言模型之人类价值观对齐

哈工大秦兵教授 | 大语言模型之人类价值观对齐

专知会员服务

62+阅读 · 2023年8月4日

联合国教科文组织发布《人工智能伦理建议书》

联合国教科文组织发布《人工智能伦理建议书》

专知会员服务

51+阅读 · 2021年12月7日

《新一代人工智能伦理规范》发布

专知会员服务

43+阅读 · 2021年9月28日

人工智能安全框架

专知会员服务

63+阅读 · 2021年7月5日

如何构建通用人工智能AGI？这份来自数学家视角见解可以参阅，64页PPT

如何构建通用人工智能AGI？这份来自数学家视角见解可以参阅，64页PPT

专知会员服务

44+阅读 · 2020年6月15日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

35+阅读 · 2022年7月31日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

专知

28+阅读 · 2019年12月13日

让人工智能有情感的秘诀！清华权威报告看透情感计算【附下载】

让人工智能有情感的秘诀！清华权威报告看透情感计算【附下载】

人工智能学家

21+阅读 · 2019年10月7日

情感计算综述

情感计算综述

人工智能学家

34+阅读 · 2019年4月6日

人工智能的现状与未来（附PPT）

人工智能的现状与未来（附PPT）

人工智能学家

76+阅读 · 2019年3月27日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向经济复杂性的行为建模与计算实验及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

服务交互中顾客价值共创行为的管理策略研究——人力资源管理的视角

国家自然科学基金

1+阅读 · 2014年12月31日

Computational Concept of the Psyche

Computational Concept of the Psyche

Arxiv

0+阅读 · 3月16日

Human, Algorithm, or Both? Gender Bias in Human-Augmented Recruiting

Arxiv

0+阅读 · 3月6日

Toward Human-Centered Human-AI Interaction: Advances in Theoretical Frameworks and Practice

Arxiv

1+阅读 · 2月18日

A Bayesian Framework for Human-AI Collaboration: Complementarity and Correlation Neglect

Arxiv

0+阅读 · 2月15日

Human Tool: An MCP-Style Framework for Human-Agent Collaboration

Arxiv

0+阅读 · 2月13日

Building Intelligent User Interfaces for Human-AI Alignment

Arxiv

0+阅读 · 2月12日

Situated, Dynamic, and Subjective: Envisioning the Design of Theory-of-Mind-Enabled Everyday AI with Industry Practitioners

Arxiv

0+阅读 · 2月11日

Operationalizing Human Values in the Requirements Engineering Process of Ethics-Aware Autonomous Systems

Arxiv

0+阅读 · 2月10日

Learning the Value Systems of Societies with Preference-based Multi-objective Reinforcement Learning

Arxiv

0+阅读 · 2月9日

AI and My Values: User Perceptions of LLMs' Ability to Extract, Embody, and Explain Human Values from Casual Conversations

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

1+阅读 · 今天13:30

多智能体协作机制

多智能体协作机制

专知会员服务

1+阅读 · 今天13:26

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

4+阅读 · 今天4:39

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

14+阅读 · 今天2:52

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

6+阅读 · 今天2:48

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

9+阅读 · 今天2:43

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

7+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

8+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

7+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

10+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

14+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

10+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

5+阅读 · 4月24日

相关VIP内容

《在单智能体与多智能体AI系统中融入人类合理性》100页

《在单智能体与多智能体AI系统中融入人类合理性》100页

专知会员服务

31+阅读 · 2025年5月10日

《人类-人工智能握手框架：人与人工智能合作的双向方法》

《人类-人工智能握手框架：人与人工智能合作的双向方法》

专知会员服务

39+阅读 · 2025年2月5日

大语言模型价值观对齐研究与展望

大语言模型价值观对齐研究与展望

专知会员服务

37+阅读 · 2024年3月19日

人工智能伦理计算

人工智能伦理计算

专知会员服务

39+阅读 · 2023年10月13日

哈工大秦兵教授 | 大语言模型之人类价值观对齐

哈工大秦兵教授 | 大语言模型之人类价值观对齐

专知会员服务

62+阅读 · 2023年8月4日

联合国教科文组织发布《人工智能伦理建议书》

联合国教科文组织发布《人工智能伦理建议书》

专知会员服务

51+阅读 · 2021年12月7日

《新一代人工智能伦理规范》发布

专知会员服务

43+阅读 · 2021年9月28日

人工智能安全框架

专知会员服务

63+阅读 · 2021年7月5日

如何构建通用人工智能AGI？这份来自数学家视角见解可以参阅，64页PPT

如何构建通用人工智能AGI？这份来自数学家视角见解可以参阅，64页PPT

专知会员服务

44+阅读 · 2020年6月15日

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

【DeepMind】人工智能、价值与对齐，Artificial Intelligence, Values, and Alignment

专知会员服务

38+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

推荐！【中文版】《人工智能在指挥和控制系统中的决策支持》瑞典国防研究局

专知

35+阅读 · 2022年7月31日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

谷歌可解释人工智能白皮书，27页pdf，Google AI Explainability Whitepaper

专知

28+阅读 · 2019年12月13日

让人工智能有情感的秘诀！清华权威报告看透情感计算【附下载】

让人工智能有情感的秘诀！清华权威报告看透情感计算【附下载】

人工智能学家

21+阅读 · 2019年10月7日

情感计算综述

情感计算综述

人工智能学家

34+阅读 · 2019年4月6日

人工智能的现状与未来（附PPT）

人工智能的现状与未来（附PPT）

人工智能学家

76+阅读 · 2019年3月27日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

相关论文

Computational Concept of the Psyche

Computational Concept of the Psyche

Arxiv

0+阅读 · 3月16日

Human, Algorithm, or Both? Gender Bias in Human-Augmented Recruiting

Arxiv

0+阅读 · 3月6日

Toward Human-Centered Human-AI Interaction: Advances in Theoretical Frameworks and Practice

Arxiv

1+阅读 · 2月18日

A Bayesian Framework for Human-AI Collaboration: Complementarity and Correlation Neglect

Arxiv

0+阅读 · 2月15日

Human Tool: An MCP-Style Framework for Human-Agent Collaboration

Arxiv

0+阅读 · 2月13日

Building Intelligent User Interfaces for Human-AI Alignment

Arxiv

0+阅读 · 2月12日

Situated, Dynamic, and Subjective: Envisioning the Design of Theory-of-Mind-Enabled Everyday AI with Industry Practitioners

Arxiv

0+阅读 · 2月11日

Operationalizing Human Values in the Requirements Engineering Process of Ethics-Aware Autonomous Systems

Arxiv

0+阅读 · 2月10日

Learning the Value Systems of Societies with Preference-based Multi-objective Reinforcement Learning

Arxiv

0+阅读 · 2月9日

AI and My Values: User Perceptions of LLMs' Ability to Extract, Embody, and Explain Human Values from Casual Conversations

Arxiv

0+阅读 · 1月30日

相关基金

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

人类双向选择行为的统计特征分析与预测方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向经济复杂性的行为建模与计算实验及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

服务交互中顾客价值共创行为的管理策略研究——人力资源管理的视角

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员