Decision Quality Evaluation Framework at Pinterest - 专知论文

会员服务 ·

0

Pinterest · 质量评估 · 系统 · 数据集 · 数据驱动 ·

Decision Quality Evaluation Framework at Pinterest

翻译：Pinterest决策质量评估框架

Yuqi Tian,Robert Paine,Attila Dobi,Kevin O'Sullivan,Aravindh Manickavasagam,Faisal Farooq

Online platforms require robust systems to enforce content safety policies at scale. A critical component of these systems is the ability to evaluate the quality of moderation decisions made by both human agents and Large Language Models (LLMs). However, this evaluation is challenging due to the inherent trade-offs between cost, scale, and trustworthiness, along with the complexity of evolving policies. To address this, we present a comprehensive Decision Quality Evaluation Framework developed and deployed at Pinterest. The framework is centered on a high-trust Golden Set (GDS) curated by subject matter experts (SMEs), which serves as a ground truth benchmark. We introduce an automated intelligent sampling pipeline that uses propensity scores to efficiently expand dataset coverage. We demonstrate the framework's practical application in several key areas: benchmarking the cost-performance trade-offs of various LLM agents, establishing a rigorous methodology for data-driven prompt optimization, managing complex policy evolution, and ensuring the integrity of policy content prevalence metrics via continuous validation. The framework enables a shift from subjective assessments to a data-driven and quantitative practice for managing content safety systems.

翻译：在线平台需要强大的系统来大规模执行内容安全策略。这些系统的关键组成部分在于能够评估人工审核员和大语言模型（LLM）所做审核决策的质量。然而，由于成本、规模和可信度之间固有的权衡，以及不断演变的策略复杂性，此类评估极具挑战性。为此，我们提出在Pinterest开发并部署的综合性决策质量评估框架。该框架以领域专家（SME）精心编制的高可信度黄金数据集（GDS）为核心，作为基准事实标准。我们引入了一种基于倾向性评分的自动化智能抽样流程，可高效扩展数据集覆盖范围。我们展示了该框架在多个关键领域的实际应用：评估各类LLM代理的成本-性能权衡、建立数据驱动提示优化的严谨方法、管理复杂的策略演进，以及通过持续验证确保策略内容流行度指标的完整性。该框架实现了从主观评估向数据驱动、量化管理内容安全系统实践的转变。

0

相关内容

Pinterest 是一个自称“个人版猎酷工具”的视觉社交目录网站，看起来像是一面虚拟的灵感墙，收藏丰富多元的设计、视觉艺术图片。 http://pinterest.com

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

专知会员服务

27+阅读 · 2025年7月26日

关于大语言模型驱动的推荐系统智能体的综述

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

专知会员服务

55+阅读 · 2024年7月24日

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

专知会员服务

63+阅读 · 2024年3月4日

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

专知会员服务

49+阅读 · 2024年1月17日

天大最新《大型语言模型评估》全面综述，111页pdf

天大最新《大型语言模型评估》全面综述，111页pdf

专知会员服务

88+阅读 · 2023年10月31日

《利用 ChatGPT 实现高效事实核查》

《利用 ChatGPT 实现高效事实核查》

专知会员服务

47+阅读 · 2023年10月25日

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

专知会员服务

88+阅读 · 2023年7月13日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

65+阅读 · 2022年9月22日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

ECCV 2020 | 一键挑出高质量图像！中科大&微软提出挑图神器：GIQA

ECCV 2020 | 一键挑出高质量图像！中科大&微软提出挑图神器：GIQA

CVer

16+阅读 · 2020年7月4日

一行命令搞定图像质量评价

一行命令搞定图像质量评价

计算机视觉life

12+阅读 · 2019年12月31日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

深度 | 推荐系统评估

深度 | 推荐系统评估

AI100

24+阅读 · 2019年3月16日

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

PMCAFF

10+阅读 · 2019年3月14日

47页PPT，海量信息！用户画像架构、指标、标签、ETL、性能及案例应用一站通！（附PPT下载及视频）

47页PPT，海量信息！用户画像架构、指标、标签、ETL、性能及案例应用一站通！（附PPT下载及视频）

R语言中文社区

10+阅读 · 2018年8月15日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

12+阅读 · 2018年8月15日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

信息中心网络问责机制和评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于组合Hodge理论的图像视频质量评价方法

国家自然科学基金

0+阅读 · 2014年12月31日

An Expert Schema for Evaluating Large Language Model Errors in Scholarly Question-Answering Systems

Arxiv

0+阅读 · 2月24日

AttestLLM: Efficient Attestation Framework for Billion-scale On-device LLMs

Arxiv

0+阅读 · 2月23日

Buy versus Build an LLM: A Decision Framework for Governments

Arxiv

0+阅读 · 2月23日

A Content-Based Framework for Cybersecurity Refusal Decisions in Large Language Models

Arxiv

0+阅读 · 2月17日

EVALOOOP: A Self-Consistency-Centered Framework for Assessing Large Language Model Robustness in Programming

Arxiv

0+阅读 · 2月15日

Buy versus Build an LLM: A Decision Framework for Governments

Arxiv

0+阅读 · 2月13日

HarmMetric Eval: Benchmarking Metrics and Judges for LLM Harmfulness Assessment

Arxiv

0+阅读 · 2月11日

Evaluating Large Language Models for Detecting Architectural Decision Violations

Arxiv

0+阅读 · 2月7日

Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models

Arxiv

0+阅读 · 2月3日

EvalQReason: A Framework for Step-Level Reasoning Evaluation in Large Language Models

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

3+阅读 · 今天2:55

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

1+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

1+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

4+阅读 · 4月23日

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

6+阅读 · 4月23日

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

3+阅读 · 4月23日

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 4月23日

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 4月23日

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 4月23日

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 4月23日

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

8+阅读 · 4月23日

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 4月23日

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 4月23日

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

7+阅读 · 4月23日

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

相关VIP内容

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

《生成式人工智能与大/小语言模型在供应链管理决策优化与可持续性提升中的作用评估》最新51页

专知会员服务

27+阅读 · 2025年7月26日

关于大语言模型驱动的推荐系统智能体的综述

关于大语言模型驱动的推荐系统智能体的综述

专知会员服务

29+阅读 · 2025年2月17日

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

大型语言模型对齐技术综述：RLHF、RLAIF、PPO、DPO 等

专知会员服务

55+阅读 · 2024年7月24日

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

《美国防部对人工智能和 LLM 编写评估因素的信心与偏见》2024最新275页论文

专知会员服务

63+阅读 · 2024年3月4日

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

大模型如何应对安全性？清华等最新《大型语言模型系统的风险分类、缓解措施及评估基准》论文

专知会员服务

49+阅读 · 2024年1月17日

天大最新《大型语言模型评估》全面综述，111页pdf

天大最新《大型语言模型评估》全面综述，111页pdf

专知会员服务

88+阅读 · 2023年10月31日

《利用 ChatGPT 实现高效事实核查》

《利用 ChatGPT 实现高效事实核查》

专知会员服务

47+阅读 · 2023年10月25日

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

如何评估大模型？吉大微软亚研等最新《大型语言模型评估》综述，全面阐述大模型评估方法体系

专知会员服务

88+阅读 · 2023年7月13日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

65+阅读 · 2022年9月22日

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

LinkedIn《贝叶斯优化推荐系统》，IJCAI报告，142页ppt

专知会员服务

52+阅读 · 2021年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【斯坦福博士论文】语言模型的机械可解释性与控制

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

大语言模型智能体长期记忆安全性综述：迈向记忆主权

相关资讯

ECCV 2020 | 一键挑出高质量图像！中科大&微软提出挑图神器：GIQA

ECCV 2020 | 一键挑出高质量图像！中科大&微软提出挑图神器：GIQA

CVer

16+阅读 · 2020年7月4日

一行命令搞定图像质量评价

一行命令搞定图像质量评价

计算机视觉life

12+阅读 · 2019年12月31日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

深度 | 推荐系统评估

深度 | 推荐系统评估

AI100

24+阅读 · 2019年3月16日

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

PMCAFF

10+阅读 · 2019年3月14日

47页PPT，海量信息！用户画像架构、指标、标签、ETL、性能及案例应用一站通！（附PPT下载及视频）

47页PPT，海量信息！用户画像架构、指标、标签、ETL、性能及案例应用一站通！（附PPT下载及视频）

R语言中文社区

10+阅读 · 2018年8月15日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

12+阅读 · 2018年8月15日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

相关论文

An Expert Schema for Evaluating Large Language Model Errors in Scholarly Question-Answering Systems

Arxiv

0+阅读 · 2月24日

AttestLLM: Efficient Attestation Framework for Billion-scale On-device LLMs

Arxiv

0+阅读 · 2月23日

Buy versus Build an LLM: A Decision Framework for Governments

Arxiv

0+阅读 · 2月23日

A Content-Based Framework for Cybersecurity Refusal Decisions in Large Language Models

Arxiv

0+阅读 · 2月17日

EVALOOOP: A Self-Consistency-Centered Framework for Assessing Large Language Model Robustness in Programming

Arxiv

0+阅读 · 2月15日

Buy versus Build an LLM: A Decision Framework for Governments

Arxiv

0+阅读 · 2月13日

HarmMetric Eval: Benchmarking Metrics and Judges for LLM Harmfulness Assessment

Arxiv

0+阅读 · 2月11日

Evaluating Large Language Models for Detecting Architectural Decision Violations

Arxiv

0+阅读 · 2月7日

Persuade Me if You Can: A Framework for Evaluating Persuasion Effectiveness and Susceptibility Among Large Language Models

Arxiv

0+阅读 · 2月3日

EvalQReason: A Framework for Step-Level Reasoning Evaluation in Large Language Models

Arxiv

0+阅读 · 2月2日

相关基金

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

信息中心网络问责机制和评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于组合Hodge理论的图像视频质量评价方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员