A Framework for Optimizing Human-Machine Interaction in Classification Systems - 专知论文

会员服务 ·

0

系统 · 置信度 · 交互 · 阈值 · 人机交互 ·

A Framework for Optimizing Human-Machine Interaction in Classification Systems

翻译：一种优化分类系统中人机交互的框架

Goran Muric,Steven Minton

Automated decision systems increasingly rely on human oversight to ensure accuracy in uncertain cases. This paper presents a practical framework for optimizing such human-in-the-loop classification systems using a double-threshold policy. Conventional classifiers usually produce a confidence score and apply a single cutoff, but our approach uses two thresholds (a lower and an upper) to automatically accept or reject high-confidence cases while routing ambiguous instances to human reviewers. We formulate this problem as an optimization task that balances system accuracy against the cost of human review. Through analytical derivations and Monte Carlo simulations, we show how different confidence score distributions impact the efficiency of human intervention and reveal regions of diminishing returns, where additional review yields minimal benefit. The framework provides a general, reproducible method for improving reliability in any decision pipeline requiring selective human validation, including applications in entity resolution, fraud detection, medical triage, and content moderation.

翻译：自动化决策系统日益依赖人工监督来确保不确定案例的准确性。本文提出了一种实用的框架，通过双阈值策略来优化此类人在回路的分类系统。传统分类器通常生成置信度分数并应用单一截止点，而我们的方法使用两个阈值（一个下限和一个上限）来自动接受或拒绝高置信度案例，同时将模糊实例转交给人工审核员。我们将此问题构建为一个优化任务，以平衡系统准确性与人工审核成本。通过解析推导和蒙特卡洛模拟，我们展示了不同置信度分数分布如何影响人工干预的效率，并揭示了收益递减区域，即额外审核带来的效益微乎其微。该框架为任何需要选择性人工验证的决策流程（包括实体解析、欺诈检测、医疗分诊和内容审核等应用）提供了一种通用、可复现的提高可靠性的方法。

0

相关内容

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

专知会员服务

37+阅读 · 1月31日

《设计人机协作：一种充分统计量方法》最新72页

《设计人机协作：一种充分统计量方法》最新72页

专知会员服务

17+阅读 · 2025年7月7日

《人-AI协作设计：统计量方法》最新77页

《人-AI协作设计：统计量方法》最新77页

专知会员服务

27+阅读 · 2025年5月3日

《用于战斗机实时飞行性能预测和评估的人工智能框架》

《用于战斗机实时飞行性能预测和评估的人工智能框架》

专知会员服务

29+阅读 · 2025年2月12日

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

专知会员服务

29+阅读 · 2024年9月22日

《基于分类方法的自动人机对话》

《基于分类方法的自动人机对话》

专知会员服务

25+阅读 · 2023年7月18日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

137+阅读 · 2023年7月10日

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

专知会员服务

64+阅读 · 2022年10月28日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【上海交大】可解释CNN的对象分类，Interpretable CNNs for Object Classification

专知会员服务

54+阅读 · 2020年3月14日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

基于python的开源量化交易，量化投资架构

基于python的开源量化交易，量化投资架构

运维帮

15+阅读 · 2018年7月5日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

产业智能官

11+阅读 · 2017年10月14日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

考虑物品种类有限性的分类存储策略及仓储系统优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

集中式协作频谱感知系统的多层次优化

国家自然科学基金

2+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

复杂交互型网络系统的DEA效率评价与资源配置研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions

Arxiv

0+阅读 · 2月5日

The hybrid confirmation tree: A robust strategy for hybrid intelligence

Arxiv

0+阅读 · 2月2日

Revising Bloom's Taxonomy for Dual-Mode Cognition in Human-AI Systems: The Augmented Cognition Framework

Arxiv

0+阅读 · 1月31日

HARMONI: Multimodal Personalization of Multi-User Human-Robot Interactions with LLMs

Arxiv

0+阅读 · 1月27日

Real-Time Synchronized Interaction Framework for Emotion-Aware Humanoid Robots

Arxiv

0+阅读 · 1月24日

PI2I: A Personalized Item-Based Collaborative Filtering Retrieval Framework

Arxiv

0+阅读 · 1月23日

A Lightweight Medical Image Classification Framework via Self-Supervised Contrastive Learning and Quantum-Enhanced Feature Modeling

Arxiv

0+阅读 · 1月23日

Adaptive Multimodal Person Recognition: A Robust Framework for Handling Missing Modalities

Arxiv

0+阅读 · 1月22日

Stochastic Decision-Making Framework for Human-Robot Collaboration in Industrial Applications

Arxiv

0+阅读 · 1月21日

A neural network for modeling human concept formation, understanding and communication

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

8+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

11+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

2+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

2+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

10+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

2+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

14+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

12+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

9+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

17+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

8+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

10+阅读 · 4月18日

相关VIP内容

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

《从“分诊”到目标锁定：人工智能作战人员关键决策架构》

专知会员服务

37+阅读 · 1月31日

《设计人机协作：一种充分统计量方法》最新72页

《设计人机协作：一种充分统计量方法》最新72页

专知会员服务

17+阅读 · 2025年7月7日

《人-AI协作设计：统计量方法》最新77页

《人-AI协作设计：统计量方法》最新77页

专知会员服务

27+阅读 · 2025年5月3日

《用于战斗机实时飞行性能预测和评估的人工智能框架》

《用于战斗机实时飞行性能预测和评估的人工智能框架》

专知会员服务

29+阅读 · 2025年2月12日

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

大模型如何多模态偏好对齐？最新《基于人类反馈的语言、语音和视觉任务偏好优化》综述

专知会员服务

29+阅读 · 2024年9月22日

《基于分类方法的自动人机对话》

《基于分类方法的自动人机对话》

专知会员服务

25+阅读 · 2023年7月18日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

137+阅读 · 2023年7月10日

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

《人类与自动机器学习系统交互的角色和模式：综述与展望》98页长综述论文（2022），悉尼科技大学

专知会员服务

64+阅读 · 2022年10月28日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【上海交大】可解释CNN的对象分类，Interpretable CNNs for Object Classification

专知会员服务

54+阅读 · 2020年3月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

干货|85页最新《人机对话系统》神经方法综述论文，微软与谷歌研究员联合出品：

专知

35+阅读 · 2018年10月7日

基于python的开源量化交易，量化投资架构

基于python的开源量化交易，量化投资架构

运维帮

15+阅读 · 2018年7月5日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

人脸表情分类与识别：人脸检测+情绪分类

人脸表情分类与识别：人脸检测+情绪分类

北京思腾合力科技有限公司

27+阅读 · 2017年12月18日

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

【机器学习】【推荐系统】做推荐系统之前，希望有人告诉我这些

产业智能官

11+阅读 · 2017年10月14日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions

Arxiv

0+阅读 · 2月5日

The hybrid confirmation tree: A robust strategy for hybrid intelligence

Arxiv

0+阅读 · 2月2日

Revising Bloom's Taxonomy for Dual-Mode Cognition in Human-AI Systems: The Augmented Cognition Framework

Arxiv

0+阅读 · 1月31日

HARMONI: Multimodal Personalization of Multi-User Human-Robot Interactions with LLMs

Arxiv

0+阅读 · 1月27日

Real-Time Synchronized Interaction Framework for Emotion-Aware Humanoid Robots

Arxiv

0+阅读 · 1月24日

PI2I: A Personalized Item-Based Collaborative Filtering Retrieval Framework

Arxiv

0+阅读 · 1月23日

A Lightweight Medical Image Classification Framework via Self-Supervised Contrastive Learning and Quantum-Enhanced Feature Modeling

Arxiv

0+阅读 · 1月23日

Adaptive Multimodal Person Recognition: A Robust Framework for Handling Missing Modalities

Arxiv

0+阅读 · 1月22日

Stochastic Decision-Making Framework for Human-Robot Collaboration in Industrial Applications

Arxiv

0+阅读 · 1月21日

A neural network for modeling human concept formation, understanding and communication

Arxiv

0+阅读 · 1月5日

相关基金

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

考虑物品种类有限性的分类存储策略及仓储系统优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

集中式协作频谱感知系统的多层次优化

国家自然科学基金

2+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的分类算法推荐方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

复杂交互型网络系统的DEA效率评价与资源配置研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员