Task-Driven Lens Design - 专知论文

会员服务 ·

0

设计 · 像差 · CVPR 2022 · 系统 · 新型 ·

Task-Driven Lens Design

翻译：任务驱动的镜头设计

Xinge Yang,Qiang Fu,Yunfeng Nie,Wolfgang Heidrich

Classical lens design minimizes optical aberrations to produce sharp images, but is typically decoupled from downstream computer vision tasks. Existing end-to-end optical design learns optical encoding through joint optimization, but often suffers from an unstable training process. We propose task-driven lens design, a new optimization philosophy for joint optics-network systems. We freeze the pretrained vision model and optimize only the lens so that the image formation better fits the model's feature preferences. This network-frozen setting yields a low-dimensional and stable optimization process, enabling lens design from scratch without human intervention, thereby exploring a broader design space. Multiple computer vision experiments show that TaskLenses outperform classical ImagingLenses with the same or even fewer elements. Our analysis reveals that the learned optics exhibit long-tailed point spread functions, better preserving preferred structural cues when aberrations cannot be fully corrected. These results highlight task-driven design as a practical route for optical lenses that are compatible with modern vision models, and also inspire new optical design objectives beyond traditional aberration minimization.

翻译：传统镜头设计通过最小化光学像差来生成清晰图像，但通常与下游计算机视觉任务相分离。现有的端到端光学设计通过联合优化学习光学编码，但常面临训练过程不稳定的问题。我们提出任务驱动的镜头设计，这是一种面向光学-网络联合系统的新型优化范式。我们冻结预训练的视觉模型，仅优化镜头参数，使成像过程更好地适配模型的特征偏好。这种网络冻结设置产生了低维且稳定的优化过程，能够实现无需人工干预的从零开始镜头设计，从而探索更广阔的设计空间。多项计算机视觉实验表明，TaskLenses在相同甚至更少镜片数量的情况下，性能优于传统成像镜头。我们的分析表明，学习得到的光学系统呈现出长尾点扩散函数，在无法完全校正像差时能更好地保留模型偏好的结构线索。这些结果凸显了任务驱动设计作为光学镜头与现代视觉模型兼容的实用路径，同时也启发了超越传统像差最小化的新型光学设计目标。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

专知会员服务

21+阅读 · 3月3日

《将模拟器嵌入任务式指挥系统以进行行动方案分析》

《将模拟器嵌入任务式指挥系统以进行行动方案分析》

专知会员服务

38+阅读 · 2024年12月17日

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

专知会员服务

25+阅读 · 2024年2月21日

《通用多模态模型的视觉指令微调》综述

《通用多模态模型的视觉指令微调》综述

专知会员服务

40+阅读 · 2023年12月29日

用于识别任务的视觉 Transformer 综述

用于识别任务的视觉 Transformer 综述

专知会员服务

75+阅读 · 2023年2月25日

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

专知会员服务

67+阅读 · 2022年7月8日

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

专知会员服务

236+阅读 · 2022年4月10日

【CVPR2022】 Dropout在图像超分任务中的重煥新生

【CVPR2022】 Dropout在图像超分任务中的重煥新生

专知会员服务

19+阅读 · 2022年3月5日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

专知会员服务

40+阅读 · 2021年1月27日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

深度学习与计算机视觉任务应用综述

深度学习与计算机视觉任务应用综述

深度学习与NLP

51+阅读 · 2018年12月18日

综述：Image Caption 任务之语句多样性

综述：Image Caption 任务之语句多样性

PaperWeekly

22+阅读 · 2018年11月30日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

新智元

11+阅读 · 2018年5月24日

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

产业智能官

29+阅读 · 2018年2月3日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

包含多尺度结构的晶圆级透镜阵列设计和制造关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

成像系统的光学/数字处理联合设计方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

液晶自适应光学系统的快速液晶过压驱动方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机运输服务网络设计场景树压缩及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

Learning to See and Act: Task-Aware Virtual View Exploration for Robotic Manipulation

Arxiv

0+阅读 · 3月18日

RAViT: Resolution-Adaptive Vision Transformer

Arxiv

0+阅读 · 2月27日

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

Arxiv

1+阅读 · 2月23日

A reliability- and latency-driven task allocation framework for workflow applications in the edge-hub-cloud continuum

Arxiv

0+阅读 · 2月20日

NeuronSeek: On Stability and Expressivity of Task-driven Neurons

Arxiv

0+阅读 · 2月15日

MASAR: Motion-Appearance Synergy Refinement for Joint Detection and Trajectory Forecasting

Arxiv

0+阅读 · 2月13日

Rotated Lights for Consistent and Efficient 2D Gaussians Inverse Rendering

Arxiv

0+阅读 · 2月9日

PlanViz: Evaluating Planning-Oriented Image Generation and Editing for Computer-Use Tasks

Arxiv

0+阅读 · 2月6日

High-Precision Edge Detection via Task-Adaptive Texture Handling and Ideal-Prior Guidance

Arxiv

0+阅读 · 2月6日

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

0+阅读 · 今天13:13

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

0+阅读 · 今天13:08

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

3+阅读 · 今天7:11

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

5+阅读 · 今天6:56

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 今天4:16

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

8+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

18+阅读 · 4月22日

相关VIP内容

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

《一种用于GNSS拒止环境中执行情报、监视与侦察任务集的无人机设计任务工程框架》

专知会员服务

21+阅读 · 3月3日

《将模拟器嵌入任务式指挥系统以进行行动方案分析》

《将模拟器嵌入任务式指挥系统以进行行动方案分析》

专知会员服务

38+阅读 · 2024年12月17日

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

【博士论文】面向计算机视觉中实践约束的模型适应通用框架，140页pdf

专知会员服务

25+阅读 · 2024年2月21日

《通用多模态模型的视觉指令微调》综述

《通用多模态模型的视觉指令微调》综述

专知会员服务

40+阅读 · 2023年12月29日

用于识别任务的视觉 Transformer 综述

用于识别任务的视觉 Transformer 综述

专知会员服务

75+阅读 · 2023年2月25日

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

专知会员服务

67+阅读 · 2022年7月8日

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

专知会员服务

236+阅读 · 2022年4月10日

【CVPR2022】 Dropout在图像超分任务中的重煥新生

【CVPR2022】 Dropout在图像超分任务中的重煥新生

专知会员服务

19+阅读 · 2022年3月5日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

19+阅读 · 2021年9月13日

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

是时候学习机器学习系统设计了！斯坦福CS 329S开课，课件、笔记同步更新

专知会员服务

40+阅读 · 2021年1月27日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体长期记忆安全性综述：迈向记忆主权

人工智能赋能无人机：俄乌战争（万字长文）

【斯坦福博士论文】语言模型的机械可解释性与控制

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

相关资讯

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

深度学习与计算机视觉任务应用综述

深度学习与计算机视觉任务应用综述

深度学习与NLP

51+阅读 · 2018年12月18日

综述：Image Caption 任务之语句多样性

综述：Image Caption 任务之语句多样性

PaperWeekly

22+阅读 · 2018年11月30日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

Ian Goodfellow等提出自注意力GAN，ImageNet图像合成获最优结果！

新智元

11+阅读 · 2018年5月24日

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

产业智能官

29+阅读 · 2018年2月3日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

相关论文

Learning to See and Act: Task-Aware Virtual View Exploration for Robotic Manipulation

Arxiv

0+阅读 · 3月18日

RAViT: Resolution-Adaptive Vision Transformer

Arxiv

0+阅读 · 2月27日

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

Arxiv

1+阅读 · 2月23日

A reliability- and latency-driven task allocation framework for workflow applications in the edge-hub-cloud continuum

Arxiv

0+阅读 · 2月20日

NeuronSeek: On Stability and Expressivity of Task-driven Neurons

Arxiv

0+阅读 · 2月15日

MASAR: Motion-Appearance Synergy Refinement for Joint Detection and Trajectory Forecasting

Arxiv

0+阅读 · 2月13日

Rotated Lights for Consistent and Efficient 2D Gaussians Inverse Rendering

Arxiv

0+阅读 · 2月9日

PlanViz: Evaluating Planning-Oriented Image Generation and Editing for Computer-Use Tasks

Arxiv

0+阅读 · 2月6日

High-Precision Edge Detection via Task-Adaptive Texture Handling and Ideal-Prior Guidance

Arxiv

0+阅读 · 2月6日

DesignAsCode: Bridging Structural Editability and Visual Fidelity in Graphic Design Generation

Arxiv

0+阅读 · 2月6日

相关基金

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

包含多尺度结构的晶圆级透镜阵列设计和制造关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

成像系统的光学/数字处理联合设计方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

液晶自适应光学系统的快速液晶过压驱动方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机运输服务网络设计场景树压缩及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员