重磅！Lehigh微软最新《Sora:综述大视觉模型的背景、技术、限制和机遇》报告 - 专知VIP

会员服务 ·

30

Sora · 视频生成模型 · 视觉 ·

2024 年 3 月 1 日

重磅！Lehigh微软最新《Sora:综述大视觉模型的背景、技术、限制和机遇》报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

Sora是一个文本到视频的生成式AI模型，由OpenAI在2024年2月发布。该模型被训练用于从文本指令生成现实或想象场景的视频，并展示了在模拟物理世界方面的潜力。基于公开的技术报告和逆向工程，本文对该模型的背景、相关技术、应用、现存挑战以及文本到视频AI模型的未来发展方向进行了全面综述。我们首先追溯Sora的发展，并研究用于构建这个“世界模拟器”的底层技术。然后，我们详细描述了Sora在从电影制作和教育到营销等多个行业的应用及潜在影响。我们讨论了需要解决的主要挑战和限制，以广泛部署Sora，例如确保安全且无偏见的视频生成。最后，我们讨论了Sora和一般视频生成模型的未来发展，以及该领域的进步如何能够启用新的人工智能交互方式，提升视频生成的生产力和创造力。

成为VIP会员查看完整内容

61

相关内容

Sora

Sora是OpenAI发布的一个AI模型，可以从文本指令中创建现实和想象的视频。OpenAI发布首个文本生成视频模型Sora，在生成视频长度（60秒）和内容上表现突出，为AIGC发展过程中的一大里程碑事件，

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

专知会员服务

136+阅读 · 2023年11月1日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

49+阅读 · 2023年7月23日

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

专知会员服务

57+阅读 · 2023年6月21日

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

专知会员服务

74+阅读 · 2023年5月31日

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

专知会员服务

177+阅读 · 2023年5月30日

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

专知会员服务

153+阅读 · 2023年5月14日

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

专知会员服务

370+阅读 · 2023年4月3日

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知会员服务

154+阅读 · 2022年4月11日

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

专知会员服务

43+阅读 · 2022年3月28日

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

专知会员服务

61+阅读 · 2022年3月13日

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

专知

13+阅读 · 2022年10月15日

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知

29+阅读 · 2022年4月12日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

机器之心

12+阅读 · 2019年12月9日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

AI研习社

22+阅读 · 2019年1月10日

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

人工智能前沿讲习班

18+阅读 · 2018年9月25日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

111+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

232+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

156+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Arxiv

25+阅读 · 2023年2月20日

Deep Face Recognition: A Survey

Deep Face Recognition: A Survey

Arxiv

18+阅读 · 2019年2月12日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

VIP会员

相关主题

视频生成模型

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

10+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

重磅！新书《多智能体强化学习：基础与现代方法》完整版，爱丁堡Stefano博士编著，385页pdf

专知会员服务

136+阅读 · 2023年11月1日

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

【普林斯顿博士论文】生成式人工智能的承诺与陷阱：以AI安全为中心的方法

专知会员服务

49+阅读 · 2023年7月23日

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

如何构建CV中的AGI？华为最新《计算机视觉中的人工通用智能：从GPT和大型语言模型中学到的经验教训》

专知会员服务

57+阅读 · 2023年6月21日

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

推荐！《基于人工智能的学习、优化和兵棋推演（LAILOW）来实现美国海军作战兵力的战略部署和分布》2023最新14页报告

专知会员服务

74+阅读 · 2023年5月31日

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

重磅！新书《多智能体强化学习：基础与现代方法》最新版，爱丁堡Stefano博士编著，320页pdf

专知会员服务

177+阅读 · 2023年5月30日

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

【2023新书】生成深度学习：教机器绘画、写作、作曲和游戏第二版

专知会员服务

153+阅读 · 2023年5月14日

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

重磅！人大等最新《大模型》综述，51页pdf详述大型语言模型进展

专知会员服务

370+阅读 · 2023年4月3日

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2024新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知会员服务

154+阅读 · 2022年4月11日

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

【AI+军事】北约技术报告《基于内容的多媒体分析 (CBMA)》（附下载）

专知会员服务

43+阅读 · 2022年3月28日

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

专知会员服务

61+阅读 · 2022年3月13日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

【2022新书】使用Scikit-Learn、Keras和TensorFlow实践机器学习:构建智能系统的概念、工具和技术第三版

专知

15+阅读 · 2022年11月8日

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

推荐！《军事元宇宙作战概念（CONOPS）》【完整译文】2022最新13页技术报告，北约科学和技术组织（STO）

专知

13+阅读 · 2022年10月15日

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

【2022新书】深度学习的数学工程，The Mathematical Engineering of Deep Learning

专知

29+阅读 · 2022年4月12日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

NeurIPS提前看 | 四篇论文，一窥元学习的最新研究进展

机器之心

12+阅读 · 2019年12月9日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

重磅发布：基于 PyTorch 的深度文本匹配工具 MatchZoo-py

中国科学院网络数据重点实验室

16+阅读 · 2019年8月26日

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

收藏 | Tensorflow实现的深度NLP模型集锦（附资源）

THU数据派

12+阅读 · 2019年4月28日

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

AI研习社

22+阅读 · 2019年1月10日

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

AI前沿学生论坛 | 朱时超：图神经网络模型及应用进展【附视频+PPT下载】

人工智能前沿讲习班

18+阅读 · 2018年9月25日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向Bug报告的软件故障重现方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

111+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

232+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

156+阅读 · 2023年3月29日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Large-scale Multi-Modal Pre-trained Models: A Comprehensive Survey

Arxiv

25+阅读 · 2023年2月20日

Deep Face Recognition: A Survey

Deep Face Recognition: A Survey

Arxiv

18+阅读 · 2019年2月12日

Deep learning in agriculture: A survey

Arxiv

11+阅读 · 2018年7月31日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

微信扫码咨询专知VIP会员