BeamVLM for Low-altitude Economy: Generative Beam Prediction via Vision-language Models - 专知论文

会员服务 ·

0

泛化 · 语言模型 · 低空经济 · 泛化能力 · 视觉语言模型 ·

BeamVLM for Low-altitude Economy: Generative Beam Prediction via Vision-language Models

翻译：面向低空经济的BeamVLM：基于视觉语言模型的生成式波束预测

Chenran Kou,Changsheng You,Mingjiang Wu,Dingzhu Wen,Zezhong Zhang,Chengwen Xing

from arxiv, We propose a novel end-to-end generative framework for beam prediction by using vision-language models

For low-altitude economy (LAE), fast and accurate beam prediction between high-mobility unmanned aerial vehicles (UAVs) and ground base stations is of paramount importance, which ensures seamless coverage and reliable communications. However, existing deep learning-based beam prediction methods lack high-level semantic understanding of dynamic environments, resulting in poor generalization. On the other hand, the emerging large language model (LLM) based approaches show promise in enhancing generalization, but they typically lack rich environmental perception, thereby failing to capture fine-grained spatial semantics essential for precise beam alignment. To tackle these limitations, we propose in this correspondence a novel end-to-end generative framework for beam prediction, called BeamVLM, which treats beam prediction as a vision question answering task capitalizing on powerful existing vision-language models (VLMs). By projecting raw visual patches directly into the language domain and judiciously designing an instructional prompt, the proposed BeamVLM enables the VLM to jointly reason over UAV trajectories and environmental context. Last, experimental results on real-world datasets demonstrate that the proposed BeamVLM outperforms state-of-the-art methods in prediction accuracy and also exhibits superior generalization for other scenarios such as vehicle-to-infrastructure (V2I) beam prediction.

翻译：在低空经济中，实现高机动性无人机与地面基站之间快速、准确的波束预测至关重要，这确保了无缝覆盖与可靠通信。然而，现有基于深度学习的波束预测方法缺乏对动态环境的高层语义理解，导致泛化能力不足。另一方面，新兴的基于大语言模型的方法虽在提升泛化能力方面展现出潜力，但其通常缺乏丰富的环境感知能力，因而难以捕获精确波束对齐所需的关键细粒度空间语义。为应对这些局限，本文提出一种新颖的端到端生成式波束预测框架，称为BeamVLM。该框架将波束预测视为一项视觉问答任务，充分利用现有强大的视觉语言模型。通过将原始视觉图像块直接投影至语言域，并精心设计指令提示，所提出的BeamVLM使VLM能够对无人机轨迹与环境上下文进行联合推理。最后，在真实数据集上的实验结果表明，所提出的BeamVLM在预测准确性上优于现有最优方法，并在其他场景（如车对基础设施波束预测）中展现出更优的泛化性能。

0

相关内容

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

39+阅读 · 2025年12月24日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

通信行业：智能低空通感网络白皮书

通信行业：智能低空通感网络白皮书

专知会员服务

15+阅读 · 2025年7月7日

中国低空经济应用场景研究报告（2025）

中国低空经济应用场景研究报告（2025）

专知会员服务

35+阅读 · 2025年4月20日

低空经济发展研究报告（2024）

低空经济发展研究报告（2024）

专知会员服务

43+阅读 · 2025年1月16日

中国信通院联合发布《数字孪生赋能低空经济研究报告（2024年）》

中国信通院联合发布《数字孪生赋能低空经济研究报告（2024年）》

专知会员服务

39+阅读 · 2025年1月6日

低空经济政策与产业生态研究报告（2024年）

低空经济政策与产业生态研究报告（2024年）

专知会员服务

32+阅读 · 2024年12月25日

《2024低空航行系统白皮书》

《2024低空航行系统白皮书》

专知会员服务

46+阅读 · 2024年12月16日

2024低空经济场景白皮书（167页全文）

2024低空经济场景白皮书（167页全文）

专知会员服务

65+阅读 · 2024年10月27日

《上海低空经济发展白皮书2024》正式发布（附下载）

《上海低空经济发展白皮书2024》正式发布（附下载）

专知会员服务

67+阅读 · 2024年6月12日

无人预警机系统架构及关键技术分析

无人预警机系统架构及关键技术分析

专知

13+阅读 · 2022年8月6日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

机器之心

15+阅读 · 2019年9月3日

Bert 之后：预训练语言模型与自然语言生成

Bert 之后：预训练语言模型与自然语言生成

AINLP

16+阅读 · 2019年7月16日

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

产业智能官

14+阅读 · 2019年5月5日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

详解谷歌最强NLP模型BERT（理论+实战）

详解谷歌最强NLP模型BERT（理论+实战）

AI100

11+阅读 · 2019年1月18日

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

AINLP

28+阅读 · 2018年11月11日

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

33+阅读 · 2017年12月31日

近地空间目标全极化高分辨雷达成像中的波形设计及信号处理相关技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于软件定义的智能光载无线组网模型与控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向高精度航天器状态估计系统的预测变结构滤波理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

微波集成OAM波束产生、传输及抗衰落研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于波导微环谐振腔的光控波束形成网络芯片的理论及制备研究

国家自然科学基金

0+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

45+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Beam Prediction Based on Multimodal Large Language Models

Arxiv

0+阅读 · 3月16日

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Arxiv

0+阅读 · 3月12日

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

Arxiv

0+阅读 · 3月6日

Regularized Diffusion-based Contract Model for Covert Semantic Entropy Control in LAENets

Arxiv

0+阅读 · 3月2日

From Prompts to Protection: Large Language Model-Enabled In-Context Learning for Smart Public Safety UAV

Arxiv

1+阅读 · 2月17日

UAV Swarm Enabled Aerial Movable Antenna System for Low-Altitude Economy: From Far-Field to Near-Field Communication

Arxiv

0+阅读 · 2月14日

Wireless Communication for Low-Altitude Economy with UAV Swarm Enabled Two-Level Movable Antenna System

Arxiv

0+阅读 · 2月14日

A Disentangled Representation Learning Framework for Low-altitude Network Coverage Prediction

Arxiv

0+阅读 · 2月14日

Robust Semantic Transmission for Low-Altitude UAVs: Predictive Channel-Aware Scheduling and Generative Reconstruction

Arxiv

0+阅读 · 2月11日

Leveraging the Power of Ensemble Learning for Secure Low Altitude Economy

Arxiv

0+阅读 · 2月7日

VIP会员

文章信息

相关主题

视觉语言模型

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

10+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

3+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

8+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

5+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

10+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

20+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

12+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

39+阅读 · 2025年12月24日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

通信行业：智能低空通感网络白皮书

通信行业：智能低空通感网络白皮书

专知会员服务

15+阅读 · 2025年7月7日

中国低空经济应用场景研究报告（2025）

中国低空经济应用场景研究报告（2025）

专知会员服务

35+阅读 · 2025年4月20日

低空经济发展研究报告（2024）

低空经济发展研究报告（2024）

专知会员服务

43+阅读 · 2025年1月16日

中国信通院联合发布《数字孪生赋能低空经济研究报告（2024年）》

中国信通院联合发布《数字孪生赋能低空经济研究报告（2024年）》

专知会员服务

39+阅读 · 2025年1月6日

低空经济政策与产业生态研究报告（2024年）

低空经济政策与产业生态研究报告（2024年）

专知会员服务

32+阅读 · 2024年12月25日

《2024低空航行系统白皮书》

《2024低空航行系统白皮书》

专知会员服务

46+阅读 · 2024年12月16日

2024低空经济场景白皮书（167页全文）

2024低空经济场景白皮书（167页全文）

专知会员服务

65+阅读 · 2024年10月27日

《上海低空经济发展白皮书2024》正式发布（附下载）

《上海低空经济发展白皮书2024》正式发布（附下载）

专知会员服务

67+阅读 · 2024年6月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

无人预警机系统架构及关键技术分析

无人预警机系统架构及关键技术分析

专知

13+阅读 · 2022年8月6日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

微软亚研提出VL-BERT：通用的视觉-语言预训练模型

机器之心

15+阅读 · 2019年9月3日

Bert 之后：预训练语言模型与自然语言生成

Bert 之后：预训练语言模型与自然语言生成

AINLP

16+阅读 · 2019年7月16日

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

产业智能官

14+阅读 · 2019年5月5日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

详解谷歌最强NLP模型BERT（理论+实战）

详解谷歌最强NLP模型BERT（理论+实战）

AI100

11+阅读 · 2019年1月18日

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

AINLP

28+阅读 · 2018年11月11日

相关论文

Beam Prediction Based on Multimodal Large Language Models

Arxiv

0+阅读 · 3月16日

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Arxiv

0+阅读 · 3月12日

BEVLM: Distilling Semantic Knowledge from LLMs into Bird's-Eye View Representations

Arxiv

0+阅读 · 3月6日

Regularized Diffusion-based Contract Model for Covert Semantic Entropy Control in LAENets

Arxiv

0+阅读 · 3月2日

From Prompts to Protection: Large Language Model-Enabled In-Context Learning for Smart Public Safety UAV

Arxiv

1+阅读 · 2月17日

UAV Swarm Enabled Aerial Movable Antenna System for Low-Altitude Economy: From Far-Field to Near-Field Communication

Arxiv

0+阅读 · 2月14日

Wireless Communication for Low-Altitude Economy with UAV Swarm Enabled Two-Level Movable Antenna System

Arxiv

0+阅读 · 2月14日

A Disentangled Representation Learning Framework for Low-altitude Network Coverage Prediction

Arxiv

0+阅读 · 2月14日

Robust Semantic Transmission for Low-Altitude UAVs: Predictive Channel-Aware Scheduling and Generative Reconstruction

Arxiv

0+阅读 · 2月11日

Leveraging the Power of Ensemble Learning for Secure Low Altitude Economy

Arxiv

0+阅读 · 2月7日

相关基金

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

33+阅读 · 2017年12月31日

近地空间目标全极化高分辨雷达成像中的波形设计及信号处理相关技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于软件定义的智能光载无线组网模型与控制机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向高精度航天器状态估计系统的预测变结构滤波理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

微波集成OAM波束产生、传输及抗衰落研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于波导微环谐振腔的光控波束形成网络芯片的理论及制备研究

国家自然科学基金

0+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

45+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员