LLM-Glasses：基于生成式人工智能的触觉反馈导航眼镜，用于视障人士辅助 (LLM-Glasses: GenAI-driven Glasses with Haptic Feedback for Navigation of Visually Impaired People) - 专知论文

会员服务 ·

0

视障人士 · 系统 · 识别 · 大语言模型 · Yolo ·

LLM-Glasses: GenAI-driven Glasses with Haptic Feedback for Navigation of Visually Impaired People

翻译：LLM-Glasses：基于生成式人工智能的触觉反馈导航眼镜，用于视障人士辅助

Issatay Tokmurziyev,Miguel Altamirano Cabrera,Muhammad Haris Khan,Yara Mahmoud,Dzmitry Tsetserukou

LLM-Glasses is a wearable navigation system which assists visually impaired people by utilizing YOLO-World object detection, GPT-4o-based reasoning, and haptic feedback for real-time guidance. The device translates visual scene understanding into intuitive tactile feedback on the temples, allowing hands-free navigation. Three studies evaluate the system: recognition of 13 haptic patterns with an average recognition rate of 81.3%, VICON-based guidance with predefined paths using haptic cues, and an LLM-guided scene evaluation with decision accuracies of 91.8% without obstacles, 84.6% with static obstacles, and 81.5% with dynamic obstacles. These results show that LLM-Glasses can deliver reliable navigation support in controlled environments and motivate further work on responsiveness and deployment in more complex real-world scenarios.

翻译：LLM-Glasses 是一种可穿戴导航系统，通过结合 YOLO-World 目标检测、基于 GPT-4o 的推理以及触觉反馈技术，为视障人士提供实时引导。该设备将视觉场景理解转化为镜腿上的直观触觉反馈，实现无需手持的导航。我们通过三项研究评估了该系统：对 13 种触觉模式的识别平均识别率达到 81.3%；基于 VICON 系统、利用触觉提示沿预设路径的引导实验；以及基于 LLM 的场景评估实验，其在无障碍、静态障碍和动态障碍环境下的决策准确率分别为 91.8%、84.6% 和 81.5%。这些结果表明，LLM-Glasses 能够在受控环境中提供可靠的导航支持，并激励我们进一步研究其在更复杂真实场景中的响应能力与部署应用。

0

相关内容

视障人士

LLM智能体对它们的世界有何了解？Task2Quiz：一种探究环境理解的范式

LLM智能体对它们的世界有何了解？Task2Quiz：一种探究环境理解的范式

专知会员服务

19+阅读 · 1月16日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

23+阅读 · 2025年10月29日

人机协同作战规划：来自美海军陆战队的大语言模型（LLM）使用教训

人机协同作战规划：来自美海军陆战队的大语言模型（LLM）使用教训

专知会员服务

24+阅读 · 2025年10月16日

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

专知会员服务

52+阅读 · 2025年8月26日

LLMs与生成式智能体模拟：复杂系统研究的新范式

LLMs与生成式智能体模拟：复杂系统研究的新范式

专知会员服务

27+阅读 · 2025年6月15日

揭示生成式人工智能 / 大型语言模型（LLMs）的军事潜力

揭示生成式人工智能 / 大型语言模型（LLMs）的军事潜力

专知会员服务

31+阅读 · 2024年9月26日

《用于军事行动实时三维场景分析的人工智能无人智能体》

《用于军事行动实时三维场景分析的人工智能无人智能体》

专知会员服务

66+阅读 · 2024年8月13日

【NeurIPS2023】LLM 用于半自动数据科学：介绍 CAAFE，一种具有上下文感知的自动特征工程方法

【NeurIPS2023】LLM 用于半自动数据科学：介绍 CAAFE，一种具有上下文感知的自动特征工程方法

专知会员服务

37+阅读 · 2023年10月3日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

专知会员服务

37+阅读 · 2022年3月25日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

26+阅读 · 2022年11月24日

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

计算机视觉life

24+阅读 · 2020年11月10日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉life

64+阅读 · 2019年6月16日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

激光slam导航方案凭什么更被各大厂家青睐？

激光slam导航方案凭什么更被各大厂家青睐？

计算机视觉life

15+阅读 · 2019年1月25日

【泡泡图灵智库】直接法视觉SLAM的光照变化鲁棒性（ICRA-33）

【泡泡图灵智库】直接法视觉SLAM的光照变化鲁棒性（ICRA-33）

泡泡机器人SLAM

24+阅读 · 2018年9月18日

AI如何帮助卫星遥感释放价值？

AI如何帮助卫星遥感释放价值？

未来论坛

19+阅读 · 2018年8月8日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于2D/3D切换显示的可调液体柱透镜阵列研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于光纤光栅传感器的排泪动力检测及动力异常在泪道阻塞性疾病中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

基于机器视觉的索缆六自由度位移测量方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

微米透镜的成像改进方法及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

室内眩光的视觉模型研究

国家自然科学基金

2+阅读 · 2014年12月31日

波导型准直投影系统中的超级衍射光栅技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

Arxiv

0+阅读 · 2月19日

Human Oversight-by-Design for Accessible Generative IUIs

Arxiv

0+阅读 · 2月14日

BiasScope: Towards Automated Detection of Bias in LLM-as-a-Judge Evaluation

Arxiv

0+阅读 · 2月10日

LLM-Enhanced Wearables for Comprehensible Health Guidance in LMICs

Arxiv

0+阅读 · 2月9日

LatentLens: Revealing Highly Interpretable Visual Tokens in LLMs

Arxiv

0+阅读 · 2月9日

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

Arxiv

0+阅读 · 1月29日

DV-VLN: Dual Verification for Reliable LLM-Based Vision-and-Language Navigation

Arxiv

0+阅读 · 1月26日

GazeSummary: Exploring Gaze as an Implicit Prompt for Personalization in Text-based LLM Tasks

Arxiv

0+阅读 · 1月25日

GuideTouch: An Obstacle Avoidance Device with Tactile Feedback for Visually Impaired

Arxiv

0+阅读 · 1月21日

GuideTouch: An Obstacle Avoidance Device for Visually Impaired

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

大语言模型

相关VIP内容

LLM智能体对它们的世界有何了解？Task2Quiz：一种探究环境理解的范式

LLM智能体对它们的世界有何了解？Task2Quiz：一种探究环境理解的范式

专知会员服务

19+阅读 · 1月16日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

23+阅读 · 2025年10月29日

人机协同作战规划：来自美海军陆战队的大语言模型（LLM）使用教训

人机协同作战规划：来自美海军陆战队的大语言模型（LLM）使用教训

专知会员服务

24+阅读 · 2025年10月16日

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

基于大语言模型（LLM）的智能体推理框架：从方法到场景的综述

专知会员服务

52+阅读 · 2025年8月26日

LLMs与生成式智能体模拟：复杂系统研究的新范式

LLMs与生成式智能体模拟：复杂系统研究的新范式

专知会员服务

27+阅读 · 2025年6月15日

揭示生成式人工智能 / 大型语言模型（LLMs）的军事潜力

揭示生成式人工智能 / 大型语言模型（LLMs）的军事潜力

专知会员服务

31+阅读 · 2024年9月26日

《用于军事行动实时三维场景分析的人工智能无人智能体》

《用于军事行动实时三维场景分析的人工智能无人智能体》

专知会员服务

66+阅读 · 2024年8月13日

【NeurIPS2023】LLM 用于半自动数据科学：介绍 CAAFE，一种具有上下文感知的自动特征工程方法

【NeurIPS2023】LLM 用于半自动数据科学：介绍 CAAFE，一种具有上下文感知的自动特征工程方法

专知会员服务

37+阅读 · 2023年10月3日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

专知会员服务

37+阅读 · 2022年3月25日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

26+阅读 · 2022年11月24日

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

计算机视觉life

24+阅读 · 2020年11月10日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉life

64+阅读 · 2019年6月16日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

激光slam导航方案凭什么更被各大厂家青睐？

激光slam导航方案凭什么更被各大厂家青睐？

计算机视觉life

15+阅读 · 2019年1月25日

【泡泡图灵智库】直接法视觉SLAM的光照变化鲁棒性（ICRA-33）

【泡泡图灵智库】直接法视觉SLAM的光照变化鲁棒性（ICRA-33）

泡泡机器人SLAM

24+阅读 · 2018年9月18日

AI如何帮助卫星遥感释放价值？

AI如何帮助卫星遥感释放价值？

未来论坛

19+阅读 · 2018年8月8日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

相关论文

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

ShadAR: LLM-driven shader generation to transform visual perception in Augmented Reality

Arxiv

0+阅读 · 2月19日

Human Oversight-by-Design for Accessible Generative IUIs

Arxiv

0+阅读 · 2月14日

BiasScope: Towards Automated Detection of Bias in LLM-as-a-Judge Evaluation

Arxiv

0+阅读 · 2月10日

LLM-Enhanced Wearables for Comprehensible Health Guidance in LMICs

Arxiv

0+阅读 · 2月9日

LatentLens: Revealing Highly Interpretable Visual Tokens in LLMs

Arxiv

0+阅读 · 2月9日

CAR-bench: Evaluating the Consistency and Limit-Awareness of LLM Agents under Real-World Uncertainty

Arxiv

0+阅读 · 1月29日

DV-VLN: Dual Verification for Reliable LLM-Based Vision-and-Language Navigation

Arxiv

0+阅读 · 1月26日

GazeSummary: Exploring Gaze as an Implicit Prompt for Personalization in Text-based LLM Tasks

Arxiv

0+阅读 · 1月25日

GuideTouch: An Obstacle Avoidance Device with Tactile Feedback for Visually Impaired

Arxiv

0+阅读 · 1月21日

GuideTouch: An Obstacle Avoidance Device for Visually Impaired

Arxiv

0+阅读 · 1月20日

相关基金

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于2D/3D切换显示的可调液体柱透镜阵列研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

基于光纤光栅传感器的排泪动力检测及动力异常在泪道阻塞性疾病中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

基于机器视觉的索缆六自由度位移测量方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

微米透镜的成像改进方法及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

室内眩光的视觉模型研究

国家自然科学基金

2+阅读 · 2014年12月31日

波导型准直投影系统中的超级衍射光栅技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员