MuRAL: A Multi-Resident Ambient Sensor Dataset Annotated with Natural Language for Activities of Daily Living

Recent progress in Large Language Models (LLMs) has enabled advanced reasoning and zero-shot recognition for human activity understanding with ambient sensor data. However, widely used multi-resident datasets such as CASAS, ARAS, and MARBLE lack natural language context and fine-grained annotation, limiting the full exploitation of LLM capabilities in realistic smart environments. To address this gap, we present MuRAL (Multi-Resident Ambient sensor dataset with natural Language), comprising over 21 hours of multi-user sensor data from 21 sessions in a smart home. MuRAL uniquely features detailed natural language descriptions, explicit resident identities, and rich activity labels, all situated in complex, dynamic, multi-resident scenarios. We benchmark state-of-the-art LLMs on MuRAL for three core tasks: subject assignment, action description, and activity classification. Results show that current LLMs still face major challenges on MuRAL, especially in maintaining accurate resident assignment over long sequences, generating precise action descriptions, and effectively integrating context for activity prediction. The dataset is publicly available at: https://mural.imag.fr/.

翻译：近年来，大型语言模型（LLMs）的进展使得利用环境传感器数据进行人类活动理解的高级推理与零样本识别成为可能。然而，广泛使用的多居民数据集（如CASAS、ARAS和MARBLE）缺乏自然语言上下文与细粒度标注，限制了LLMs在现实智能环境中的充分应用。为弥补这一不足，我们提出了MuRAL（附带自然语言的多居民环境传感器数据集），该数据集包含来自智能家居中21个会话、总计超过21小时的多用户传感器数据。MuRAL的独特之处在于其提供了详细的自然语言描述、明确的居民身份标识以及丰富的活动标签，且所有数据均置于复杂、动态的多居民场景中。我们在MuRAL上对当前最先进的LLMs进行了三项核心任务的基准测试：主体分配、动作描述和活动分类。结果表明，现有LLMs在MuRAL上仍面临重大挑战，尤其是在长序列中保持准确的居民分配、生成精确的动作描述以及有效整合上下文进行活动预测方面。该数据集已公开提供：https://mural.imag.fr/。

相关内容

数据集

关注 88

数据集，又称为资料集、数据集合或资料集合，是一种由数据所组成的集合。
Data set（或dataset）是一个数据的集合，通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量，如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数，该数据集的数据可能包括一个或多个成员。

综述：面向移动端大语言模型的隐私与安全

专知会员服务

19+阅读 · 2025年9月7日

赋能大型语言模型多领域资源挑战

专知会员服务

11+阅读 · 2025年6月10日

面向社会公益的自然语言处理：挑战、机遇与负责任部署综述

专知会员服务

13+阅读 · 2025年5月30日

面向统计学家的大型语言模型概述

专知会员服务

32+阅读 · 2025年3月16日