Benchmarking Machine Learning Models for IoT Malware Detection under Data Scarcity and Drift - 专知论文

会员服务 ·

0

软件 · 学习模型 · 物联网 · 机器学习模型 · 基准 ·

Benchmarking Machine Learning Models for IoT Malware Detection under Data Scarcity and Drift

翻译：面向数据稀缺与漂移的物联网恶意软件检测机器学习模型基准测试

Jake Lyon,Ehsan Saeedizade,Shamik Sengupta

The rapid expansion of the Internet of Things (IoT) in domains such as smart cities, transportation, and industrial systems has heightened the urgency of addressing their security vulnerabilities. IoT devices often operate under limited computational resources, lack robust physical safeguards, and are deployed in heterogeneous and dynamic networks, making them prime targets for cyberattacks and malware applications. Machine learning (ML) offers a promising approach to automated malware detection and classification, but practical deployment requires models that are both effective and lightweight. The goal of this study is to investigate the effectiveness of four supervised learning models (Random Forest, LightGBM, Logistic Regression, and a Multi-Layer Perceptron) for malware detection and classification using the IoT-23 dataset. We evaluate model performance in both binary and multiclass classification tasks, assess sensitivity to training data volume, and analyze temporal robustness to simulate deployment in evolving threat landscapes. Our results show that tree-based models achieve high accuracy and generalization, even with limited training data, while performance deteriorates over time as malware diversity increases. These findings underscore the importance of adaptive, resource-efficient ML models for securing IoT systems in real-world environments.

翻译：物联网（IoT）在智慧城市、交通和工业系统等领域的快速扩张，使得解决其安全漏洞的紧迫性日益凸显。物联网设备通常在有限的计算资源下运行，缺乏强大的物理防护措施，并且部署在异构且动态的网络中，这使其成为网络攻击和恶意软件应用的主要目标。机器学习为自动化的恶意软件检测与分类提供了一种前景广阔的方法，但实际部署要求模型既高效又轻量。本研究旨在利用IoT-23数据集，评估四种监督学习模型（随机森林、LightGBM、逻辑回归和多层感知机）在恶意软件检测与分类任务中的有效性。我们评估了模型在二分类与多分类任务中的性能，分析了其对训练数据量的敏感性，并检验了其时间鲁棒性以模拟在不断演变的威胁环境中的部署。结果表明，基于树的模型即使在训练数据有限的情况下也能实现较高的准确率和泛化能力，但随着恶意软件多样性的增加，模型性能会随时间推移而下降。这些发现强调了在现实环境中保障物联网系统安全时，采用自适应且资源高效的机器学习模型的重要性。

0

相关内容

软件（中国大陆及香港用语，台湾作软体，英文：Software）是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。

《国防和安全系统中的物联网 (IoT)：文献综述》

《国防和安全系统中的物联网 (IoT)：文献综述》

专知会员服务

34+阅读 · 2023年11月22日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

50+阅读 · 2023年10月30日

《通过网络隐蔽渠道开发物联网》74页论文

《通过网络隐蔽渠道开发物联网》74页论文

专知会员服务

31+阅读 · 2023年10月28日

《采用多学科方法开展物联网 (IoT) 网络安全研究，培养预备役军官学生的研究能力》114页报告

《采用多学科方法开展物联网 (IoT) 网络安全研究，培养预备役军官学生的研究能力》114页报告

专知会员服务

22+阅读 · 2023年8月14日

《物联网的军事应用：基于士兵可穿戴设备增强战场空间态势感知》挪威奥斯陆大学186页论文

《物联网的军事应用：基于士兵可穿戴设备增强战场空间态势感知》挪威奥斯陆大学186页论文

专知会员服务

68+阅读 · 2023年1月12日

【卡迪夫大学2022博士论文】《智能家居物联网生态系统中网络攻击的检测和防御》221页

【卡迪夫大学2022博士论文】《智能家居物联网生态系统中网络攻击的检测和防御》221页

专知会员服务

31+阅读 · 2022年8月31日

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

专知会员服务

48+阅读 · 2022年4月9日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

专知会员服务

36+阅读 · 2020年3月12日

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

专知会员服务

44+阅读 · 2019年12月29日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

【2022新书】决策支持系统的机器学习和概率图模型，330页pdf

【2022新书】决策支持系统的机器学习和概率图模型，330页pdf

专知

32+阅读 · 2022年7月18日

「工业物联网异常检测技术」最新2022研究综述

「工业物联网异常检测技术」最新2022研究综述

专知

12+阅读 · 2022年5月3日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

物联网智库

13+阅读 · 2019年5月8日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

我所了解的物联网设备测试方法（硬件篇）

我所了解的物联网设备测试方法（硬件篇）

FreeBuf

12+阅读 · 2019年2月12日

【机器学习】如何通过机器学习预测维护设备？

【机器学习】如何通过机器学习预测维护设备？

产业智能官

16+阅读 · 2018年7月9日

腾讯：机器学习构建通用的数据异常检测平台

腾讯：机器学习构建通用的数据异常检测平台

全球人工智能

11+阅读 · 2018年5月1日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

机会物联网基于命名数据网络的信息检索机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

Contrastive Continual Learning for Model Adaptability in Internet of Things

Arxiv

0+阅读 · 2月4日

Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning

Arxiv

0+阅读 · 2月4日

CNN-based IoT Device Identification: A Comparative Study on Payload vs. Fingerprint

Arxiv

0+阅读 · 1月27日

Latent Diffusion for Internet of Things Attack Data Generation in Intrusion Detection

Arxiv

0+阅读 · 1月23日

CONTEX-T: Contextual Privacy Exploitation via Transformer Spectral Analysis for IoT Device Fingerprinting

Arxiv

0+阅读 · 1月22日

Towards Online Malware Detection using Process Resource Utilization Metrics

Arxiv

0+阅读 · 1月15日

SecureDyn-FL: A Robust Privacy-Preserving Federated Learning Framework for Intrusion Detection in IoT Networks

Arxiv

0+阅读 · 1月10日

Developing and Evaluating Lightweight Cryptographic Algorithms for Secure Embedded Systems in IoT Devices

Arxiv

0+阅读 · 1月6日

Byzantine-Robust Federated Learning Framework with Post-Quantum Secure Aggregation for Real-Time Threat Intelligence Sharing in Critical IoT Infrastructure

Arxiv

0+阅读 · 1月3日

Cyberscurity Threats and Defense Mechanisms in IoT network

Arxiv

0+阅读 · 1月2日

VIP会员

文章信息

相关主题

机器学习模型

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

0+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

0+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

8+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

4+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

2+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

6+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

6+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

11+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

6+阅读 · 7月25日

相关VIP内容

《国防和安全系统中的物联网 (IoT)：文献综述》

《国防和安全系统中的物联网 (IoT)：文献综述》

专知会员服务

34+阅读 · 2023年11月22日

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

《利用边缘计算为物联网系统提供分布式智能》2023最新博士论文

专知会员服务

50+阅读 · 2023年10月30日

《通过网络隐蔽渠道开发物联网》74页论文

《通过网络隐蔽渠道开发物联网》74页论文

专知会员服务

31+阅读 · 2023年10月28日

《采用多学科方法开展物联网 (IoT) 网络安全研究，培养预备役军官学生的研究能力》114页报告

《采用多学科方法开展物联网 (IoT) 网络安全研究，培养预备役军官学生的研究能力》114页报告

专知会员服务

22+阅读 · 2023年8月14日

《物联网的军事应用：基于士兵可穿戴设备增强战场空间态势感知》挪威奥斯陆大学186页论文

《物联网的军事应用：基于士兵可穿戴设备增强战场空间态势感知》挪威奥斯陆大学186页论文

专知会员服务

68+阅读 · 2023年1月12日

【卡迪夫大学2022博士论文】《智能家居物联网生态系统中网络攻击的检测和防御》221页

【卡迪夫大学2022博士论文】《智能家居物联网生态系统中网络攻击的检测和防御》221页

专知会员服务

31+阅读 · 2022年8月31日

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

普渡大学2022年博士论文《构建智能物联网边缘：使用深度强化学习平衡安全性和功能性》

专知会员服务

48+阅读 · 2022年4月9日

对抗机器学习在网络入侵检测领域的应用

对抗机器学习在网络入侵检测领域的应用

专知会员服务

35+阅读 · 2022年1月4日

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

【论文推荐】基于机器学习的5G网络异常检测，Machine Learning based Anomaly Detection for 5G Networks

专知会员服务

36+阅读 · 2020年3月12日

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

深度学习增强物联网应用调查，A Survey on Deep Learning Empowered IoT Applications

专知会员服务

44+阅读 · 2019年12月29日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

【2022新书】决策支持系统的机器学习和概率图模型，330页pdf

【2022新书】决策支持系统的机器学习和概率图模型，330页pdf

专知

32+阅读 · 2022年7月18日

「工业物联网异常检测技术」最新2022研究综述

「工业物联网异常检测技术」最新2022研究综述

专知

12+阅读 · 2022年5月3日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

AIoT重磅报告：四大关键助力，AI+IoT重新定义未来的可能性【附下载】

物联网智库

13+阅读 · 2019年5月8日

联邦学习或将助力IoT走出“数据孤岛”？

联邦学习或将助力IoT走出“数据孤岛”？

中国计算机学会

20+阅读 · 2019年3月16日

我所了解的物联网设备测试方法（硬件篇）

我所了解的物联网设备测试方法（硬件篇）

FreeBuf

12+阅读 · 2019年2月12日

【机器学习】如何通过机器学习预测维护设备？

【机器学习】如何通过机器学习预测维护设备？

产业智能官

16+阅读 · 2018年7月9日

腾讯：机器学习构建通用的数据异常检测平台

腾讯：机器学习构建通用的数据异常检测平台

全球人工智能

11+阅读 · 2018年5月1日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

相关论文

Contrastive Continual Learning for Model Adaptability in Internet of Things

Arxiv

0+阅读 · 2月4日

Dynamic and Distributed Routing in IoT Networks based on Multi-Objective Q-Learning

Arxiv

0+阅读 · 2月4日

CNN-based IoT Device Identification: A Comparative Study on Payload vs. Fingerprint

Arxiv

0+阅读 · 1月27日

Latent Diffusion for Internet of Things Attack Data Generation in Intrusion Detection

Arxiv

0+阅读 · 1月23日

CONTEX-T: Contextual Privacy Exploitation via Transformer Spectral Analysis for IoT Device Fingerprinting

Arxiv

0+阅读 · 1月22日

Towards Online Malware Detection using Process Resource Utilization Metrics

Arxiv

0+阅读 · 1月15日

SecureDyn-FL: A Robust Privacy-Preserving Federated Learning Framework for Intrusion Detection in IoT Networks

Arxiv

0+阅读 · 1月10日

Developing and Evaluating Lightweight Cryptographic Algorithms for Secure Embedded Systems in IoT Devices

Arxiv

0+阅读 · 1月6日

Byzantine-Robust Federated Learning Framework with Post-Quantum Secure Aggregation for Real-Time Threat Intelligence Sharing in Critical IoT Infrastructure

Arxiv

0+阅读 · 1月3日

Cyberscurity Threats and Defense Mechanisms in IoT network

Arxiv

0+阅读 · 1月2日

相关基金

物联网安全搜索技术研究

国家自然科学基金

3+阅读 · 2017年12月31日

支持智能终端通信的物联网管控机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向应用商店的移动智能终端恶意软件检测关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

机会物联网基于命名数据网络的信息检索机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员