面向资源受限零售销售预测的LSTM神经网络优化：一项模型压缩研究 (Optimizing LSTM Neural Networks for Resource-Constrained Retail Sales Forecasting: A Model Compression Study) - 专知论文

会员服务 ·

0

长短期记忆网络 · 单元 · 精度 · 模型压缩 · 资源受限 ·

Optimizing LSTM Neural Networks for Resource-Constrained Retail Sales Forecasting: A Model Compression Study

翻译：面向资源受限零售销售预测的LSTM神经网络优化：一项模型压缩研究

Ravi Teja Pagidoju

from arxiv, Accepted to IEEE ICUIS 2025 (International Conference on Ubiquitous and Intelligent Systems). 5 pages, 3 figures, 1 table

Standard LSTM(Long Short-Term Memory) neural networks provide accurate predictions for sales data in the retail industry, but require a lot of computing power. It can be challenging especially for mid to small retail industries. This paper examines LSTM model compression by gradually reducing the number of hidden units from 128 to 16. We used the Kaggle Store Item Demand Forecasting dataset, which has 913,000 daily sales records from 10 stores and 50 items, to look at the trade-off between model size and how accurate the predictions are. Experiments show that lowering the number of hidden LSTM units to 64 maintains the same level of accuracy while also improving it. The mean absolute percentage error (MAPE) ranges from 23.6% for the full 128-unit model to 12.4% for the 64-unit model. The optimized model is 73% smaller (from 280KB to 76KB) and 47% more accurate. These results show that larger models do not always achieve better results.

翻译：标准LSTM（长短期记忆）神经网络可为零售业销售数据提供精准预测，但其计算资源需求较高，对中小型零售企业而言尤为困难。本研究通过将隐藏单元数量从128逐步减少至16，系统探讨了LSTM模型压缩方法。我们采用Kaggle商店商品需求预测数据集（包含10家商店、50种商品的913,000条日销售记录），深入分析了模型规模与预测精度之间的权衡关系。实验表明：将LSTM隐藏单元降至64时，模型在保持原有精度的同时实现了性能提升——完整128单元模型的平均绝对百分比误差（MAPE）为23.6%，而64单元模型降至12.4%。优化后的模型体积缩小73%（从280KB减至76KB），精度提升47%。这些结果表明：更大规模的模型并不总能获得更优性能。

0

相关内容

长短期记忆网络

长短期记忆网络

长短期记忆网络(LSTM)是一种用于深度学习领域的人工回归神经网络(RNN)结构。与标准的前馈神经网络不同，LSTM具有反馈连接。它不仅可以处理单个数据点(如图像)，还可以处理整个数据序列(如语音或视频)。例如，LSTM适用于未分段、连接的手写识别、语音识别、网络流量或IDSs(入侵检测系统)中的异常检测等任务。

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

专知会员服务

23+阅读 · 2025年3月22日

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

专知会员服务

28+阅读 · 2025年3月16日

基于深度学习的网络流量预测研究综述

专知会员服务

40+阅读 · 2021年5月30日

【AAAI2021】利用深度元学习对城市销量进行预测

专知会员服务

36+阅读 · 2021年1月16日

深度神经网络模型压缩综述

专知会员服务

117+阅读 · 2020年8月22日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

专知会员服务

52+阅读 · 2020年1月1日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

干货 | 循环神经网络（RNN）和LSTM初学者指南

干货 | 循环神经网络（RNN）和LSTM初学者指南

THU数据派

15+阅读 · 2019年1月25日

使用LSTM模型预测股价基于Keras

使用LSTM模型预测股价基于Keras

量化投资与机器学习

35+阅读 · 2018年11月17日

基于LSTM深层神经网络的时间序列预测

基于LSTM深层神经网络的时间序列预测

论智

22+阅读 · 2018年9月4日

一文详解LSTM网络

一文详解LSTM网络

论智

18+阅读 · 2018年5月2日

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

机器学习研究会

11+阅读 · 2018年1月14日

深度学习基础之LSTM

深度学习基础之LSTM

全球人工智能

29+阅读 · 2017年12月18日

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

机器学习研究会

11+阅读 · 2017年12月5日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑价格歧视和广告效应的网络团购销售策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

社会性预期优势效应的神经机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasting

Arxiv

0+阅读 · 1月28日

Clustering-driven Memory Compression for On-device Large Language Models

Arxiv

0+阅读 · 1月24日

Forecasting Energy Consumption using Recurrent Neural Networks: A Comparative Analysis

Arxiv

0+阅读 · 1月23日

ReLU Networks for Model Predictive Control: Network Complexity and Performance Guarantees

Arxiv

0+阅读 · 1月23日

StoxLSTM: A Stochastic Extended Long Short-Term Memory Network for Time Series Forecasting

Arxiv

0+阅读 · 1月22日

Rethinking Recurrent Neural Networks for Time Series Forecasting: A Reinforced Recurrent Encoder with Prediction-Oriented Proximal Policy Optimization

Arxiv

0+阅读 · 1月13日

Stock Market Price Prediction using Neural Prophet with Deep Neural Network

Stock Market Price Prediction using Neural Prophet with Deep Neural Network

Arxiv

0+阅读 · 1月8日

A Data-Driven Predictive Framework for Inventory Optimization Using Context-Augmented Machine Learning Models

Arxiv

0+阅读 · 1月8日

Rethinking Recurrent Neural Networks for Time Series Forecasting: A Reinforced Recurrent Encoder with Prediction-Oriented Proximal Policy Optimization

Arxiv

0+阅读 · 1月7日

MemHunter: Automated and Verifiable Memorization Detection at Dataset-scale in LLMs

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

长短期记忆网络

相关VIP内容

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

专知会员服务

23+阅读 · 2025年3月22日

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

专知会员服务

28+阅读 · 2025年3月16日

基于深度学习的网络流量预测研究综述

专知会员服务

40+阅读 · 2021年5月30日

【AAAI2021】利用深度元学习对城市销量进行预测

专知会员服务

36+阅读 · 2021年1月16日

深度神经网络模型压缩综述

专知会员服务

117+阅读 · 2020年8月22日

紧凑的神经网络模型设计研究综述

专知会员服务

74+阅读 · 2020年5月21日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

专知会员服务

52+阅读 · 2020年1月1日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

深度神经网络模型压缩与加速综述

深度神经网络模型压缩与加速综述

专知会员服务

130+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

实例：教你使用简单神经网络和LSTM进行时间序列预测（附代码）

数据分析

28+阅读 · 2019年5月23日

干货 | 循环神经网络（RNN）和LSTM初学者指南

干货 | 循环神经网络（RNN）和LSTM初学者指南

THU数据派

15+阅读 · 2019年1月25日

使用LSTM模型预测股价基于Keras

使用LSTM模型预测股价基于Keras

量化投资与机器学习

35+阅读 · 2018年11月17日

基于LSTM深层神经网络的时间序列预测

基于LSTM深层神经网络的时间序列预测

论智

22+阅读 · 2018年9月4日

一文详解LSTM网络

一文详解LSTM网络

论智

18+阅读 · 2018年5月2日

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

【推荐】用TensorFlow实现LSTM社交对话股市情感分析

机器学习研究会

11+阅读 · 2018年1月14日

深度学习基础之LSTM

深度学习基础之LSTM

全球人工智能

29+阅读 · 2017年12月18日

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

机器学习研究会

11+阅读 · 2017年12月5日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

如何在Python中用LSTM网络进行时间序列预测

如何在Python中用LSTM网络进行时间序列预测

AI100

17+阅读 · 2017年8月5日

相关论文

Recurrent Neural Networks with Linear Structures for Electricity Price Forecasting

Arxiv

0+阅读 · 1月28日

Clustering-driven Memory Compression for On-device Large Language Models

Arxiv

0+阅读 · 1月24日

Forecasting Energy Consumption using Recurrent Neural Networks: A Comparative Analysis

Arxiv

0+阅读 · 1月23日

ReLU Networks for Model Predictive Control: Network Complexity and Performance Guarantees

Arxiv

0+阅读 · 1月23日

StoxLSTM: A Stochastic Extended Long Short-Term Memory Network for Time Series Forecasting

Arxiv

0+阅读 · 1月22日

Rethinking Recurrent Neural Networks for Time Series Forecasting: A Reinforced Recurrent Encoder with Prediction-Oriented Proximal Policy Optimization

Arxiv

0+阅读 · 1月13日

Stock Market Price Prediction using Neural Prophet with Deep Neural Network

Stock Market Price Prediction using Neural Prophet with Deep Neural Network

Arxiv

0+阅读 · 1月8日

A Data-Driven Predictive Framework for Inventory Optimization Using Context-Augmented Machine Learning Models

Arxiv

0+阅读 · 1月8日

Rethinking Recurrent Neural Networks for Time Series Forecasting: A Reinforced Recurrent Encoder with Prediction-Oriented Proximal Policy Optimization

Arxiv

0+阅读 · 1月7日

MemHunter: Automated and Verifiable Memorization Detection at Dataset-scale in LLMs

Arxiv

0+阅读 · 1月6日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑价格歧视和广告效应的网络团购销售策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

社会性预期优势效应的神经机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员