Ensemble methods are frequently used in recommender systems to improve accuracy by combining multiple models. Recent work reports sizable performance gains, but most studies still optimize primarily for accuracy and robustness rather than for energy efficiency. This paper measures accuracy energy trade offs of ensemble techniques relative to strong single models. We run 93 controlled experiments in two pipelines: 1. explicit rating prediction with Surprise (RMSE) and 2. implicit feedback ranking with LensKit (NDCG@10). We evaluate four datasets ranging from 100,000 to 7.8 million interactions (MovieLens 100K, MovieLens 1M, ModCloth, Anime). We compare four ensemble strategies (Average, Weighted, Stacking or Rank Fusion, Top Performers) against baselines and optimized single models. Whole system energy is measured with EMERS using a smart plug and converted to CO2 equivalents. Across settings, ensembles improve accuracy by 0.3% to 5.7% while increasing energy by 19% to 2,549%. On MovieLens 1M, a Top Performers ensemble improves RMSE by 0.96% at an 18.8% energy overhead over SVD++. On MovieLens 100K, an averaging ensemble improves NDCG@10 by 5.7% with 103% additional energy. On Anime, a Surprise Top Performers ensemble improves RMSE by 1.2% but consumes 2,005% more energy (0.21 vs. 0.01 Wh), increasing emissions from 2.6 to 53.8 mg CO2 equivalents, and LensKit ensembles fail due to memory limits. Overall, selective ensembles are more energy efficient than exhaustive averaging,


翻译:集成方法常被用于推荐系统,通过组合多个模型来提升准确率。近期研究报告了显著的性能提升,但多数研究仍主要针对准确性和鲁棒性进行优化,而非能效。本文衡量了集成技术相对于强单模型的准确率-能耗权衡。我们在两个流程中开展了93项受控实验:1. 使用Surprise(RMSE)进行显式评分预测;2. 使用LensKit(NDCG@10)进行隐式反馈排序。我们评估了四个数据集,交互量从10万到780万不等(MovieLens 100K、MovieLens 1M、ModCloth、Anime)。我们比较了四种集成策略(平均法、加权法、堆叠或排名融合、最佳模型组合)与基线及优化后的单模型。使用EMERS通过智能插头测量系统整体能耗,并转换为二氧化碳当量。在不同设置下,集成方法将准确率提升0.3%至5.7%,同时能耗增加19%至2549%。在MovieLens 1M上,最佳模型组合集成相对于SVD++以18.8%的能耗开销将RMSE提升0.96%。在MovieLens 100K上,平均集成法以103%的额外能耗将NDCG@10提升5.7%。在Anime上,Surprise最佳模型组合集成将RMSE提升1.2%,但能耗增加2005%(0.21瓦时对比0.01瓦时),排放量从2.6毫克二氧化碳当量增至53.8毫克,而LensKit集成因内存限制失败。总体而言,选择性集成比穷举平均法更具能效优势。

0
下载
关闭预览

相关内容

推荐系统融合排序的多目标寻优技术
专知会员服务
19+阅读 · 2024年8月17日
智能集群系统的强化学习方法综述
专知会员服务
84+阅读 · 2024年1月1日
【2023新书】机器学习集成方法,354页pdf
专知会员服务
184+阅读 · 2023年4月11日
【2022新书】基于概率知识系统的知识集成方法,203页pdf
专知会员服务
51+阅读 · 2022年12月28日
【2023新书】机器学习集成方法,354页pdf
专知
40+阅读 · 2023年4月11日
推荐系统产品与算法概述 | 深度
AI100
11+阅读 · 2019年6月13日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
新书推荐《推荐系统进展:方法与技术》
LibRec智能推荐
13+阅读 · 2019年3月18日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐系统算法合集,满满都是干货(建议收藏)
七月在线实验室
17+阅读 · 2018年7月23日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
《特种部队在透明战场中的生存力》最新报告
专知会员服务
0+阅读 · 20分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
7+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
【2023新书】机器学习集成方法,354页pdf
专知
40+阅读 · 2023年4月11日
推荐系统产品与算法概述 | 深度
AI100
11+阅读 · 2019年6月13日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
新书推荐《推荐系统进展:方法与技术》
LibRec智能推荐
13+阅读 · 2019年3月18日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐系统算法合集,满满都是干货(建议收藏)
七月在线实验室
17+阅读 · 2018年7月23日
推荐|机器学习中的模型评价、模型选择和算法选择!
全球人工智能
10+阅读 · 2018年2月5日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员