APEX: Large-scale Multi-task Aesthetic-Informed Popularity Prediction for AI-Generated Music - 专知论文

会员服务 ·

0

音乐 · 流行度 · AI · 流行度预测 · 艺术 ·

APEX: Large-scale Multi-task Aesthetic-Informed Popularity Prediction for AI-Generated Music

翻译：APEX：面向AI生成音乐的大规模多任务美学感知流行度预测

Jaavid Aktar Husain,Dorien Herremans

Music popularity prediction has attracted growing research interest, with relevance to artists, platforms, and recommendation systems. However, the explosive rise of AI-generated music platforms has created an entirely new and largely unexplored landscape, where a surge of songs is produced and consumed daily without the traditional markers of artist reputation or label backing. Key, yet unexplored in this pursuit is aesthetic quality. We propose APEX, the first large-scale multi-task learning framework for AI-generated music, trained on over 211k songs (10k hours of audio) from Suno and Udio, that jointly predicts engagement-based popularity signals - streams and likes scores - alongside five perceptual aesthetic quality dimensions from frozen audio embeddings extracted from MERT, a self-supervised music understanding model. Aesthetic quality and popularity capture complementary aspects of music that together prove valuable: in an out-of-distribution evaluation on the Music Arena dataset, comprising pairwise human preference battles across eleven generative music systems unseen during training, including aesthetic features consistently improves preference prediction, demonstrating strong generalisation of the learned representations across generative architectures.

翻译：音乐流行度预测因与艺术家、平台及推荐系统的关联性而日益受到研究关注。然而，AI生成音乐平台的爆炸式发展开创了一个全新且尚未充分探索的领域——每日涌现并消费的海量歌曲缺乏传统艺术家声誉或厂牌背书等标志性特征。在此探索中，美学质量作为关键维度仍属研究空白。我们提出APEX，首个面向AI生成音乐的大规模多任务学习框架，基于从Suno和Udio获取的21.1万首歌曲（1万小时音频）进行训练，该框架联合预测基于参与度的流行度信号（播放量与点赞分数），同时从自监督音乐理解模型MERT提取的冻结音频嵌入中预测五维感知美学质量。美学质量与流行度捕捉了音乐中互相补充的互补维度：在面向Music Arena数据集的分布外评估中（该数据集涵盖训练阶段未见过的十一个生成音乐系统间的成对人类偏好对抗），融入美学特征可持续提升偏好预测性能，证明所学表征在各类生成架构间具备强泛化能力。

0

相关内容

音乐，广义而言，指精心组织声音，并将其排布在时间和空间上的艺术类型。

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

专知会员服务

38+阅读 · 2025年6月23日

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

专知会员服务

17+阅读 · 2024年11月20日

《AI生成视频评估综述》

《AI生成视频评估综述》

专知会员服务

28+阅读 · 2024年10月30日

生成式AI+视频行业深度报告：AI+视频的星辰大海远不止于创意视频的生成

生成式AI+视频行业深度报告：AI+视频的星辰大海远不止于创意视频的生成

专知会员服务

25+阅读 · 2024年7月30日

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

专知会员服务

24+阅读 · 2024年6月29日

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

专知会员服务

37+阅读 · 2024年4月17日

生成式人工智能行业专题研究：海外大模型篇：生成式AI加速创新，行业迎历史性机遇

生成式人工智能行业专题研究：海外大模型篇：生成式AI加速创新，行业迎历史性机遇

专知会员服务

68+阅读 · 2024年3月29日

全球生成式AI应用全景图：AI应用进入大爆发时代，95页pdf

全球生成式AI应用全景图：AI应用进入大爆发时代，95页pdf

专知会员服务

124+阅读 · 2023年9月7日

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

45+阅读 · 2022年3月1日

基于深度学习的流行度预测研究综述

专知会员服务

48+阅读 · 2021年3月24日

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

专知

62+阅读 · 2022年9月7日

带你动手搭建一个音乐推荐系统

带你动手搭建一个音乐推荐系统

机器学习与推荐算法

11+阅读 · 2020年7月14日

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

AI100

17+阅读 · 2019年9月14日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

爱奇艺基于AI的移动端自动化测试框架的设计

爱奇艺基于AI的移动端自动化测试框架的设计

前端之巅

18+阅读 · 2019年2月27日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

推荐｜网易云音乐分析之推荐算法

推荐｜网易云音乐分析之推荐算法

人人都是产品经理

10+阅读 · 2018年2月26日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

阿里巴巴：Representation Learning在优酷个性化搜索排序中的应用

阿里巴巴：Representation Learning在优酷个性化搜索排序中的应用

菜鸟的机器学习

14+阅读 · 2017年11月9日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多标签流形学习的中国古典音乐情感分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社交媒体地理大数据的可感知情境的个性化旅游推荐研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

海量数据流实时分发技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

MVAD: A Benchmark Dataset for Multimodal AI-Generated Video-Audio Detection

Arxiv

0+阅读 · 6月12日

Mood-Aware Music Recommendation: Integrating User Affective Signals into Ranking Systems

Arxiv

0+阅读 · 6月11日

DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities

Arxiv

0+阅读 · 6月2日

SketchSong: Hierarchical Song Generation with Sketch Planning and Fine-Grained Multi-Track Modeling

Arxiv

0+阅读 · 6月2日

HAIM: Human-AI Music Datasets for AI Music Production Tracking Benchmark

Arxiv

0+阅读 · 6月1日

Multimodal Music Recommendation System using LLMs

Arxiv

0+阅读 · 5月28日

MuChator: Enabling Active Music Discovery via Conversational Music LLMs in Douyin Music

Arxiv

0+阅读 · 5月26日

MusicDET: Zero-Shot AI-Generated Music Detection

Arxiv

0+阅读 · 5月18日

MindMelody: A Closed-Loop EEG-Driven System for Personalized Music Intervention

Arxiv

0+阅读 · 5月16日

ONOTE: Benchmarking Omnimodal Notation Processing for Expert-level Music Intelligence

Arxiv

0+阅读 · 4月22日

VIP会员

文章信息

相关主题

流行度预测

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

0+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

4+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

生成式人工智能时代的多目标推荐：最新进展与未来展望综述

专知会员服务

38+阅读 · 2025年6月23日

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

专知会员服务

17+阅读 · 2024年11月20日

《AI生成视频评估综述》

《AI生成视频评估综述》

专知会员服务

28+阅读 · 2024年10月30日

生成式AI+视频行业深度报告：AI+视频的星辰大海远不止于创意视频的生成

生成式AI+视频行业深度报告：AI+视频的星辰大海远不止于创意视频的生成

专知会员服务

25+阅读 · 2024年7月30日

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

AI产业系列深度报告（一）：生成式AI多领域落地，赋能传媒行业发展

专知会员服务

24+阅读 · 2024年6月29日

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

【大模型+搜索】AI搜索行业深度：大模型催生搜索行业变革机遇，产品百花齐放效果几何

专知会员服务

37+阅读 · 2024年4月17日

生成式人工智能行业专题研究：海外大模型篇：生成式AI加速创新，行业迎历史性机遇

生成式人工智能行业专题研究：海外大模型篇：生成式AI加速创新，行业迎历史性机遇

专知会员服务

68+阅读 · 2024年3月29日

全球生成式AI应用全景图：AI应用进入大爆发时代，95页pdf

全球生成式AI应用全景图：AI应用进入大爆发时代，95页pdf

专知会员服务

124+阅读 · 2023年9月7日

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

AI换脸、合成语音大爆发！清华《深度合成十大趋势报告（2022）》发布

专知会员服务

45+阅读 · 2022年3月1日

基于深度学习的流行度预测研究综述

专知会员服务

48+阅读 · 2021年3月24日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

专知

62+阅读 · 2022年9月7日

带你动手搭建一个音乐推荐系统

带你动手搭建一个音乐推荐系统

机器学习与推荐算法

11+阅读 · 2020年7月14日

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

MediaPipe：Google Research 开源的跨平台多媒体机器学习模型应用框架

AI100

17+阅读 · 2019年9月14日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

爱奇艺基于AI的移动端自动化测试框架的设计

爱奇艺基于AI的移动端自动化测试框架的设计

前端之巅

18+阅读 · 2019年2月27日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

推荐｜网易云音乐分析之推荐算法

推荐｜网易云音乐分析之推荐算法

人人都是产品经理

10+阅读 · 2018年2月26日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

阿里巴巴：Representation Learning在优酷个性化搜索排序中的应用

阿里巴巴：Representation Learning在优酷个性化搜索排序中的应用

菜鸟的机器学习

14+阅读 · 2017年11月9日

相关论文

MVAD: A Benchmark Dataset for Multimodal AI-Generated Video-Audio Detection

Arxiv

0+阅读 · 6月12日

Mood-Aware Music Recommendation: Integrating User Affective Signals into Ranking Systems

Arxiv

0+阅读 · 6月11日

DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities

Arxiv

0+阅读 · 6月2日

SketchSong: Hierarchical Song Generation with Sketch Planning and Fine-Grained Multi-Track Modeling

Arxiv

0+阅读 · 6月2日

HAIM: Human-AI Music Datasets for AI Music Production Tracking Benchmark

Arxiv

0+阅读 · 6月1日

Multimodal Music Recommendation System using LLMs

Arxiv

0+阅读 · 5月28日

MuChator: Enabling Active Music Discovery via Conversational Music LLMs in Douyin Music

Arxiv

0+阅读 · 5月26日

MusicDET: Zero-Shot AI-Generated Music Detection

Arxiv

0+阅读 · 5月18日

MindMelody: A Closed-Loop EEG-Driven System for Personalized Music Intervention

Arxiv

0+阅读 · 5月16日

ONOTE: Benchmarking Omnimodal Notation Processing for Expert-level Music Intelligence

Arxiv

0+阅读 · 4月22日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多标签流形学习的中国古典音乐情感分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社交媒体地理大数据的可感知情境的个性化旅游推荐研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

海量数据流实时分发技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

短波认知ALE系统中基于深度学习-GP混合模型的多维谱预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员