Pianoroll-Event: A Novel Score Representation for Symbolic Music - 专知论文

会员服务 ·

0

表示 · 事件 · 音乐 · 结构 · 新型 ·

Pianoroll-Event: A Novel Score Representation for Symbolic Music

翻译：Pianoroll-Event：一种用于符号音乐的新型乐谱表示法

Lekai Qian,Haoyu Gu,Dehan Li,Boyu Cao,Qi Liu

Symbolic music representation is a fundamental challenge in computational musicology. While grid-based representations effectively preserve pitch-time spatial correspondence, their inherent data sparsity leads to low encoding efficiency. Discrete-event representations achieve compact encoding but fail to adequately capture structural invariance and spatial locality. To address these complementary limitations, we propose Pianoroll-Event, a novel encoding scheme that describes pianoroll representations through events, combining structural properties with encoding efficiency while maintaining temporal dependencies and local spatial patterns. Specifically, we design four complementary event types: Frame Events for temporal boundaries, Gap Events for sparse regions, Pattern Events for note patterns, and Musical Structure Events for musical metadata. Pianoroll-Event strikes an effective balance between sequence length and vocabulary size, improving encoding efficiency by 1.36\times to 7.16\times over representative discrete sequence methods. Experiments across multiple autoregressive architectures show models using our representation consistently outperform baselines in both quantitative and human evaluations.

翻译：符号音乐表示是计算音乐学中的一个基本挑战。基于网格的表示法能有效保留音高-时间的空间对应关系，但其固有的数据稀疏性导致编码效率低下。离散事件表示法实现了紧凑编码，但未能充分捕捉结构不变性与空间局部性。为应对这些互补的局限性，我们提出Pianoroll-Event，一种新颖的编码方案，通过事件来描述钢琴卷帘表示，将结构特性与编码效率相结合，同时保持时间依赖性与局部空间模式。具体而言，我们设计了四种互补的事件类型：用于时间边界的帧事件、用于稀疏区域的间隙事件、用于音符模式的模式事件以及用于音乐元数据的音乐结构事件。Pianoroll-Event在序列长度与词汇量大小之间实现了有效平衡，相较于代表性的离散序列方法，编码效率提升了1.36倍至7.16倍。在多种自回归架构上的实验表明，使用我们表示法的模型在定量评估与人工评估中均持续优于基线方法。

0

相关内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

连续表示方法、理论与应用：综述与前瞻

连续表示方法、理论与应用：综述与前瞻

专知会员服务

23+阅读 · 2025年5月28日

【AAAI2025】利用大型语言模型引导异构图表示学习：一种通用方法

【AAAI2025】利用大型语言模型引导异构图表示学习：一种通用方法

专知会员服务

25+阅读 · 2024年12月12日

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

专知会员服务

17+阅读 · 2024年11月20日

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

专知会员服务

102+阅读 · 2022年1月5日

事件图谱的构建、推理与应用

专知会员服务

129+阅读 · 2021年6月12日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

专知会员服务

10+阅读 · 2019年11月16日

【ISMIR 2019】Generating Music with GANs: An Overview and Case Studies(GANs生成音乐：概述和案例研究)，中国科学院 Yi-Hsuan Yang

【ISMIR 2019】Generating Music with GANs: An Overview and Case Studies(GANs生成音乐：概述和案例研究)，中国科学院 Yi-Hsuan Yang

专知会员服务

23+阅读 · 2019年11月4日

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

专知

11+阅读 · 2022年11月3日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知

12+阅读 · 2022年4月15日

事理图谱：事件演化的规律和模式

事理图谱：事件演化的规律和模式

哈工大SCIR

34+阅读 · 2019年7月19日

清华大学唐杰老师WWW2019网络表示学习教程-NE、GNN，500页ppt

清华大学唐杰老师WWW2019网络表示学习教程-NE、GNN，500页ppt

专知

71+阅读 · 2019年5月17日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

使用 FastAI 和即时频率变换进行音频分类

使用 FastAI 和即时频率变换进行音频分类

AI研习社

11+阅读 · 2019年5月9日

干货 | Github项目推荐： GANSynth: 用GANs创作音乐

干货 | Github项目推荐： GANSynth: 用GANs创作音乐

AI科技评论

10+阅读 · 2019年3月2日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

图的弦性计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

音乐哲理性概念的加工及其神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于波内频率调制的音色模型研究以及在单通道音源分离中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向二进制程序的静态结构化符号执行与动态组合方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广东话背景的失乐症者声调和音乐的发声和感知

国家自然科学基金

0+阅读 · 2015年12月31日

符号网络理论研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

Structure-Aware Piano Accompaniment via Style Planning and Dataset-Aligned Pattern Retrieval

Arxiv

0+阅读 · 2月16日

AudioRAG: A Challenging Benchmark for Audio Reasoning and Information Retrieval

Arxiv

0+阅读 · 2月11日

Stemphonic: All-at-once Flexible Multi-stem Music Generation

Arxiv

0+阅读 · 2月10日

D3PIA: A Discrete Denoising Diffusion Model for Piano Accompaniment Generation From Lead sheet

Arxiv

0+阅读 · 2月3日

Trade-offs between structural richness and communication efficiency in music network representations

Arxiv

0+阅读 · 1月31日

MIDI-LLaMA: An Instruction-Following Multimodal LLM for Symbolic Music Understanding

Arxiv

0+阅读 · 1月29日

MusicWeaver: Composer-Style Structural Editing and Minute-Scale Coherent Music Generation

Arxiv

0+阅读 · 1月29日

MotionBeat: Motion-Aligned Music Representation via Embodied Contrastive Learning and Bar-Equivariant Contact-Aware Encoding

Arxiv

0+阅读 · 1月29日

Etude: Piano Cover Generation with a Three-Stage Approach -- Extract, strucTUralize, and DEcode

Arxiv

0+阅读 · 1月23日

VidTune: Creating Video Soundtracks with Generative Music and Contextual Thumbnails

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

连续表示方法、理论与应用：综述与前瞻

连续表示方法、理论与应用：综述与前瞻

专知会员服务

23+阅读 · 2025年5月28日

【AAAI2025】利用大型语言模型引导异构图表示学习：一种通用方法

【AAAI2025】利用大型语言模型引导异构图表示学习：一种通用方法

专知会员服务

25+阅读 · 2024年12月12日

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

【博士论文】提高预训练文本生成音乐模型的可控性和可编辑性

专知会员服务

17+阅读 · 2024年11月20日

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

什么是事件知识图谱？中科院计算所发布《事件知识图谱综述》论文，阐述从历史、本体、实例和应用视角定义EKG

专知会员服务

102+阅读 · 2022年1月5日

事件图谱的构建、推理与应用

专知会员服务

129+阅读 · 2021年6月12日

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

斯坦福大学李飞飞组发布Action Genome:一种新的表达形式，新的数据集，以及将动作分解成时空场景图的新模型

专知会员服务

40+阅读 · 2020年1月12日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

专知会员服务

10+阅读 · 2019年11月16日

【ISMIR 2019】Generating Music with GANs: An Overview and Case Studies(GANs生成音乐：概述和案例研究)，中国科学院 Yi-Hsuan Yang

【ISMIR 2019】Generating Music with GANs: An Overview and Case Studies(GANs生成音乐：概述和案例研究)，中国科学院 Yi-Hsuan Yang

专知会员服务

23+阅读 · 2019年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

推荐！【F16模型：符号系统、模型提取、异常检测和形式化方法】《利用符号表示实现安全可靠学习》美空军2022最新107页技术报告

专知

11+阅读 · 2022年11月3日

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

【2022新书】谱图理论，Spectral Graph Theory，100页pdf

专知

12+阅读 · 2022年4月15日

事理图谱：事件演化的规律和模式

事理图谱：事件演化的规律和模式

哈工大SCIR

34+阅读 · 2019年7月19日

清华大学唐杰老师WWW2019网络表示学习教程-NE、GNN，500页ppt

清华大学唐杰老师WWW2019网络表示学习教程-NE、GNN，500页ppt

专知

71+阅读 · 2019年5月17日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

使用 FastAI 和即时频率变换进行音频分类

使用 FastAI 和即时频率变换进行音频分类

AI研习社

11+阅读 · 2019年5月9日

干货 | Github项目推荐： GANSynth: 用GANs创作音乐

干货 | Github项目推荐： GANSynth: 用GANs创作音乐

AI科技评论

10+阅读 · 2019年3月2日

网络表示学习介绍

网络表示学习介绍

人工智能前沿讲习班

18+阅读 · 2018年11月26日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关论文

Structure-Aware Piano Accompaniment via Style Planning and Dataset-Aligned Pattern Retrieval

Arxiv

0+阅读 · 2月16日

AudioRAG: A Challenging Benchmark for Audio Reasoning and Information Retrieval

Arxiv

0+阅读 · 2月11日

Stemphonic: All-at-once Flexible Multi-stem Music Generation

Arxiv

0+阅读 · 2月10日

D3PIA: A Discrete Denoising Diffusion Model for Piano Accompaniment Generation From Lead sheet

Arxiv

0+阅读 · 2月3日

Trade-offs between structural richness and communication efficiency in music network representations

Arxiv

0+阅读 · 1月31日

MIDI-LLaMA: An Instruction-Following Multimodal LLM for Symbolic Music Understanding

Arxiv

0+阅读 · 1月29日

MusicWeaver: Composer-Style Structural Editing and Minute-Scale Coherent Music Generation

Arxiv

0+阅读 · 1月29日

MotionBeat: Motion-Aligned Music Representation via Embodied Contrastive Learning and Bar-Equivariant Contact-Aware Encoding

Arxiv

0+阅读 · 1月29日

Etude: Piano Cover Generation with a Three-Stage Approach -- Extract, strucTUralize, and DEcode

Arxiv

0+阅读 · 1月23日

VidTune: Creating Video Soundtracks with Generative Music and Contextual Thumbnails

Arxiv

0+阅读 · 1月17日

相关基金

牵制控制框架下符号网络的群体行为研究

国家自然科学基金

2+阅读 · 2017年12月31日

图的弦性计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于内容分析的低复杂度高效视频编码方法

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

音乐哲理性概念的加工及其神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

基于波内频率调制的音色模型研究以及在单通道音源分离中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向二进制程序的静态结构化符号执行与动态组合方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

广东话背景的失乐症者声调和音乐的发声和感知

国家自然科学基金

0+阅读 · 2015年12月31日

符号网络理论研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员