A Benchmark for Early-stage Parkinson's Disease Detection from Speech - 专知论文

会员服务 ·

0

基准 · 数据集 · 语音检测 · 划分 · 多维度 ·

A Benchmark for Early-stage Parkinson's Disease Detection from Speech

翻译：早期帕金森病语音检测基准

Terry Yi Zhong,Cristian Tejedor-Garcia,Khiet P. Truong,Janna Maas,Louis ten Bosch,Bastiaan R. Bloem

from arxiv, Submitted to Interspeech2026

Early-stage Parkinson's disease (EarlyPD) detection from speech is clinically meaningful yet underexplored, and published results are hard to compare because studies differ in datasets, languages, tasks, evaluation protocols, and EarlyPD definitions. To address this issue, we propose the first benchmark for speech-based EarlyPD detection, with a speaker-independent split designed for fair and replicable cross-method evaluation on researcher-accessible datasets. The benchmark covers three common speech tasks and evaluates methods under different training-resource settings. We also present multi-dimensional evaluation breakdowns by dataset, aggregation level, gender, and disease stage to support fine-grained comparisons and clinical adoption. Our results provide a replicable reference and actionable insights, encouraging the adoption of this publicly available benchmark to advance robust and clinically meaningful EarlyPD detection from speech.

翻译：从语音中检测早期帕金森病（EarlyPD）具有临床意义却尚未得到充分探索，且已发表的结果难以比较，因为不同研究在数据集、语言、任务、评估协议以及早期帕金森病定义上存在差异。为解决这一问题，我们提出了首个基于语音的早期帕金森病检测基准，该基准采用说话人独立划分，旨在对研究者可获取的数据集进行公平且可复现的跨方法评估。该基准涵盖三种常见语音任务，并在不同训练资源设置下评估方法。我们还提供了按数据集、聚合级别、性别和疾病阶段划分的多维度评估分解，以支持细粒度比较和临床应用。我们的结果为推进稳健且具有临床意义的语音早期帕金森病检测提供了可复现的参考和可行的见解，鼓励采用这一公开基准。

0

相关内容

基于深度学习的小目标检测基准研究进展

基于深度学习的小目标检测基准研究进展

专知会员服务

30+阅读 · 2024年4月30日

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

专知会员服务

17+阅读 · 2023年1月23日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

《人工智能芯片基准测试评估方法》行业标准

《人工智能芯片基准测试评估方法》行业标准

专知会员服务

87+阅读 · 2022年2月20日

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

专知会员服务

12+阅读 · 2022年2月1日

微软《神经语音合成》综述论文，63页pdf530篇文献

微软《神经语音合成》综述论文，63页pdf530篇文献

专知会员服务

30+阅读 · 2021年7月3日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

【开放书】清华大学《语音识别基本法》，215页pdf

【开放书】清华大学《语音识别基本法》，215页pdf

专知会员服务

151+阅读 · 2020年7月29日

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

专知会员服务

18+阅读 · 2020年3月3日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

【开放书】清华大学《语音识别基本法》，215页pdf

【开放书】清华大学《语音识别基本法》，215页pdf

专知

10+阅读 · 2020年7月29日

语音信号处理：从基本算法到前沿的深度学习方法

语音信号处理：从基本算法到前沿的深度学习方法

PaperWeekly

16+阅读 · 2020年3月26日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

书单 | 语音研究进阶指南

书单 | 语音研究进阶指南

微软研究院AI头条

12+阅读 · 2019年3月22日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

语音识别的前沿论文，看我们推荐的这4篇

语音识别的前沿论文，看我们推荐的这4篇

人工智能前沿讲习班

26+阅读 · 2019年1月14日

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

谷歌开发者

16+阅读 · 2018年11月6日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

LPS经鼻暴露对A53T-α-synuclein帕金森小鼠模型发生发展的协同效应及机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于阿尔茨海默症早期诊断的氟标小分子MRI成像用Aβ探针的研究

国家自然科学基金

0+阅读 · 2015年12月31日

褐藻硫酸化甘露葡萄糖醛酸寡糖的构效关系与抗帕金森病机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

早期阿尔茨海默病胼胝体与海马的时空特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

miR-144/451调控帕金森病发生发展的作用及机制

国家自然科学基金

0+阅读 · 2015年12月31日

面向帕金森病的多模态在线预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分析基因组关联研究数据识别阿尔茨海默和帕金森疾病相关的风险位点和遗传通路

国家自然科学基金

0+阅读 · 2014年12月31日

帕金森病大鼠内侧苍白球对丘脑束旁核脑电活动调控及信号通路研究

国家自然科学基金

0+阅读 · 2014年12月31日

大鼠嗅球内病理性α-synuclein传递开启全脑水平的帕金森(PD)样神经退行性病变

国家自然科学基金

1+阅读 · 2014年12月31日

HLA区基因多态性与帕金森病的关联分析及其分子机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

SpeechDx: A Multi-Task Benchmark for Clinical Speech AI

Arxiv

0+阅读 · 6月15日

EEG-FM-Bench: A Comprehensive Benchmark for the Systematic Evaluation and Diagnostic Analyses of EEG Foundation Models

Arxiv

0+阅读 · 6月15日

Unifying Acoustic Features and Text with Multimodal LLMs for Neurodegenerative Screening

Arxiv

0+阅读 · 6月10日

Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention

Arxiv

0+阅读 · 6月8日

Phun-Bench: Evaluating LLMs on Phonological Understanding in Chinese

Arxiv

0+阅读 · 6月5日

A Multimodal Framework for Dementia Detection via Linguistic and Acoustic Representation Learning

Arxiv

0+阅读 · 5月25日

Zero-Shot Parkinson's Disease Detection from Speech: Comparing Large Audio and Language Models

Arxiv

0+阅读 · 5月24日

Speaker-Disentangled Remote Speech Detection of Asthma and COPD Exacerbations

Arxiv

0+阅读 · 5月16日

PROCESS-2: A Benchmark Speech Corpus for Early Cognitive Impairment Detection

Arxiv

0+阅读 · 5月14日

Voice Biomarkers for Depression and Anxiety

Arxiv

0+阅读 · 5月11日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

基于深度学习的小目标检测基准研究进展

基于深度学习的小目标检测基准研究进展

专知会员服务

30+阅读 · 2024年4月30日

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

专知会员服务

17+阅读 · 2023年1月23日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

《人工智能芯片基准测试评估方法》行业标准

《人工智能芯片基准测试评估方法》行业标准

专知会员服务

87+阅读 · 2022年2月20日

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

【AAAI2022】Diaformer: 采用症状序列生成的方式做自动诊断

专知会员服务

12+阅读 · 2022年2月1日

微软《神经语音合成》综述论文，63页pdf530篇文献

微软《神经语音合成》综述论文，63页pdf530篇文献

专知会员服务

30+阅读 · 2021年7月3日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

【开放书】清华大学《语音识别基本法》，215页pdf

【开放书】清华大学《语音识别基本法》，215页pdf

专知会员服务

151+阅读 · 2020年7月29日

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

专知会员服务

18+阅读 · 2020年3月3日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【开放书】清华大学《语音识别基本法》，215页pdf

【开放书】清华大学《语音识别基本法》，215页pdf

专知

10+阅读 · 2020年7月29日

语音信号处理：从基本算法到前沿的深度学习方法

语音信号处理：从基本算法到前沿的深度学习方法

PaperWeekly

16+阅读 · 2020年3月26日

语音情绪识别|声源增强|基频可视化

语音情绪识别|声源增强|基频可视化

深度学习每日摘要

15+阅读 · 2019年5月5日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

书单 | 语音研究进阶指南

书单 | 语音研究进阶指南

微软研究院AI头条

12+阅读 · 2019年3月22日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

语音识别的前沿论文，看我们推荐的这4篇

语音识别的前沿论文，看我们推荐的这4篇

人工智能前沿讲习班

26+阅读 · 2019年1月14日

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

BERT 现已开源：最先进的 NLP 预训练技术，支持中文和更多语言

谷歌开发者

16+阅读 · 2018年11月6日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

相关论文

SpeechDx: A Multi-Task Benchmark for Clinical Speech AI

Arxiv

0+阅读 · 6月15日

EEG-FM-Bench: A Comprehensive Benchmark for the Systematic Evaluation and Diagnostic Analyses of EEG Foundation Models

Arxiv

0+阅读 · 6月15日

Unifying Acoustic Features and Text with Multimodal LLMs for Neurodegenerative Screening

Arxiv

0+阅读 · 6月10日

Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention

Arxiv

0+阅读 · 6月8日

Phun-Bench: Evaluating LLMs on Phonological Understanding in Chinese

Arxiv

0+阅读 · 6月5日

A Multimodal Framework for Dementia Detection via Linguistic and Acoustic Representation Learning

Arxiv

0+阅读 · 5月25日

Zero-Shot Parkinson's Disease Detection from Speech: Comparing Large Audio and Language Models

Arxiv

0+阅读 · 5月24日

Speaker-Disentangled Remote Speech Detection of Asthma and COPD Exacerbations

Arxiv

0+阅读 · 5月16日

PROCESS-2: A Benchmark Speech Corpus for Early Cognitive Impairment Detection

Arxiv

0+阅读 · 5月14日

Voice Biomarkers for Depression and Anxiety

Arxiv

0+阅读 · 5月11日

相关基金

LPS经鼻暴露对A53T-α-synuclein帕金森小鼠模型发生发展的协同效应及机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于阿尔茨海默症早期诊断的氟标小分子MRI成像用Aβ探针的研究

国家自然科学基金

0+阅读 · 2015年12月31日

褐藻硫酸化甘露葡萄糖醛酸寡糖的构效关系与抗帕金森病机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

早期阿尔茨海默病胼胝体与海马的时空特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

miR-144/451调控帕金森病发生发展的作用及机制

国家自然科学基金

0+阅读 · 2015年12月31日

面向帕金森病的多模态在线预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

分析基因组关联研究数据识别阿尔茨海默和帕金森疾病相关的风险位点和遗传通路

国家自然科学基金

0+阅读 · 2014年12月31日

帕金森病大鼠内侧苍白球对丘脑束旁核脑电活动调控及信号通路研究

国家自然科学基金

0+阅读 · 2014年12月31日

大鼠嗅球内病理性α-synuclein传递开启全脑水平的帕金森(PD)样神经退行性病变

国家自然科学基金

1+阅读 · 2014年12月31日

HLA区基因多态性与帕金森病的关联分析及其分子机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员