A Fusion-Aware Two-Stage Framework for Mispronunciation Detection and Diagnosis in Low-Resource Modern Standard Arabic - 专知论文

会员服务 ·

0

音素 · Pivotal（公司） · 端到端 · Integration · 卷积 ·

A Fusion-Aware Two-Stage Framework for Mispronunciation Detection and Diagnosis in Low-Resource Modern Standard Arabic

翻译：暂无翻译

Jing Yang,Shuqing Zhang,Yongyi Deng,Pan Li,Ting Dang,Gongping Huang,Jingdong Chen,Jacob Benesty

from arxiv, Accepted to Interspeech 2026

Accurate phoneme recognition is pivotal for mispronunciation detection and diagnosis (MDD) in modern standard Arabic (MSA), yet remains constrained by data scarcity and the synthetic-real domain gap. This work proposes a two-stage end-to-end framework. It integrates a pre-trained encoder with causal dilated temporal convolutional networks to preserve fine-grained phonetic variations. A hierarchical two-stage strategy first learns general mappings from native/synthetic corpora, then adapts to scarce real learner data to mitigate domain shift without over-correction. Prediction stability is further enhanced via multi-checkpoint ensemble inference with N-gram rescoring. Evaluated on the QuranMB.v2 test set, our system achieves an F1-score of $0.7201$, a $63.1$\% relative improvement over baseline ($0.4414$). This performance ranks at the top of the IqraEval.2 Challenge, establishing a new state-of-the-art for low-resource MSA in MDD.

翻译：暂无翻译

0

相关内容

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

专知会员服务

14+阅读 · 6月16日

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

专知会员服务

19+阅读 · 2025年9月9日

《优化军事医疗系统中的虚拟健康》84页报告

《优化军事医疗系统中的虚拟健康》84页报告

专知会员服务

17+阅读 · 2025年7月31日

《人工智能全科临床辅助诊断系统技术要求》团体标准正式实施

《人工智能全科临床辅助诊断系统技术要求》团体标准正式实施

专知会员服务

18+阅读 · 2024年8月30日

《加强医疗部队战备能力的部队组合方案和服务模式独立研究》180页报告

《加强医疗部队战备能力的部队组合方案和服务模式独立研究》180页报告

专知会员服务

24+阅读 · 2024年2月13日

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》54页

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》54页

专知会员服务

14+阅读 · 2024年1月4日

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》2023最新54页报告

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》2023最新54页报告

专知会员服务

20+阅读 · 2023年12月10日

「中文电子病历命名实体识别」的研究与进展

「中文电子病历命名实体识别」的研究与进展

专知会员服务

30+阅读 · 2022年11月5日

腾讯《医学影像云应用及网络安全能力评估白皮书》|附下载

腾讯《医学影像云应用及网络安全能力评估白皮书》|附下载

专知会员服务

30+阅读 · 2021年11月8日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

基于多来源文本的中文医学知识图谱的构建

基于多来源文本的中文医学知识图谱的构建

专知

13+阅读 · 2020年8月21日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

目标检测集成框架在医学图像 AI 辅助分析中的应用

目标检测集成框架在医学图像 AI 辅助分析中的应用

AI掘金志

11+阅读 · 2019年3月1日

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

AI掘金志

17+阅读 · 2019年2月3日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

论文浅尝 | Improved Neural Relation Detection for KBQA

论文浅尝 | Improved Neural Relation Detection for KBQA

开放知识图谱

13+阅读 · 2018年1月21日

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

专知

74+阅读 · 2018年1月16日

【知识图谱】医学知识图谱构建技术与研究进展

【知识图谱】医学知识图谱构建技术与研究进展

产业智能官

44+阅读 · 2017年11月16日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

IJCAI | Cascade Dynamics Modeling with Attention-based RNN

IJCAI | Cascade Dynamics Modeling with Attention-based RNN

KingsGarden

13+阅读 · 2017年7月16日

人口老龄化背景下阿尔茨海默病患者卫生服务利用与经济保护模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米胶束的肿瘤治疗和成像一体化的多功能药物传递系统的构建与评价

国家自然科学基金

0+阅读 · 2015年12月31日

大规模MIMO-OFDM系统中的同相/正交支路不平衡问题及其补偿方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

梅尼埃病发病机制生物力学研究及临床应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向帕金森病的多模态在线预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

智能化数字微流控免疫检测芯片平台构建及其初步应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

诊断超声击破载Aβ抗体微泡联合NSCs跨BBB治疗阿尔茨海默病的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于移动终端应用程序的缺血性脑卒中二级预防管理效果研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于脑网络组的阿尔茨海默病早期脑功能代偿机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于公立医院动态人本化管理的医患冲突预警和干预模式构建

国家自然科学基金

1+阅读 · 2014年12月31日

Bridging Single Distortion Artifacts and Multifactorial Clinical Quality: Few-shot Biparametric MRI Quality Assessment via Distortion-trained Prototypical Networks

Bridging Single Distortion Artifacts and Multifactorial Clinical Quality: Few-shot Biparametric MRI Quality Assessment via Distortion-trained Prototypical Networks

Arxiv

0+阅读 · 6月23日

PsyBridge: A Hybrid Intelligent Framework for Multi-Dimensional Mental Health Assessment and Decision Support

Arxiv

0+阅读 · 6月22日

Using Phonological-Level Wav2Vec2 for Mandarin Automatic Mispronunciation Detection and Diagnosis

Arxiv

0+阅读 · 6月20日

A Robust Framework for Secure Cardiovascular Risk Prediction: An Architectural Case Study of Differentially Private Federated Learning

Arxiv

0+阅读 · 6月20日

Harf-Speech: A Clinically Aligned Framework for Arabic Phoneme-Level Speech Assessment

Arxiv

0+阅读 · 6月19日

U$^2$Mamba: A Two-level Nested U-structure Mamba for Salient Object Detection

Arxiv

0+阅读 · 6月18日

TSAssistant: A Human-in-the-Loop Agentic Framework for Automated Target Safety Assessment

Arxiv

0+阅读 · 6月18日

Context-Aware Optimization of Follow-Up Intervals for Type 2 Diabetes Care Using Markov Decision Processes

Arxiv

0+阅读 · 6月17日

Toward Vibe Medicine: A Self-Evolving Multi-Agent Framework for Clinical Decision Support

Arxiv

0+阅读 · 6月17日

Architectural Bias in Face Presentation Attack Detection: A Comparative Study of Vision Transformers and Convolutional Neural Networks

Arxiv

0+阅读 · 6月16日

VIP会员

文章信息

相关主题

Pivotal（公司）

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

3+阅读 · 6月26日

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

1+阅读 · 6月26日

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

12+阅读 · 6月26日

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

5+阅读 · 6月26日

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

4+阅读 · 6月26日

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

3+阅读 · 6月26日

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

专知会员服务

14+阅读 · 6月16日

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

专知会员服务

19+阅读 · 2025年9月9日

《优化军事医疗系统中的虚拟健康》84页报告

《优化军事医疗系统中的虚拟健康》84页报告

专知会员服务

17+阅读 · 2025年7月31日

《人工智能全科临床辅助诊断系统技术要求》团体标准正式实施

《人工智能全科临床辅助诊断系统技术要求》团体标准正式实施

专知会员服务

18+阅读 · 2024年8月30日

《加强医疗部队战备能力的部队组合方案和服务模式独立研究》180页报告

《加强医疗部队战备能力的部队组合方案和服务模式独立研究》180页报告

专知会员服务

24+阅读 · 2024年2月13日

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》54页

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》54页

专知会员服务

14+阅读 · 2024年1月4日

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》2023最新54页报告

《美国防部伤害医疗监测的标准化方法：军事伤害工作组 2019-2022 年初步目标》2023最新54页报告

专知会员服务

20+阅读 · 2023年12月10日

「中文电子病历命名实体识别」的研究与进展

「中文电子病历命名实体识别」的研究与进展

专知会员服务

30+阅读 · 2022年11月5日

腾讯《医学影像云应用及网络安全能力评估白皮书》|附下载

腾讯《医学影像云应用及网络安全能力评估白皮书》|附下载

专知会员服务

30+阅读 · 2021年11月8日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

基于多来源文本的中文医学知识图谱的构建

基于多来源文本的中文医学知识图谱的构建

专知

13+阅读 · 2020年8月21日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

目标检测集成框架在医学图像 AI 辅助分析中的应用

目标检测集成框架在医学图像 AI 辅助分析中的应用

AI掘金志

11+阅读 · 2019年3月1日

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

沈定刚教授：深度学习在医学影像分析中的应用丨2018医学影像AI经典演讲回顾（二）

AI掘金志

17+阅读 · 2019年2月3日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

论文浅尝 | Improved Neural Relation Detection for KBQA

论文浅尝 | Improved Neural Relation Detection for KBQA

开放知识图谱

13+阅读 · 2018年1月21日

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

【论文推荐】最新5篇目标检测相关论文——显著目标检测、弱监督One-Shot检测、多框检测器、携带物体检测、假彩色图像检测

专知

74+阅读 · 2018年1月16日

【知识图谱】医学知识图谱构建技术与研究进展

【知识图谱】医学知识图谱构建技术与研究进展

产业智能官

44+阅读 · 2017年11月16日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

IJCAI | Cascade Dynamics Modeling with Attention-based RNN

IJCAI | Cascade Dynamics Modeling with Attention-based RNN

KingsGarden

13+阅读 · 2017年7月16日

相关论文

Bridging Single Distortion Artifacts and Multifactorial Clinical Quality: Few-shot Biparametric MRI Quality Assessment via Distortion-trained Prototypical Networks

Bridging Single Distortion Artifacts and Multifactorial Clinical Quality: Few-shot Biparametric MRI Quality Assessment via Distortion-trained Prototypical Networks

Arxiv

0+阅读 · 6月23日

PsyBridge: A Hybrid Intelligent Framework for Multi-Dimensional Mental Health Assessment and Decision Support

Arxiv

0+阅读 · 6月22日

Using Phonological-Level Wav2Vec2 for Mandarin Automatic Mispronunciation Detection and Diagnosis

Arxiv

0+阅读 · 6月20日

A Robust Framework for Secure Cardiovascular Risk Prediction: An Architectural Case Study of Differentially Private Federated Learning

Arxiv

0+阅读 · 6月20日

Harf-Speech: A Clinically Aligned Framework for Arabic Phoneme-Level Speech Assessment

Arxiv

0+阅读 · 6月19日

U$^2$Mamba: A Two-level Nested U-structure Mamba for Salient Object Detection

Arxiv

0+阅读 · 6月18日

TSAssistant: A Human-in-the-Loop Agentic Framework for Automated Target Safety Assessment

Arxiv

0+阅读 · 6月18日

Context-Aware Optimization of Follow-Up Intervals for Type 2 Diabetes Care Using Markov Decision Processes

Arxiv

0+阅读 · 6月17日

Toward Vibe Medicine: A Self-Evolving Multi-Agent Framework for Clinical Decision Support

Arxiv

0+阅读 · 6月17日

Architectural Bias in Face Presentation Attack Detection: A Comparative Study of Vision Transformers and Convolutional Neural Networks

Arxiv

0+阅读 · 6月16日

相关基金

人口老龄化背景下阿尔茨海默病患者卫生服务利用与经济保护模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于纳米胶束的肿瘤治疗和成像一体化的多功能药物传递系统的构建与评价

国家自然科学基金

0+阅读 · 2015年12月31日

大规模MIMO-OFDM系统中的同相/正交支路不平衡问题及其补偿方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

梅尼埃病发病机制生物力学研究及临床应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向帕金森病的多模态在线预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

智能化数字微流控免疫检测芯片平台构建及其初步应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

诊断超声击破载Aβ抗体微泡联合NSCs跨BBB治疗阿尔茨海默病的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于移动终端应用程序的缺血性脑卒中二级预防管理效果研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于脑网络组的阿尔茨海默病早期脑功能代偿机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于公立医院动态人本化管理的医患冲突预警和干预模式构建

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员