QIAS 2026: Overview of the Shared Task on Islamic Inheritance Reasoning - 专知论文

会员服务 ·

0

继承 · 系统 · 法律 · 基准 · 数据集 ·

QIAS 2026: Overview of the Shared Task on Islamic Inheritance Reasoning

翻译：QIAS 2026: 伊斯兰继承推理共享任务概述

Abdessalam Bouchekif,Somaya Eltanbouly,Samer Rashwani,Shahd Gaben,Mutaz Al-Khatib,Heba Sbahi,Emad Mohamed,Mohammed Ghaly

This paper presents a comprehensive overview of the QIAS 2026 shared task, organized as part of the OSACT7 Workshop and co-located with LREC 2026. The shared task was designed to evaluate the ability of large language models to perform complex reasoning in the religious and legal domain of Islamic inheritance. Unlike conventional question-answering benchmarks, QIAS 2026 focuses on end-to-end reasoning from natural language cases, requiring systems to perform the full inheritance calculation process, from identifying the eligible heirs to assigning the correct share to each beneficiary. To support this evaluation, the task was based on the MAWARITH benchmark, a dataset of $12{,}500$ Arabic inheritance cases annotated with intermediate reasoning steps and final answers. System submissions were evaluated using MIR-E, a multi-step metric that measures performance across the main stages of inheritance reasoning. A total of $16$ teams participated in the shared task, investigating a range of approaches, including prompting-based methods, retrieval-augmented generation, and fine-tuning strategies. The results show that Islamic inheritance remains a highly challenging benchmark for current language models, especially in stages that require precise legal interpretation and structured numerical reasoning. This overview summarizes the task design, dataset, evaluation framework, participating systems, and main results.

翻译：本文全面介绍了作为OSACT7研讨会一部分、与LREC 2026联合举办的QIAS 2026共享任务。该共享任务旨在评估大语言模型在伊斯兰继承这一宗教与法律领域中进行复杂推理的能力。与传统的问答基准不同，QIAS 2026聚焦于从自然语言案例中进行端到端推理，要求系统执行完整的继承计算流程，从识别合格继承人到为每位受益人分配正确份额。为支持此评估，该任务基于MAWARITH基准——一个包含12,500个阿拉伯语继承案例、附有中间推理步骤与最终答案的数据集。系统提交成果采用MIR-E度量标准进行评估，该标准通过多步骤指标衡量继承推理各主要阶段的性能。共有16支团队参与该共享任务，研究了一系列方法，包括基于提示的方法、检索增强生成以及微调策略。结果显示，伊斯兰继承对于当前语言模型仍具极高挑战性，尤其是在需要精准法律解释与结构化数值推理的阶段。本概述总结了任务设计、数据集、评估框架、参与系统及主要结果。

0

相关内容

继承是面向对象软件技术当中的一个概念，与多态、封装共为面向对象的三个基本特征。继承可以使得子类具有父类的属性和方法或者重新定义、追加属性和方法等。

AAAI2026开会了！《基础模型的可信机器推理》教程，197页ppt

AAAI2026开会了！《基础模型的可信机器推理》教程，197页ppt

专知会员服务

39+阅读 · 1月20日

NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

专知会员服务

24+阅读 · 2024年11月1日

AAAI2022最新「深度神经网络验证」教程报告，100+页PPT阐述理论与实践进展

AAAI2022最新「深度神经网络验证」教程报告，100+页PPT阐述理论与实践进展

专知会员服务

41+阅读 · 2022年3月9日

AAAI2022最新「关系数据因果推理」报告，181页PPT阐述因果推理在网络数据中研究进展

AAAI2022最新「关系数据因果推理」报告，181页PPT阐述因果推理在网络数据中研究进展

专知会员服务

80+阅读 · 2022年3月4日

AAAI2022最新「预训练语言表示」报告，300页PPT阐述预训练文本挖掘进展

AAAI2022最新「预训练语言表示」报告，300页PPT阐述预训练文本挖掘进展

专知会员服务

53+阅读 · 2022年2月28日

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

专知会员服务

99+阅读 · 2022年2月25日

【AAAI2022】多任务推荐中的跨任务知识提炼

【AAAI2022】多任务推荐中的跨任务知识提炼

专知会员服务

25+阅读 · 2022年2月22日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

218+阅读 · 2020年2月15日

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

专知会员服务

164+阅读 · 2020年2月12日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

17篇必看[知识图谱Knowledge Graphs] 论文@AAAI2020

17篇必看[知识图谱Knowledge Graphs] 论文@AAAI2020

专知

82+阅读 · 2020年2月13日

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

专知

16+阅读 · 2020年2月12日

细粒度情感分析任务（ABSA）的最新进展

细粒度情感分析任务（ABSA）的最新进展

PaperWeekly

18+阅读 · 2020年1月3日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

机器推理系列文章概览：七大NLP任务最新方法与进展

机器推理系列文章概览：七大NLP任务最新方法与进展

AI100

12+阅读 · 2019年9月15日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

【网络节点表示学习教程】在向量空间中启用网络分析和推理，清华大学崔鹏博士最新分享

【网络节点表示学习教程】在向量空间中启用网络分析和推理，清华大学崔鹏博士最新分享

专知

11+阅读 · 2018年2月9日

【综述】最新7篇数据科学/深度学习/CNN/知识图谱/文本匹配等中英文综述论文推介（附下载）

【综述】最新7篇数据科学/深度学习/CNN/知识图谱/文本匹配等中英文综述论文推介（附下载）

机器学习研究会

16+阅读 · 2017年12月3日

共享相关任务表征，一文读懂深度神经网络多任务学习

共享相关任务表征，一文读懂深度神经网络多任务学习

深度学习世界

16+阅读 · 2017年6月23日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

分布式社交网络结构、资源共享及迁移算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

连续变量量子密钥分发协议后选择技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

应用服务保障完成时限的网络传输机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

36+阅读 · 2013年12月31日

Which Models Perform Better in Inheritance Reasoning?

Arxiv

0+阅读 · 6月19日

Islamic Large Language Models: From Knowledge Acquisition to Trustworthy and Hallucination-Resistant AI

Arxiv

0+阅读 · 6月15日

Which Models Perform Better in Inheritance Reasoning?

Arxiv

0+阅读 · 6月15日

MAWARITH: A Dataset and Benchmark for Legal Inheritance Reasoning with LLMs

Arxiv

0+阅读 · 6月15日

Revisiting Outage for Edge Inference Systems

Arxiv

0+阅读 · 6月12日

Findings of the MAGMaR 2026 Shared Task

Arxiv

0+阅读 · 6月10日

StanceNakba Shared Task: Actor and Topic-Aware Stance Detection in Public Discourse

Arxiv

0+阅读 · 6月10日

Fanar-Sadiq: A Multi-Agent Architecture for Grounded Islamic QA

Arxiv

0+阅读 · 6月9日

Overview of the ClinicalSkillQA 2026 Shared Task on Continuous Perception and Procedural Reasoning in Clinical Skill Assessment

Arxiv

0+阅读 · 6月1日

Findings of the Fifth Shared Task on Multilingual Coreference Resolution: Expanding Datasets for Long-Range Entities

Arxiv

0+阅读 · 5月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

AAAI2026开会了！《基础模型的可信机器推理》教程，197页ppt

AAAI2026开会了！《基础模型的可信机器推理》教程，197页ppt

专知会员服务

39+阅读 · 1月20日

NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

NeurIPS 2024 让大语言模型使用代码解决图分析推理任务

专知会员服务

24+阅读 · 2024年11月1日

AAAI2022最新「深度神经网络验证」教程报告，100+页PPT阐述理论与实践进展

AAAI2022最新「深度神经网络验证」教程报告，100+页PPT阐述理论与实践进展

专知会员服务

41+阅读 · 2022年3月9日

AAAI2022最新「关系数据因果推理」报告，181页PPT阐述因果推理在网络数据中研究进展

AAAI2022最新「关系数据因果推理」报告，181页PPT阐述因果推理在网络数据中研究进展

专知会员服务

80+阅读 · 2022年3月4日

AAAI2022最新「预训练语言表示」报告，300页PPT阐述预训练文本挖掘进展

AAAI2022最新「预训练语言表示」报告，300页PPT阐述预训练文本挖掘进展

专知会员服务

53+阅读 · 2022年2月28日

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

专知会员服务

99+阅读 · 2022年2月25日

【AAAI2022】多任务推荐中的跨任务知识提炼

【AAAI2022】多任务推荐中的跨任务知识提炼

专知会员服务

25+阅读 · 2022年2月22日

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

WSDM2020教程《基于图学习和推理的推荐系统》，附130页PPT下载

专知会员服务

218+阅读 · 2020年2月15日

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

专知会员服务

164+阅读 · 2020年2月12日

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

【清华大学】利用知识增强的图神经网络进行多段推理，Multi-Paragraph Reasoning with Knowledge-enhanced Graph Neural Network

专知会员服务

95+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

17篇必看[知识图谱Knowledge Graphs] 论文@AAAI2020

17篇必看[知识图谱Knowledge Graphs] 论文@AAAI2020

专知

82+阅读 · 2020年2月13日

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

AAAI2020最新「因果推理表示学习」122页ppt，Georgia、Buffalo、阿里巴巴与Virginia

专知

16+阅读 · 2020年2月12日

细粒度情感分析任务（ABSA）的最新进展

细粒度情感分析任务（ABSA）的最新进展

PaperWeekly

18+阅读 · 2020年1月3日

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

【CIKM2019教程】新加坡国立大学：基于图学习与推理的推荐系统，附133页ppt

专知

62+阅读 · 2019年11月4日

机器推理系列文章概览：七大NLP任务最新方法与进展

机器推理系列文章概览：七大NLP任务最新方法与进展

AI100

12+阅读 · 2019年9月15日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

【网络节点表示学习教程】在向量空间中启用网络分析和推理，清华大学崔鹏博士最新分享

【网络节点表示学习教程】在向量空间中启用网络分析和推理，清华大学崔鹏博士最新分享

专知

11+阅读 · 2018年2月9日

【综述】最新7篇数据科学/深度学习/CNN/知识图谱/文本匹配等中英文综述论文推介（附下载）

【综述】最新7篇数据科学/深度学习/CNN/知识图谱/文本匹配等中英文综述论文推介（附下载）

机器学习研究会

16+阅读 · 2017年12月3日

共享相关任务表征，一文读懂深度神经网络多任务学习

共享相关任务表征，一文读懂深度神经网络多任务学习

深度学习世界

16+阅读 · 2017年6月23日

相关论文

Which Models Perform Better in Inheritance Reasoning?

Arxiv

0+阅读 · 6月19日

Islamic Large Language Models: From Knowledge Acquisition to Trustworthy and Hallucination-Resistant AI

Arxiv

0+阅读 · 6月15日

Which Models Perform Better in Inheritance Reasoning?

Arxiv

0+阅读 · 6月15日

MAWARITH: A Dataset and Benchmark for Legal Inheritance Reasoning with LLMs

Arxiv

0+阅读 · 6月15日

Revisiting Outage for Edge Inference Systems

Arxiv

0+阅读 · 6月12日

Findings of the MAGMaR 2026 Shared Task

Arxiv

0+阅读 · 6月10日

StanceNakba Shared Task: Actor and Topic-Aware Stance Detection in Public Discourse

Arxiv

0+阅读 · 6月10日

Fanar-Sadiq: A Multi-Agent Architecture for Grounded Islamic QA

Arxiv

0+阅读 · 6月9日

Overview of the ClinicalSkillQA 2026 Shared Task on Continuous Perception and Procedural Reasoning in Clinical Skill Assessment

Arxiv

0+阅读 · 6月1日

Findings of the Fifth Shared Task on Multilingual Coreference Resolution: Expanding Datasets for Long-Range Entities

Arxiv

0+阅读 · 5月20日

相关基金

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

分布式社交网络结构、资源共享及迁移算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

云计算环境信任链系统安全性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称群体兴趣相关性并融合情境与群体信任的Web服务推荐研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

连续变量量子密钥分发协议后选择技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

应用服务保障完成时限的网络传输机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

指挥控制任务共同体的机制和模型研究

国家自然科学基金

36+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员