Can LLMs Help Decentralized Dispute Arbitration? A Case Study of UMA-Resolved Markets on Polymarket - 专知论文

会员服务 ·

0

Can LLMs Help Decentralized Dispute Arbitration? A Case Study of UMA-Resolved Markets on Polymarket

翻译：大型语言模型能否助力去中心化争议仲裁？——以Polymarket上UMA裁决市场为例的案例研究

Junhao Wen,Juncen Zhou,Junjie Huang

Web3 prediction markets, exemplified by Polymarket, have gained prominence for leveraging collective intelligence to forecast a wide range of social, political, and sports events. However, among the thousands of prediction market events, consensus disputes still arise due to imperfections in market mechanisms. On Polymarket alone, the trading volume involving disputed events has reached $972,370,804.71, underscoring the critical need for objective and efficient dispute resolution. In this study, we introduce large language models (LLMs) to: (1) evaluate whether web-enabled LLMs can reproduce the decision quality of UMA's on-chain voting process once a dispute has been raised, and (2) predict, based on event rules, which market events are likely to face future disputes before they occur. Our findings show that LLMs are unable to reliably predict which events will become disputed in advance; however, once a dispute is initiated, web-enabled LLMs achieve 89.58% agreement with UMA's final resolutions and demonstrate strong stability.

翻译：Web3预测市场（以Polymarket为代表）因利用群体智慧预测广泛的社会、政治及体育事件而备受关注。然而，在成千上万的预测市场事件中，由于市场机制的不完善，仍会出现共识争议。仅Polymarket平台，涉及争议事件的交易额已达972,370,804.71美元，这凸显了客观高效争议解决机制的迫切需求。本研究引入大型语言模型（LLM）以：（1）评估联网LLM能否在争议发生后复现UMA链上投票过程的决策质量；（2）基于事件规则，预测哪些市场事件可能在发生前面临未来争议。研究结果表明：LLM无法可靠地提前预测哪些事件将成为争议焦点；但在争议启动后，联网LLM与UMA最终裁决的一致性达到89.58%，并展现出强大的稳定性。

0

相关内容

大语言模型的智能体化推理

大语言模型的智能体化推理

专知会员服务

35+阅读 · 1月21日

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

17+阅读 · 1月14日

大型语言模型的规模效应局限

大型语言模型的规模效应局限

专知会员服务

14+阅读 · 2025年11月18日

《大型语言模型能否有效生成基于博弈论的网络安全场景？》

《大型语言模型能否有效生成基于博弈论的网络安全场景？》

专知会员服务

17+阅读 · 2025年8月22日

大模型如何判决？从生成到判决：大型语言模型作为裁判的机遇与挑战

大模型如何判决？从生成到判决：大型语言模型作为裁判的机遇与挑战

专知会员服务

33+阅读 · 2024年11月29日

基于大模型的群体智能解决方案

基于大模型的群体智能解决方案

专知会员服务

68+阅读 · 2024年7月5日

大模型如何治理虚假信息？WWW2024教程《迈向缓解大规模语言模型时代的虚假信息和社交媒体操纵》附115页ppt

大模型如何治理虚假信息？WWW2024教程《迈向缓解大规模语言模型时代的虚假信息和社交媒体操纵》附115页ppt

专知会员服务

59+阅读 · 2024年5月19日

大型语言模型在预测和异常检测中的应用综述

大型语言模型在预测和异常检测中的应用综述

专知会员服务

70+阅读 · 2024年2月19日

大型语言模型公平性

大型语言模型公平性

专知会员服务

41+阅读 · 2023年8月31日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

专知

30+阅读 · 2022年4月23日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

2019-2024预测性维护市场展望：180家企业并进，9种类型齐头，竞争激烈……

2019-2024预测性维护市场展望：180家企业并进，9种类型齐头，竞争激烈……

物联网智库

31+阅读 · 2019年10月14日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

专知

40+阅读 · 2019年9月27日

在深度学习中处理不均衡数据集

在深度学习中处理不均衡数据集

极市平台

19+阅读 · 2018年11月27日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据驱动的三类典型工商市场主体风险识别决策研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多主体的应急预案体系语义模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

群体性突发事件预警的超网络方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于图模型冲突分析反问题理论的第三方调解策略研究

国家自然科学基金

3+阅读 · 2014年12月31日

Measuring Opinion Bias and Sycophancy via LLM-based Persuasion

Arxiv

0+阅读 · 4月30日

The Anatomy of a Decentralized Prediction Market: Microstructure Evidence from the Polymarket Order Book

Arxiv

0+阅读 · 4月27日

Toward Black Scholes for Prediction Markets: A Unified Kernel and Market Maker's Handbook

Arxiv

0+阅读 · 4月6日

Can Commercial LLMs Be Parliamentary Political Companions? Comparing LLM Reasoning Against Romanian Legislative Expuneri de Motive

Arxiv

0+阅读 · 3月31日

ParlayMarket: Automated Market Making for Parlay-style Joint Contracts

Arxiv

0+阅读 · 3月23日

DEBATE: A Large-Scale Benchmark for Evaluating Opinion Dynamics in Role-Playing LLM Agents

Arxiv

0+阅读 · 3月22日

LLMs Can Infer Political Alignment from Online Conversations

Arxiv

0+阅读 · 3月13日

SoK: Market Microstructure for Decentralized Prediction Markets (DePMs)

Arxiv

0+阅读 · 3月13日

Can AI Truly Represent Your Voice in Deliberations? A Comprehensive Study of Large-Scale Opinion Aggregation with LLMs

Arxiv

0+阅读 · 2月26日

Adaptive Collaboration of Arena-Based Argumentative LLMs for Explainable and Contestable Legal Reasoning

Arxiv

0+阅读 · 2月21日

VIP会员

文章信息

相关主题

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

1+阅读 · 今天16:54

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

1+阅读 · 今天16:52

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

大语言模型的智能体化推理

大语言模型的智能体化推理

专知会员服务

35+阅读 · 1月21日

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

法律领域中的大语言模型智能体：分类体系、应用场景与挑战

专知会员服务

17+阅读 · 1月14日

大型语言模型的规模效应局限

大型语言模型的规模效应局限

专知会员服务

14+阅读 · 2025年11月18日

《大型语言模型能否有效生成基于博弈论的网络安全场景？》

《大型语言模型能否有效生成基于博弈论的网络安全场景？》

专知会员服务

17+阅读 · 2025年8月22日

大模型如何判决？从生成到判决：大型语言模型作为裁判的机遇与挑战

大模型如何判决？从生成到判决：大型语言模型作为裁判的机遇与挑战

专知会员服务

33+阅读 · 2024年11月29日

基于大模型的群体智能解决方案

基于大模型的群体智能解决方案

专知会员服务

68+阅读 · 2024年7月5日

大模型如何治理虚假信息？WWW2024教程《迈向缓解大规模语言模型时代的虚假信息和社交媒体操纵》附115页ppt

大模型如何治理虚假信息？WWW2024教程《迈向缓解大规模语言模型时代的虚假信息和社交媒体操纵》附115页ppt

专知会员服务

59+阅读 · 2024年5月19日

大型语言模型在预测和异常检测中的应用综述

大型语言模型在预测和异常检测中的应用综述

专知会员服务

70+阅读 · 2024年2月19日

大型语言模型公平性

大型语言模型公平性

专知会员服务

41+阅读 · 2023年8月31日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

Web3.0(元宇宙)概念下的场景生态简析，33页ppt

专知

30+阅读 · 2022年4月23日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

论文浅尝 | 探索将预训练语言模型用于事件抽取和事件生成

开放知识图谱

26+阅读 · 2019年11月8日

2019-2024预测性维护市场展望：180家企业并进，9种类型齐头，竞争激烈……

2019-2024预测性维护市场展望：180家企业并进，9种类型齐头，竞争激烈……

物联网智库

31+阅读 · 2019年10月14日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

【清华大学NLP】预训练语言模型（PLM）必读论文清单，附论文PDF、源码和模型链接

专知

40+阅读 · 2019年9月27日

在深度学习中处理不均衡数据集

在深度学习中处理不均衡数据集

极市平台

19+阅读 · 2018年11月27日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

相关论文

Measuring Opinion Bias and Sycophancy via LLM-based Persuasion

Arxiv

0+阅读 · 4月30日

The Anatomy of a Decentralized Prediction Market: Microstructure Evidence from the Polymarket Order Book

Arxiv

0+阅读 · 4月27日

Toward Black Scholes for Prediction Markets: A Unified Kernel and Market Maker's Handbook

Arxiv

0+阅读 · 4月6日

Can Commercial LLMs Be Parliamentary Political Companions? Comparing LLM Reasoning Against Romanian Legislative Expuneri de Motive

Arxiv

0+阅读 · 3月31日

ParlayMarket: Automated Market Making for Parlay-style Joint Contracts

Arxiv

0+阅读 · 3月23日

DEBATE: A Large-Scale Benchmark for Evaluating Opinion Dynamics in Role-Playing LLM Agents

Arxiv

0+阅读 · 3月22日

LLMs Can Infer Political Alignment from Online Conversations

Arxiv

0+阅读 · 3月13日

SoK: Market Microstructure for Decentralized Prediction Markets (DePMs)

Arxiv

0+阅读 · 3月13日

Can AI Truly Represent Your Voice in Deliberations? A Comprehensive Study of Large-Scale Opinion Aggregation with LLMs

Arxiv

0+阅读 · 2月26日

Adaptive Collaboration of Arena-Based Argumentative LLMs for Explainable and Contestable Legal Reasoning

Arxiv

0+阅读 · 2月21日

相关基金

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据驱动的三类典型工商市场主体风险识别决策研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多主体的应急预案体系语义模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

群体性突发事件预警的超网络方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于中智集的模糊多属性决策理论、方法与应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于图模型冲突分析反问题理论的第三方调解策略研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员