RefineStat: Efficient Exploration for Probabilistic Program Synthesis - 专知论文

会员服务 ·

0

概率 · 编程 · 概率程序 · 概率编程 · 语言模型 ·

RefineStat: Efficient Exploration for Probabilistic Program Synthesis

翻译：RefineStat：面向概率程序综合的高效探索方法

Madhav Kanda,Shubham Ugare,Sasa Misailovic

from arxiv, RefineStat constrains LM decoding with statistical validity checks and uses diagnostic-guided resampling (priors/likelihoods) to transform small LMs' drafts into correct, reliable probabilistic programs that can match or surpass closed-source models

Probabilistic programming offers a powerful framework for modeling uncertainty, yet statistical model discovery in this domain entails navigating an immense search space under strict domain-specific constraints. When small language models are tasked with generating probabilistic programs, they frequently produce outputs that suffer from both syntactic and semantic errors, such as flawed inference constructs. Motivated by probabilistic programmers' domain expertise and debugging strategies, we introduce RefineStat, a language model--driven framework that enforces semantic constraints ensuring synthesized programs contain valid distributions and well-formed parameters, and then applies diagnostic-aware refinement by resampling prior or likelihood components whenever reliability checks fail. We evaluate RefineStat on multiple probabilistic-programming code-generation tasks using smaller language models (SLMs) and find that it produces programs that are both syntactically sound and statistically reliable, often matching or surpassing those from closed-source large language models (e.g., OpenAI o3).

翻译：概率编程为不确定性建模提供了强大的框架，但在此领域进行统计模型发现需在严格的领域特定约束下探索庞大的搜索空间。当小型语言模型被用于生成概率程序时，其输出常存在句法与语义错误，例如有缺陷的推理结构。受概率编程人员领域专业知识与调试策略启发，我们提出RefineStat——一种语言模型驱动的框架，该框架通过强制语义约束确保合成程序包含有效分布与规范参数，并在可靠性检查失败时通过重采样先验或似然组件实现诊断感知的精细化修正。我们采用小型语言模型在多项概率编程代码生成任务上评估RefineStat，结果表明其生成的程序兼具句法正确性与统计可靠性，性能常可媲美甚至超越闭源大型语言模型（如OpenAI o3）。

0

相关内容

本话题关于日常用语「概率」，用于讨论生活中的运气、机会，及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论，请转概率（数学）话题。

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

专知会员服务

29+阅读 · 2024年11月23日

【新书】《实用概率编程》，458页pdf

【新书】《实用概率编程》，458页pdf

专知会员服务

54+阅读 · 2024年10月23日

【2023新书】《金融与投资的概率机器学习：用Python入门生成式人工智能》，439页pdf

【2023新书】《金融与投资的概率机器学习：用Python入门生成式人工智能》，439页pdf

专知会员服务

83+阅读 · 2023年8月27日

【干货书】概率方法，第三版，373页pdf

【干货书】概率方法，第三版，373页pdf

专知会员服务

56+阅读 · 2023年2月2日

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

专知会员服务

47+阅读 · 2022年4月11日

【开放电子书】概率编程导论，301页pdf

【开放电子书】概率编程导论，301页pdf

专知会员服务

49+阅读 · 2021年10月21日

不可错过！CMU「概率图模型」课程，附Slides

专知会员服务

74+阅读 · 2021年6月12日

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

专知会员服务

141+阅读 · 2021年1月24日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

自动结构变分推理，Automatic structured variational inference

自动结构变分推理，Automatic structured variational inference

专知会员服务

41+阅读 · 2020年2月10日

【干货书】概率论:概率论与统计的导论，411页pdf

【干货书】概率论:概率论与统计的导论，411页pdf

专知

13+阅读 · 2022年10月6日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

33+阅读 · 2022年7月7日

【干货书】概率，统计与数据，513页pdf

【干货书】概率，统计与数据，513页pdf

专知

36+阅读 · 2021年11月27日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知

21+阅读 · 2021年3月24日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

42+阅读 · 2019年1月22日

这是一本好玩的可视化统计概率入门书，66页pdf下载

这是一本好玩的可视化统计概率入门书，66页pdf下载

专知

40+阅读 · 2018年12月30日

118页概率思维教程——基础、技巧与算法

118页概率思维教程——基础、技巧与算法

专知

13+阅读 · 2018年9月5日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

正倒向随机微分方程与两类衍生模型的统计推断及金融中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

Probabilistic Programs of Thought

Arxiv

0+阅读 · 4月19日

CLSGen: A Dual-Head Fine-Tuning Framework for Joint Probabilistic Classification and Verbalized Explanation

Arxiv

0+阅读 · 4月13日

A Gradual Probabilistic Lambda Calculus

Arxiv

0+阅读 · 4月6日

AnnoRetrieve: Efficient Structured Retrieval for Unstructured Document Analysis

Arxiv

0+阅读 · 4月3日

ActErase: A Training-Free Paradigm for Precise Concept Erasure via Activation Redirection

Arxiv

0+阅读 · 4月1日

MathGen: Revealing the Illusion of Mathematical Competence through Text-to-Image Generation

Arxiv

0+阅读 · 3月31日

ExVerus: Verus Proof Repair via Counterexample Reasoning

Arxiv

0+阅读 · 3月30日

CodeRefine: A Pipeline for Enhancing LLM-Generated Code Implementations of Research Papers

Arxiv

0+阅读 · 3月26日

A Unified Memory Perspective for Probabilistic Trustworthy AI

Arxiv

0+阅读 · 3月26日

Likelihood hacking in probabilistic program synthesis

Arxiv

0+阅读 · 3月25日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

5+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

3+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

3+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

【ETHZ博士论文】《结构化数据的概率模型与近似推断方法》

专知会员服务

29+阅读 · 2024年11月23日

【新书】《实用概率编程》，458页pdf

【新书】《实用概率编程》，458页pdf

专知会员服务

54+阅读 · 2024年10月23日

【2023新书】《金融与投资的概率机器学习：用Python入门生成式人工智能》，439页pdf

【2023新书】《金融与投资的概率机器学习：用Python入门生成式人工智能》，439页pdf

专知会员服务

83+阅读 · 2023年8月27日

【干货书】概率方法，第三版，373页pdf

【干货书】概率方法，第三版，373页pdf

专知会员服务

56+阅读 · 2023年2月2日

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

【干货书】1270页pdf《概率图模型：原理与技术》MIT出版，用于构建和使用复杂系统概率模型的通用框架，使计算机能够使用可用信息做出决策。Probabilistic Graphical Models: Principles and Applications

专知会员服务

47+阅读 · 2022年4月11日

【开放电子书】概率编程导论，301页pdf

【开放电子书】概率编程导论，301页pdf

专知会员服务

49+阅读 · 2021年10月21日

不可错过！CMU「概率图模型」课程，附Slides

专知会员服务

74+阅读 · 2021年6月12日

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

【哈佛大学干货书】概率导论，589页pdf，Introduction to Probability

专知会员服务

141+阅读 · 2021年1月24日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

自动结构变分推理，Automatic structured variational inference

自动结构变分推理，Automatic structured variational inference

专知会员服务

41+阅读 · 2020年2月10日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

【干货书】概率论:概率论与统计的导论，411页pdf

【干货书】概率论:概率论与统计的导论，411页pdf

专知

13+阅读 · 2022年10月6日

【2022新书】机器学习中的概率数值计算，412页pdf

【2022新书】机器学习中的概率数值计算，412页pdf

专知

33+阅读 · 2022年7月7日

【干货书】概率，统计与数据，513页pdf

【干货书】概率，统计与数据，513页pdf

专知

36+阅读 · 2021年11月27日

【经典书】概率论基础教程，A First Course in Probability，545页pdf

【经典书】概率论基础教程，A First Course in Probability，545页pdf

专知

21+阅读 · 2021年3月24日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

贝叶斯卷积神经网络：架起深度学习与统计学的桥梁-附PDF下载

专知

42+阅读 · 2019年1月22日

这是一本好玩的可视化统计概率入门书，66页pdf下载

这是一本好玩的可视化统计概率入门书，66页pdf下载

专知

40+阅读 · 2018年12月30日

118页概率思维教程——基础、技巧与算法

118页概率思维教程——基础、技巧与算法

专知

13+阅读 · 2018年9月5日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

相关论文

Probabilistic Programs of Thought

Arxiv

0+阅读 · 4月19日

CLSGen: A Dual-Head Fine-Tuning Framework for Joint Probabilistic Classification and Verbalized Explanation

Arxiv

0+阅读 · 4月13日

A Gradual Probabilistic Lambda Calculus

Arxiv

0+阅读 · 4月6日

AnnoRetrieve: Efficient Structured Retrieval for Unstructured Document Analysis

Arxiv

0+阅读 · 4月3日

ActErase: A Training-Free Paradigm for Precise Concept Erasure via Activation Redirection

Arxiv

0+阅读 · 4月1日

MathGen: Revealing the Illusion of Mathematical Competence through Text-to-Image Generation

Arxiv

0+阅读 · 3月31日

ExVerus: Verus Proof Repair via Counterexample Reasoning

Arxiv

0+阅读 · 3月30日

CodeRefine: A Pipeline for Enhancing LLM-Generated Code Implementations of Research Papers

Arxiv

0+阅读 · 3月26日

A Unified Memory Perspective for Probabilistic Trustworthy AI

Arxiv

0+阅读 · 3月26日

Likelihood hacking in probabilistic program synthesis

Arxiv

0+阅读 · 3月25日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于概率图谱引导的群组自适应时序脑MR图像脑提取方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

正倒向随机微分方程与两类衍生模型的统计推断及金融中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员