Expression Syntax Information Bottleneck for Math Word Problems - 专知论文

会员服务 ·

0

数学 · 信息瓶颈 · 冗余 · 潜在 · 设计 ·

Expression Syntax Information Bottleneck for Math Word Problems

翻译：表达式语法信息瓶颈在数学应用题中的应用

Jing Xiong,Chengming Li,Min Yang,Xiping Hu,Bin Hu

from arxiv, This paper has been accepted by SIGIR 2022. The code can be found at https://github.com/menik1126/math_ESIB

Math Word Problems (MWP) aims to automatically solve mathematical questions given in texts. Previous studies tend to design complex models to capture additional information in the original text so as to enable the model to gain more comprehensive features. In this paper, we turn our attention in the opposite direction, and work on how to discard redundant features containing spurious correlations for MWP. To this end, we design an Expression Syntax Information Bottleneck method for MWP (called ESIB) based on variational information bottleneck, which extracts essential features of expression syntax tree while filtering latent-specific redundancy containing syntax-irrelevant features. The key idea of ESIB is to encourage multiple models to predict the same expression syntax tree for different problem representations of the same problem by mutual learning so as to capture consistent information of expression syntax tree and discard latent-specific redundancy. To improve the generalization ability of the model and generate more diverse expressions, we design a self-distillation loss to encourage the model to rely more on the expression syntax information in the latent space. Experimental results on two large-scale benchmarks show that our model not only achieves state-of-the-art results but also generates more diverse solutions. The code is available in https://github.com/menik1126/math_ESIB.

翻译：数学应用题（MWP）旨在自动求解文本形式的数学问题。先前的研究倾向于设计复杂模型以捕捉原始文本中的额外信息，从而使模型获得更全面的特征。本文则转向相反方向，研究如何为数学应用题丢弃包含虚假相关性的冗余特征。为此，我们基于变分信息瓶颈设计了一种用于数学应用题的表达式语法信息瓶颈方法（称为ESIB），该方法在提取表达式语法树本质特征的同时，过滤掉包含语法无关特征的潜在特定冗余。ESIB的核心思想是通过相互学习，鼓励多个模型针对同一问题的不同问题表示预测出相同的表达式语法树，从而捕捉表达式语法树的一致性信息并丢弃潜在特定冗余。为提升模型的泛化能力并生成更多样化的表达式，我们设计了一种自蒸馏损失，以鼓励模型更多地依赖潜在空间中的表达式语法信息。在两个大规模基准测试上的实验结果表明，我们的模型不仅取得了最先进的结果，而且能生成更多样化的解。代码可在 https://github.com/menik1126/math_ESIB 获取。

0

相关内容

数学是关于数量、结构、变化等主题的探索。

智能的基础：从人类认知视角综述数学文字题研究

智能的基础：从人类认知视角综述数学文字题研究

专知会员服务

16+阅读 · 2025年11月11日

【阿姆斯特丹博士论文】表示学习中的信息理论

【阿姆斯特丹博士论文】表示学习中的信息理论

专知会员服务

23+阅读 · 2025年7月18日

【ICML2025】学习最优多模态信息瓶颈表示

【ICML2025】学习最优多模态信息瓶颈表示

专知会员服务

11+阅读 · 2025年5月28日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

专知会员服务

19+阅读 · 2020年3月10日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

专知会员服务

147+阅读 · 2019年12月16日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

专知会员服务

55+阅读 · 2019年11月20日

异质信息网络的表示学习与应用，北京邮电大学计算机学院石川教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

异质信息网络的表示学习与应用，北京邮电大学计算机学院石川教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

28+阅读 · 2019年10月23日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

《应用随机微分方程》，324页pdf新书免费分享

《应用随机微分方程》，324页pdf新书免费分享

专知

20+阅读 · 2019年5月6日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

从信息瓶颈理论一瞥机器学习的“大一统理论”

从信息瓶颈理论一瞥机器学习的“大一统理论”

PaperWeekly

14+阅读 · 2019年1月4日

知识在检索式对话系统的应用

知识在检索式对话系统的应用

微信AI

32+阅读 · 2018年9月20日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

LibRec 每周算法：LDA主题模型

LibRec 每周算法：LDA主题模型

LibRec智能推荐

29+阅读 · 2017年12月4日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

超大规模约束优化问题算法及其应用天元数学交流项目

国家自然科学基金

2+阅读 · 2017年12月31日

正交非负矩阵分解的算法、理论与应用

国家自然科学基金

8+阅读 · 2017年12月31日

求解非凸随机二阶锥优化问题的无导数方法研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

具有时滞效应的微分向量优化问题的理论、算法及应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

提升《高校应用数学学报》的影响力

国家自然科学基金

0+阅读 · 2015年8月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

Enhancing Mathematical Problem Solving in LLMs through Execution-Driven Reasoning Augmentation

Arxiv

0+阅读 · 2月3日

From Abstract to Contextual: What LLMs Still Cannot Do in Mathematics

Arxiv

0+阅读 · 1月30日

Surrogate Signals from Format and Length: Reinforcement Learning for Solving Mathematical Problems without Ground Truth Answers

Arxiv

0+阅读 · 1月30日

Tracing Mathematical Proficiency Through Problem-Solving Processes

Arxiv

0+阅读 · 1月28日

SpatialMath: Spatial Comprehension-Infused Symbolic Reasoning for Mathematical Problem-Solving

Arxiv

0+阅读 · 1月24日

Missing vs. Unused Knowledge Hypothesis for Language Model Bottlenecks in Patent Understanding

Arxiv

0+阅读 · 1月16日

Generate-Then-Validate: A Novel Question Generation Approach Using Small Language Models

Arxiv

0+阅读 · 1月16日

MathDoc: Benchmarking Structured Extraction and Active Refusal on Noisy Mathematics Exam Papers

Arxiv

0+阅读 · 1月15日

Quantifying LLM Biases Across Instruction Boundary in Mixed Question Forms

Arxiv

0+阅读 · 1月6日

FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

1+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

1+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

1+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

1+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

2+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

1+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

1+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

12+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

智能的基础：从人类认知视角综述数学文字题研究

智能的基础：从人类认知视角综述数学文字题研究

专知会员服务

16+阅读 · 2025年11月11日

【阿姆斯特丹博士论文】表示学习中的信息理论

【阿姆斯特丹博士论文】表示学习中的信息理论

专知会员服务

23+阅读 · 2025年7月18日

【ICML2025】学习最优多模态信息瓶颈表示

【ICML2025】学习最优多模态信息瓶颈表示

专知会员服务

11+阅读 · 2025年5月28日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

【东京大学】图采样，Sampling on Graphs: From Theory to Applications

专知会员服务

19+阅读 · 2020年3月10日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

专知会员服务

147+阅读 · 2019年12月16日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用（Definitions, methods, and applications in interpretable machine learning）,W. James Murdoch,Chandan Singh

专知会员服务

55+阅读 · 2019年11月20日

异质信息网络的表示学习与应用，北京邮电大学计算机学院石川教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

异质信息网络的表示学习与应用，北京邮电大学计算机学院石川教授，SMP 2019 前沿技术讲习班第十五期（CIPS ATT 15）

专知会员服务

28+阅读 · 2019年10月23日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

FewRel 2.0数据集：以近知远，以一知万，少次学习新挑战

PaperWeekly

24+阅读 · 2019年11月6日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

《应用随机微分方程》，324页pdf新书免费分享

《应用随机微分方程》，324页pdf新书免费分享

专知

20+阅读 · 2019年5月6日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

从信息瓶颈理论一瞥机器学习的“大一统理论”

从信息瓶颈理论一瞥机器学习的“大一统理论”

PaperWeekly

14+阅读 · 2019年1月4日

知识在检索式对话系统的应用

知识在检索式对话系统的应用

微信AI

32+阅读 · 2018年9月20日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

LibRec 每周算法：LDA主题模型

LibRec 每周算法：LDA主题模型

LibRec智能推荐

29+阅读 · 2017年12月4日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

相关论文

Enhancing Mathematical Problem Solving in LLMs through Execution-Driven Reasoning Augmentation

Arxiv

0+阅读 · 2月3日

From Abstract to Contextual: What LLMs Still Cannot Do in Mathematics

Arxiv

0+阅读 · 1月30日

Surrogate Signals from Format and Length: Reinforcement Learning for Solving Mathematical Problems without Ground Truth Answers

Arxiv

0+阅读 · 1月30日

Tracing Mathematical Proficiency Through Problem-Solving Processes

Arxiv

0+阅读 · 1月28日

SpatialMath: Spatial Comprehension-Infused Symbolic Reasoning for Mathematical Problem-Solving

Arxiv

0+阅读 · 1月24日

Missing vs. Unused Knowledge Hypothesis for Language Model Bottlenecks in Patent Understanding

Arxiv

0+阅读 · 1月16日

Generate-Then-Validate: A Novel Question Generation Approach Using Small Language Models

Arxiv

0+阅读 · 1月16日

MathDoc: Benchmarking Structured Extraction and Active Refusal on Noisy Mathematics Exam Papers

Arxiv

0+阅读 · 1月15日

Quantifying LLM Biases Across Instruction Boundary in Mixed Question Forms

Arxiv

0+阅读 · 1月6日

FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning

Arxiv

0+阅读 · 1月4日

相关基金

超大规模约束优化问题算法及其应用天元数学交流项目

国家自然科学基金

2+阅读 · 2017年12月31日

正交非负矩阵分解的算法、理论与应用

国家自然科学基金

8+阅读 · 2017年12月31日

求解非凸随机二阶锥优化问题的无导数方法研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

几类随机指数函数空间的应用

国家自然科学基金

0+阅读 · 2015年12月31日

具有时滞效应的微分向量优化问题的理论、算法及应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

提升《高校应用数学学报》的影响力

国家自然科学基金

0+阅读 · 2015年8月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员