Finding deletion-correcting codes of maximum size has been an open problem for over 70 years, even for a single deletion. We adapt FunSearch, a large language model (LLM)-guided evolutionary search, to discover functions that construct deletion-correcting codes at short code lengths. For a single deletion, our search finds a function that we prove constructs the conjectured-optimal Varshamov-Tenengolts code. For multiple deletions and quaternary edit codes, the discovered functions improve on prior explicit, search-based, and neural constructions but remain empirical heuristics without new theoretical insights. We study design choices for LLM-guided evolutionary search and find that, for our problem, compute is better allocated to sampling more functions than to longer reasoning traces per function, and that co-evolving natural language descriptions with code hurts search quality. We propose deduplicating logically identical functions during evolution, which we find critical for search diversity. Our results demonstrate the potential of LLM-guided evolutionary search for information theory and code design and represent the first application of such methods for constructing error-correcting codes. However, in our current formulation, evaluating a function scales exponentially with code length, limiting the approach to short codes.


翻译:寻找最大尺寸的删除校正码已是一个困扰学界超过70年的开放性问题,即便仅针对单次删除操作也是如此。我们改进了FunSearch(一种大语言模型引导的进化搜索方法),用于发现能构建短码长删除校正码的函数。针对单次删除,我们的搜索发现了一个函数,经证明该函数可构建推测最优的Varshamov-Tenengolts码。针对多次删除和四进制编辑码,所发现的函数改进了先前显式、基于搜索和神经网络的构造方法,但仍是经验性启发式算法,未能提供新的理论洞见。我们研究了LLM引导进化搜索的设计选择,发现针对本问题,将算力分配到采样更多函数比增加每个函数的推理链长度更有效,同时代码与自然语言描述的协同进化会损害搜索质量。我们提出在进化过程中对逻辑等价函数进行去重,这对保持搜索多样性至关重要。研究结果展示了LLM引导进化搜索在信息论与编码设计领域的潜力,标志着此类方法首次应用于纠错码构造。然而在当前框架下,评估函数的计算复杂度随码长呈指数增长,导致该方法仅适用于短码场景。

0
下载
关闭预览

相关内容

互联网
【ICLR2024】能检测到LLM产生的错误信息吗?
专知会员服务
25+阅读 · 2024年1月23日
【干货书】代数编码理论导论
专知会员服务
44+阅读 · 2023年9月13日
【反馈循环自编码器】FEEDBACK RECURRENT AUTOENCODER
专知会员服务
23+阅读 · 2020年1月28日
已删除
黑白之道
19+阅读 · 2018年12月23日
95行代码破解极验滑动验证码(附源码)
FreeBuf
12+阅读 · 2018年5月9日
放弃 RNN/LSTM 吧,因为真的不好用!望周知~
人工智能头条
19+阅读 · 2018年4月24日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月9日
Arxiv
0+阅读 · 5月27日
Arxiv
0+阅读 · 5月21日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关资讯
已删除
黑白之道
19+阅读 · 2018年12月23日
95行代码破解极验滑动验证码(附源码)
FreeBuf
12+阅读 · 2018年5月9日
放弃 RNN/LSTM 吧,因为真的不好用!望周知~
人工智能头条
19+阅读 · 2018年4月24日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员