Many real-world optimization problems are not naturally homogeneous vectors but composite design objects with heterogeneous parameters: integers, real values, Booleans, categoricals, complex-valued descriptors, and embedding vectors. Standard evolutionary algorithms flatten these into a single chromosome and apply generic operators with rounding and repair, sacrificing representational fidelity. We introduce the Geno-Synthetic Algorithm (GSA), a type-factored coevolutionary framework in which gene families are partitioned by representational type, evolved in parallel with type-native operators, and assembled into executable phenotypes for joint fitness evaluation. GSA is formalized as a typed product-space search procedure with an explicit assembly operator. An open-source reference implementation (gsa-experiments, MIT-licensed) is released. A focused empirical study compares eight GSA variants against five baselines across seven benchmark problems (six synthetic plus the external COCO BBOB-MixInt suite) at budgets from 5,000 to 100,000 evaluations. The headline finding is architectural: GSA is the only method that operates when gene families include complex-valued descriptors or embedding vectors. On smooth synthetic multi-family problems, well-tuned flattened differential evolution remains the strongest baseline; on BBOB-MixInt at 100,000 evaluations, GSA_DIRECT becomes statistically indistinguishable from FLATTENED_DE while FLATTENED_EA drops from second to fifth rank, an asymptotic crossover. Ablations confirm that type-native operators are essential, elite credit dominates ensemble credit, and active assembly outperforms passive concatenation on gated benchmarks. The framework extends naturally to prompt and embedding optimization for large language model systems.


翻译:许多现实世界的优化问题并非天然的同质向量,而是具有异质参数的设计对象:整数、实数值、布尔值、类别变量、复值描述符与嵌入向量。标准进化算法将这些参数压平为单一染色体,并通过舍入与修复操作使用通用算子,从而牺牲了表征保真度。我们提出基因合成算法(GSA),一种类型分解式协同进化框架:基因家族按表征类型划分,并行采用类型原生算子进化,并组装为可执行表型进行联合适应度评估。GSA被形式化为具有显式组装算子的类型化乘积空间搜索过程。我们发布了开源参考实现(gsa-experiments,MIT许可)。通过聚焦实证研究,我们在七个基准问题(六个合成问题及外部COCO BBOB-MixInt套件)上,以5,000至100,000次评估预算,比较了八种GSA变体与五种基线方法。核心结构发现:GSA是唯一可在基因家族包含复值描述符或嵌入向量时运作的方法。在平滑合成多家族问题上,调优的压平差分进化仍是最强基线;在BBOB-MixInt上以100,000次评估时,GSA_DIRECT在统计上与FLATTENED_DE无显著差异,而FLATTENED_EA从第二降至第五位,呈现渐近交叉。消融实验证实:类型原生算子不可或缺,精英信用主导集成信用,且主动组装在门控基准上优于被动拼接。该框架可自然扩展至大语言模型系统的提示词与嵌入优化。

0
下载
关闭预览

相关内容

最新《图嵌入组合优化》综述论文,40页pdf
专知会员服务
35+阅读 · 2020年9月7日
赛尔译文|基础模型的风险与机遇(五)
哈工大SCIR
11+阅读 · 2021年11月30日
赛尔译文 | 基础模型的机遇与风险 (三)
哈工大SCIR
12+阅读 · 2021年10月26日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
学界 | 综述论文:四大类深度迁移学习
机器之心
17+阅读 · 2018年9月15日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
专知会员服务
3+阅读 · 今天7:28
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
8+阅读 · 6月15日
相关VIP内容
最新《图嵌入组合优化》综述论文,40页pdf
专知会员服务
35+阅读 · 2020年9月7日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员