根据 Beating,OpenAI 训练后研究员 Paul Garnier 证明 Codex 5.5 能够在流体力学应用中生成可解释的控制代码,并在表现上优于深度强化学习基线。Garnier 并非训练神经网络,而是通过分析物理仿真,利用该模型对 Python 脚本进行迭代式精炼,在超过一半的测试场景中取得了更优的性能。
由 AI 生成的控制规则具有物理层面的可解释性,例如“当局部曲率超过阈值时延迟喷注”。与神经网络黑盒不同,这种基于代码的方法在分布发生变化时表现出更强的鲁棒性;当测试时长延长 4 倍时,传统的 DRL 模型崩溃了,而引入物理信息的代码仍保持稳定。实现完整控制策略消耗了 2100 万 tokens,总计低于 14 美元。