Commutativity and Kleisli laws of codensity monads of probability measures

本文研究了概率测度余密度单子(codensity monads)的交换性与 Kleisli 定律,通过推导其到 Giry 单子的 Kleisli 定律建立了与可测概率的正式联系,给出了若干概率单子作为 Giry 单子终端提升的新普适性质,并提供了单子为仿射和松弛幺半的充分条件,特别是通过日卷积(Day convolution)刻画了 Radon 单子等恰好点式幺半的余密度单子,同时揭示了 Giry 单子仅在标准博雷尔空间上才具有该性质的原因。

Zev ShiraziWed, 11 Ma🔢 math

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

本文提出了名为 Preguss 的模块化细粒度框架,通过结合静态分析与大语言模型,利用潜在运行时错误引导验证单元构建与优先级排序,成功实现了对千行代码级大规模程序的高度自动化形式化验证,显著降低了人工验证成本。

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

本文提出了名为 FATE 的新基准系列(包含 FATE-H 和 FATE-X),旨在填补大型语言模型在竞赛数学与研究级抽象代数形式化证明之间的能力鸿沟,评估结果显示当前最先进模型在该领域表现极差,且其将自然语言推理转化为形式化证明的能力远弱于推理本身。

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin DongTue, 10 Ma🤖 cs.LG

Learning to Rank the Initial Branching Order of SAT Solvers

该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法,在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力,但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)Tue, 10 Ma💻 cs