cs.LO 篇论文 | Gist.Science

Commutativity and Kleisli laws of codensity monads of probability measures

本文研究了概率测度余密度单子（codensity monads）的交换性与 Kleisli 定律，通过推导其到 Giry 单子的 Kleisli 定律建立了与可测概率的正式联系，给出了若干概率单子作为 Giry 单子终端提升的新普适性质，并提供了单子为仿射和松弛幺半的充分条件，特别是通过日卷积（Day convolution）刻画了 Radon 单子等恰好点式幺半的余密度单子，同时揭示了 Giry 单子仅在标准博雷尔空间上才具有该性质的原因。

Zev ShiraziWed, 11 Ma🔢 math

Dependent Directed Wiring Diagrams for Composing Instantaneous Systems

本文通过引入依赖型有向接线图算子，构建了能够处理输出直接依赖输入（如 Mealy 机和参数化辅助变量的库存流图）的瞬时系统组合代数，并给出了其到 Mealy 机的语义解释。

Keri D'Angelo (Cornell University), Sophie Libkind (Topos Institute)Wed, 11 Ma🔢 math

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

本文提出了名为 Preguss 的模块化细粒度框架，通过结合静态分析与大语言模型，利用潜在运行时错误引导验证单元构建与优先级排序，成功实现了对千行代码级大规模程序的高度自动化形式化验证，显著降低了人工验证成本。

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

Formally Verifying Quantum Phase Estimation Circuits with 1,000+ Qubits

本文提出了一种基于无量化位向量逻辑的符号化量子比特抽象方法，成功实现了对包含多达 1,024 个相位量子比特的量子相位估计电路的高效形式化验证，且内存占用低于 3.5 GB。

Arun Govindankutty, Sudarshan K. SrinivasanWed, 11 Ma⚛️ quant-ph

A Simple Constructive Bound on Circuit Size Change Under Truth Table Perturbation

该论文明确给出了在任意固定有限完备基下，真值表单点扰动导致电路规模变化不超过 $O(n)$ 的构造性上界，并通过 telescoping 论证将其推广至一般汉明距离，同时利用 SAT 求解器在 $n=4$ 时对 AIG 基的穷举验证确认了该上界的紧性。

Kirill KrinkinWed, 11 Ma💻 cs

Declarative Scenario-based Testing with RoadLogic

本文提出了 RoadLogic 这一开源工具，它通过结合答案集编程、运动规划及规范监控技术，成功将声明式的 OpenSCENARIO 规范自动转化为符合约束且多样化的可执行自动驾驶仿真场景，从而填补了现有方案在系统化实例化方面的空白。

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

d-DNNF Modulo Theories: A General Framework for Polytime SMT Queries

该论文提出了一种将 d-DNNF 知识编译技术扩展至 SMT 层面的通用框架，通过结合预计算理论引理将 SMT 查询转化为命题逻辑问题，从而利用现有的 d-DNNF 编译器实现多项式时间的 SMT 查询。

Gabriele Masina, Emanuale Civini, Massimo Michelutti, Giuseppe Spallitta, Roberto SebastianiWed, 11 Ma💻 cs

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

本文提出了 BemaGANv2，一种通过引入 AMP 生成模块和 MED 判别器，并系统评估多种判别器组合策略，以实现高保真、长时程音频生成（如文本转音乐/音频）的先进 GAN 语音合成器。

Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul KwonTue, 10 Ma🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

本文提出了名为 FATE 的新基准系列（包含 FATE-H 和 FATE-X），旨在填补大型语言模型在竞赛数学与研究级抽象代数形式化证明之间的能力鸿沟，评估结果显示当前最先进模型在该领域表现极差，且其将自然语言推理转化为形式化证明的能力远弱于推理本身。

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin DongTue, 10 Ma🤖 cs.LG

Classifying covering types in homotopy type theory

本文在齐次类型理论中形式化了覆盖空间与基本群子群之间的伽罗瓦对应，发展了覆盖空间的 n 维推广，并以此分类了透镜空间的覆盖及构造了庞加莱同调球。

Samuel Mimram, Émile OleonTue, 10 Ma🔢 math

Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications

本文提出了一种结合语法引导合成（SyGuS）与扩展了谓词和函数更新的时序流逻辑（TSL $_f$ ）的新方法，通过从执行轨迹中挖掘数据转换与时序规范，实现了比被动学习基线更鲁棒且样本效率更高的反应式程序合成。

Sam Nicholas Kouteili, William Fishell, Christian Scaff, Mark Santolucito, Ruzica PiskacTue, 10 Ma💻 cs

Three Fixed-Dimension Satisfiability Semantics for Quantum Logic: Implications and an Explicit Separator

本文比较了固定有限维希尔伯特空间上量子逻辑的三种可满足性语义，证明了标准语义蕴含局部偏布尔语义，后者又蕴含全局对易投影语义，并构造了一个显式公式作为标准语义可满足但后两者不可满足的分离实例，从而严格区分了这三种语义的可满足性类。

Joaquim Reizi HiguchiTue, 10 Ma🔢 math

Agent Hunt: Bounty Based Collaborative Autoformalization With LLM Agents

该论文提出了一种名为"Agent Hunt"的基于赏金机制的协作式自动形式化框架，通过让多个大语言模型代理在交互式定理证明环境中动态发布、竞标并完成代数拓扑领域的证明任务，从而探索去中心化的协作证明搜索与理论构建方法。

Chad E. Brown, Cezary Kaliszyk, Josef UrbanTue, 10 Ma💻 cs

Twitch: Learning Abstractions for Equational Theorem Proving

本文介绍了名为 Twitch 的工具，该工具利用 Stitch 自动从部分失败证明或相关定理的成功证明中发现等式定理证明中有用的抽象模式，并通过扩展 Twee 求解器，在 TPTP 单位等式问题上实现了 12 个难度为 1 的问题证明及显著的速度提升。

Guy Axelrod, Moa Johansson, Nicholas SmallboneTue, 10 Ma💻 cs

LLM2SMT: Building an SMT Solver with Zero Human-Written Code

该论文展示了一个大语言模型编码代理在零人工代码参与下，成功构建了一个具备预处理、同余闭包算法及反例证明生成能力的完整 DPLL(T) 风格 SMT 求解器，且其在 SMT-LIB 基准测试中表现具有竞争力。

Mikoláš Janota, Mirek OlšákTue, 10 Ma💻 cs

Elenchus: Generating Knowledge Bases from Prover-Skeptic Dialogues

本文提出了名为 Elenchus 的对话系统，该系统基于推论主义语义，通过人类专家与大型语言模型之间的“证明者 - 质疑者”对话来构建知识基，并将对话状态映射到 Hlobil 和 Brandom 的非单调多后继逻辑（NMMS）中，从而在 W3C PROV-O 本体等案例中实现了从对话协商到形式化推理的端到端集成。

Bradley P. AllenTue, 10 Ma💬 cs.CL

Learning to Rank the Initial Branching Order of SAT Solvers

该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法，在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力，但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)Tue, 10 Ma💻 cs

cs.LO