cs.LG 篇论文 | Gist.Science

Equitable Multi-Task Learning for AI-RANs

本文提出了一种名为 OWO-FMTL 的在线双层公平多任务学习框架，通过结合共享模型更新与轻量级原对偶重平衡机制，在 AI 无线接入网络中实现了低开销、可调节效率与公平性权衡的长期用户性能均衡。

Panayiotis Raptis, Fatih Aslan, George IosifidisWed, 11 Ma🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

本文提出了 KernelCraft，这是首个用于评估大语言模型智能体在新兴硬件架构上通过反馈驱动流程自动生成和优化底层内核的基准测试，实验表明该方法能有效降低内核开发成本并生成性能优于传统编译器模板的高质量代码。

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren ZhaoWed, 11 Ma🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

本文提出了 ALADIN 框架，旨在针对基于 Scratchpad 的嵌入式 AI 加速器，在不依赖目标平台部署的情况下，通过渐进式细化混合精度量化模型，实现对推理过程中精度、延迟与资源消耗之间权衡的精准评估与硬件软件协同设计分析。

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

本文综述了超低功耗边缘与片上传感器 AI 处理器的演进现状，并通过在 GAP9、STM32N6 和 Sony IMX500 三种代表性平台上对 PicoSAM2 模型的实证基准测试，揭示了不同架构在延迟、能效及能量延迟积方面的性能权衡，突显了片上传感器处理技术的成熟度与重要性。

Luigi Capogrosso, Pietro Bonazzi, Michele MagnoWed, 11 Ma🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

本文提出了一种面向多像素处理的数据速率感知 CNN FPGA 加速器架构，通过设计空间探索优化层间配置，在保持数据连续流动的同时显著降低了算术资源消耗，从而实现了复杂 CNN 在单一 FPGA 上的高效部署。

Tobias Habermann, Martin KummWed, 11 Ma🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

该论文通过五项模型消融研究，证明了将监督对比学习、霍普菲尔德网络与层级门控循环网络协同集成到脉冲神经网络中，能够在 N-MNIST 数据集上实现分类精度、聚类结构、能效及稀疏度的综合最优，确立了记忆增强型神经形态系统的设计原则。

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid RehmanWed, 11 Ma🤖 cs.LG

Hebbian-Oscillatory Co-Learning

本文提出了 Hebbian-Oscillatory Co-Learning (HOC-L) 框架，通过利用 Kuramoto 型相位同步的宏观序参量门控 Hebbian 结构更新，将双曲稀疏几何与振荡器注意力机制统一为一种具有收敛性证明和 $O(n \cdot k)$ 复杂度的生物启发式稀疏神经网络架构。

Hasi HaysWed, 11 Ma🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

该论文提出了名为 Auralink SDC 的边缘部署 AI 架构，通过置信度校准自主修复、自适应检索增强推理及分层多智能体编排等关键技术，在满足严格安全约束的商用硬件上实现了亚 50 毫秒延迟，从而将电动汽车充电基础设施的自主故障解决率提升至 78%。

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

本文提出了一种基于敏感度引导的压缩框架，通过系统性地探索量化与剪枝的权衡，在 FPGA 实现中显著提升了储层计算加速器的硬件效率（如降低功耗延迟积），同时保持了模型精度。

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

本文提出了专为 AI 加速器设计的 AetherFloat 系列浮点架构，通过采用四基（Base-4）缩放、显式尾数及无块缩放（Block-Scale-Free）特性，在消除动态缩放硬件开销的同时，显著降低了 MAC 单元的芯片面积、功耗和延迟，并实现了更优的动态范围与梯度稳定性。

Keita MorisakiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

本文提出了一种基于物理信息神经网络（PINN）的框架，能够仅利用部分电压观测数据，在强非线性和多尺度动力学条件下，鲁棒且准确地重建神经元模型中的隐藏状态变量并推断生物物理参数，有效克服了传统数值方法在初始猜测敏感和收敛失败方面的局限。

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

本文针对多变量时间序列建模中变量顺序人为性导致的问题，从理论上证明了置换等变线性状态空间系统的规范形式，并据此提出了 VI 2D SSM 及其架构 VI 2D Mamba，通过消除变量轴上的序列依赖链，在降低计算复杂度与简化稳定性分析的同时实现了卓越的性能。

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

本文提出了 HCAPO 框架，通过利用大语言模型进行事后推理以优化步级 Q 值估计并引入多尺度优势机制修正价值基线，有效解决了长程任务中的稀疏奖励与信用分配难题，在 WebShop 和 ALFWorld 等基准测试中显著超越了现有强化学习方法。

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

该论文提出了一种将群 $G$ 在乘积空间 $X \times M$ 上的不变函数简化为 $M$ 的迷向子群 $H$ 在 $X$ 上不变量的通用方法，通过建立轨道等价关系消除了现有等变神经场方法的结构限制，使其能够适用于任意群作用和同质条件空间。

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J BekkersWed, 11 Ma🤖 cs.AI

On the Formal Limits of Alignment Verification

该论文证明了在 AI 对齐验证中，无法同时满足完备性、通用性和可计算性这三个属性，从而确立了形式化对齐认证的固有局限，并指出通过放宽任一条件仍可实现有意义的保障。

Ayushi AgarwalWed, 11 Ma🤖 cs.LG

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

本文提出了 SPREAD 框架，通过利用奇异值分解在低秩子空间中对齐策略表示以保留任务几何结构，并结合基于置信度的蒸馏策略，有效解决了终身模仿学习中的灾难性遗忘问题，在 LIBERO 基准测试中实现了最先进的性能。

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

本文介绍了 Midicoth，一种通过引入基于二叉树分解的微观扩散去噪层，将概率校准转化为一系列高效二分类任务，从而在稀疏数据下修正自适应统计模型偏差并实现无损压缩的在线系统。

Roberto TacconelliWed, 11 Ma🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

本文提出了一种结合技能基课程学习的多层级元强化学习框架，通过递归压缩马尔可夫决策过程（MDP）来构建层级结构，从而有效降低随机性、解耦子任务并促进技能在不同问题与层级间的迁移，最终实现更高效且可解释的复杂序列决策。

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

The Temporal Markov Transition Field

本文提出了“时间马尔可夫转移场”（TMTF），通过划分时间序列为多个连续片段并分别估计局部转移矩阵，解决了传统马尔可夫转移场（MTF）在刻画非平稳过程时因全局平均而丢失时序动态信息的缺陷，从而生成能清晰反映不同时间段演化特征的二维图像表示。

Michael LeznikWed, 11 Ma🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

该论文提出了 SoftJAX 和 SoftTorch 两个开源库，旨在通过将阈值、布尔逻辑、离散索引和排序等“硬”原语替换为具有信息梯度的“软”松弛版本，解决现有自动微分框架中不可导操作的问题，从而赋能更广泛的科学领域优化。

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg MartiusWed, 11 Ma🤖 cs.LG