KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

本文提出了 KernelCraft,这是首个用于评估大语言模型智能体在新兴硬件架构上通过反馈驱动流程自动生成和优化底层内核的基准测试,实验表明该方法能有效降低内核开发成本并生成性能优于传统编译器模板的高质量代码。

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren ZhaoWed, 11 Ma🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

该论文通过五项模型消融研究,证明了将监督对比学习、霍普菲尔德网络与层级门控循环网络协同集成到脉冲神经网络中,能够在 N-MNIST 数据集上实现分类精度、聚类结构、能效及稀疏度的综合最优,确立了记忆增强型神经形态系统的设计原则。

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid RehmanWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

本文提出了一种基于物理信息神经网络(PINN)的框架,能够仅利用部分电压观测数据,在强非线性和多尺度动力学条件下,鲁棒且准确地重建神经元模型中的隐藏状态变量并推断生物物理参数,有效克服了传统数值方法在初始猜测敏感和收敛失败方面的局限。

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Hindsight Credit Assignment for Long-Horizon LLM Agents

本文提出了 HCAPO 框架,通过利用大语言模型进行事后推理以优化步级 Q 值估计并引入多尺度优势机制修正价值基线,有效解决了长程任务中的稀疏奖励与信用分配难题,在 WebShop 和 ALFWorld 等基准测试中显著超越了现有强化学习方法。

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI