cs.AI 篇论文 | Gist.Science

Continual uncertainty learning

该研究提出了一种基于课程学习的持续不确定性学习框架，通过将多源不确定性分解为序列任务并结合模型基控制器进行残差学习，有效解决了非线性机械系统鲁棒控制中的样本效率低与灾难性遗忘问题，并成功实现了汽车动力总成主动振动控制的仿真到现实迁移。

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

本文提出了一种名为 ReDON 的新型架构，通过引入可重构的自调制非线性机制，克服了传统衍射光学神经网络缺乏高效非线性响应和可重编程性的局限，在几乎不增加功耗的情况下显著提升了图像识别与分割任务的准确率。

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

本文提出了名为 SafeGen-LLM 的安全泛化大语言模型，通过构建多领域 PDDL3 基准数据集并采用结合监督微调与基于形式化验证奖励机制的 GRPO 两阶段后训练框架，显著提升了机器人任务规划在满足安全约束及适应新安全属性方面的泛化能力，其表现优于现有前沿基线模型。

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

该论文提出了耦合离散扩散（CoDD）框架，通过引入轻量级概率推理层替代传统的完全因子化输出分布，成功打破了扩散语言模型中并行生成与依赖建模之间的“因子化壁垒”，在显著降低训练成本的同时实现了高质量、低延迟的推理生成。

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

本文提出了 OrthoAI 框架，通过结合稀疏监督的 3D 牙齿分割、基于本体约束的可行性推理以及多标准治疗评估，实现了在清矫正畸中从几何感知到临床推理的证据驱动型自动化决策支持。

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

本文提出了一种基于 Grounding DINO 1.5、YOLOv11 和 SAM 2.1 的双流水线框架，通过零-shot 文本提示或轻量级监督微调实现鸟类图像分割，在 CUB-200-2011 数据集上显著超越了传统端到端模型，证明了提示驱动的基础模型在无需重新训练分割主干的情况下即可实现高精度分割。

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Pri4R 提出了一种简单有效的训练方法，通过利用特权 4D 信息（3D 点轨迹预测）作为辅助任务，使视觉 - 语言 - 动作（VLA）模型在无需增加推理开销的情况下，隐式地习得世界动力学规律，从而显著提升了其在复杂操作任务中的物理感知与控制能力。

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

该论文提出了名为 Gome 的 MLE 智能体，通过将诊断推理映射为梯度计算等机制实现基于梯度的优化，实验表明在推理能力较强的模型上，该方法在 MLE-Bench 基准测试中显著超越了传统的树搜索范式。

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

本文提出了协调玻尔兹曼 MCTS（CB-MCTS），通过引入随机玻尔兹曼策略和衰减熵奖励来解决去中心化多智能体规划在稀疏或偏斜奖励环境下的探索难题，并在模拟中证明了其优于传统 Dec-MCTS 的鲁棒性。

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

该论文提出了名为 FinTexTS 的大规模金融文本 - 时间序列配对数据集，通过基于语义的上下文提取和多级（宏观、行业、关联公司及目标公司）新闻分类框架，有效解决了传统关键词匹配无法捕捉复杂市场关联的局限，并显著提升了股票价格预测性能。

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

该论文提出了一种名为 SPARC 的基于关系增强多头注意力（RMHA）的通信机制，通过将曼哈顿距离显式嵌入注意力权重计算，使机器人在去中心化多机器人路径规划中能够动态优先处理空间相关邻居的信息，从而在零样本泛化到大规模高密度场景时显著提升了任务成功率。

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

该论文提出了溢出感知缩放（OAS）和宏块缩放（MBS）两种纯软件技术，在无需硬件改动的前提下显著降低了 MXFP4 的量化误差，使其在保持硬件效率优势的同时，将端到端精度与 NVIDIA NVFP4 的差距从约 10% 缩小至 1% 以下。

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

该论文介绍了名为"Design Conductor"的自主智能体，它仅用 12 小时便从需求文档出发，全自动设计并验证了首款可运行 Linux、主频达 1.48 GHz 的 RISC-V 处理器（VerCore），实现了从概念到可流片 GDSII 文件的端到端芯片构建。

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

本文提出了 CktEvo，这是一个针对真实世界 IP 核的仓库级 RTL 代码基准测试与参考框架，旨在通过结合 LLM 编辑与工具链反馈的闭环系统，在保持功能正确性的同时实现跨文件依赖的功耗、性能和面积（PPA）优化。

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

本文提出了名为 SiliconMind-V1 的统一多智能体框架，通过集成测试台驱动的验证与推理导向的数据生成，实现了本地微调大模型在无需外部商业工具的情况下，能够以测试时扩展的方式迭代生成、测试并调试 Verilog RTL 设计，且在功能正确性上超越了现有最先进方法。

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

本文提出了 ALADIN 框架，旨在针对基于 Scratchpad 的嵌入式 AI 加速器，在不依赖目标平台部署的情况下，通过渐进式细化混合精度量化模型，实现对推理过程中精度、延迟与资源消耗之间权衡的精准评估与硬件软件协同设计分析。

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

该论文通过多智能体 LLM 模拟实验提出初步证据，表明旨在约束模型输出以符合人类价值观的对齐技术本身可能引发“医源性”集体病理，即不可见的审查和复杂的对齐约束反而会导致群体行为失调与认知 - 行动解离，从而揭示当前安全评估可能忽视了强约束带来的新型风险。

Hiroki Fukui2026-03-11🤖 cs.AI

cs.AI