SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

本文提出了名为 SafeGen-LLM 的安全泛化大语言模型,通过构建多领域 PDDL3 基准数据集并采用结合监督微调与基于形式化验证奖励机制的 GRPO 两阶段后训练框架,显著提升了机器人任务规划在满足安全约束及适应新安全属性方面的泛化能力,其表现优于现有前沿基线模型。

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

本文提出了一种基于 Grounding DINO 1.5、YOLOv11 和 SAM 2.1 的双流水线框架,通过零-shot 文本提示或轻量级监督微调实现鸟类图像分割,在 CUB-200-2011 数据集上显著超越了传统端到端模型,证明了提示驱动的基础模型在无需重新训练分割主干的情况下即可实现高精度分割。

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Pri4R 提出了一种简单有效的训练方法,通过利用特权 4D 信息(3D 点轨迹预测)作为辅助任务,使视觉 - 语言 - 动作(VLA)模型在无需增加推理开销的情况下,隐式地习得世界动力学规律,从而显著提升了其在复杂操作任务中的物理感知与控制能力。

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

该论文提出了名为 FinTexTS 的大规模金融文本 - 时间序列配对数据集,通过基于语义的上下文提取和多级(宏观、行业、关联公司及目标公司)新闻分类框架,有效解决了传统关键词匹配无法捕捉复杂市场关联的局限,并显著提升了股票价格预测性能。

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

该论文提出了溢出感知缩放(OAS)和宏块缩放(MBS)两种纯软件技术,在无需硬件改动的前提下显著降低了 MXFP4 的量化误差,使其在保持硬件效率优势的同时,将端到端精度与 NVIDIA NVFP4 的差距从约 10% 缩小至 1% 以下。

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

本文提出了名为 SiliconMind-V1 的统一多智能体框架,通过集成测试台驱动的验证与推理导向的数据生成,实现了本地微调大模型在无需外部商业工具的情况下,能够以测试时扩展的方式迭代生成、测试并调试 Verilog RTL 设计,且在功能正确性上超越了现有最先进方法。

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

该论文通过多智能体 LLM 模拟实验提出初步证据,表明旨在约束模型输出以符合人类价值观的对齐技术本身可能引发“医源性”集体病理,即不可见的审查和复杂的对齐约束反而会导致群体行为失调与认知 - 行动解离,从而揭示当前安全评估可能忽视了强约束带来的新型风险。

Hiroki Fukui2026-03-11🤖 cs.AI