Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

该论文针对卫星巨型星座时代的需求,提出了对齐底层能力原则并开源了名为 SpaceHMchat 的人机协作全闭环航天器电源系统健康管理框架,通过构建硬件级故障注入实验平台及发布首个相关数据集,验证了其在工况识别、异常检测、故障定位及维护决策等任务中的卓越性能。

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng ChenWed, 11 Ma🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

本文提出了 CLEAR-Mamba 框架,通过引入基于超网络的自适应条件层(HaC)和基于证据不确定性学习的不确定性感知预测方案(RaP),并结合构建的大规模多模态眼底血管造影数据集,显著提升了眼科血管造影图像分类的跨域适应性、准确性及预测可靠性。

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin OoiWed, 11 Ma🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

该论文提出了一种名为 EigenData 的统一框架,通过结合自进化合成数据引擎与基于验证器的强化学习(RL),有效解决了多轮交互式工具使用智能体在数据合成扩展性及训练信号噪声方面的挑战,并在 tau^2-bench 基准测试中取得了媲美或超越前沿模型的性能。

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi WuWed, 11 Ma🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

本文提出了 UAT-LITE,一种无需重新训练即可在推理阶段通过蒙特卡洛 Dropout 将自注意力机制不确定性化的框架,通过引入层间方差分解诊断不确定性累积,显著提升了预训练 Transformer 在分布偏移下的校准性能与选择性预测能力。

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar YousefiWed, 11 Ma🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

该论文针对现有单目法线估计方法存在的 3D 几何错位问题,提出了一种名为 RoSE 的新范式,通过将法线估计重构为对几何信息更敏感的“阴影序列估计”,利用图像到视频生成模型预测阴影序列并求解最小二乘问题,从而在真实世界基准测试中实现了最先进的性能。

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song BaiWed, 11 Ma🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

受非平衡热力学启发的扩散模型虽性能卓越但推理延迟高,而现有蒸馏技术因丢弃中间步骤导致结构信息丢失和离散化误差,为此本文提出了 B-DENSE 框架,通过多分支轨迹对齐机制,让学生模型在扩展通道中同时映射教师轨迹的所有离散中间步骤,从而在训练早期实现密集监督并显著提升生成质量。

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree SinghiWed, 11 Ma🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

本文提出了一种基于 Grounding DINO 1.5、YOLOv11 和 SAM 2.1 的双流水线框架,通过零-shot 文本提示或轻量级监督微调实现鸟类图像分割,在 CUB-200-2011 数据集上显著超越了传统端到端模型,证明了提示驱动的基础模型在无需重新训练分割主干的情况下即可实现高精度分割。

Abhinav MunagalaWed, 11 Ma🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Pri4R 提出了一种简单有效的训练方法,通过利用特权 4D 信息(3D 点轨迹预测)作为辅助任务,使视觉 - 语言 - 动作(VLA)模型在无需增加推理开销的情况下,隐式地习得世界动力学规律,从而显著提升了其在复杂操作任务中的物理感知与控制能力。

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI