Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

本文针对车联网协同感知中参数高效领域适应面临的性能下降与训练不稳定问题,提出了一种基于最优流理论的 FlowAdapt 框架,通过 Wasserstein 贪婪采样策略消除异构数据冗余,并利用渐进式知识转移模块缓解深层语义退化,从而在仅使用 1% 可训练参数的情况下实现了跨域适应的先进性能。

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

该论文通过名为 M2RL 的研究,系统对比并分析了大语言模型在多领域强化学习验证奖励(RLVR)任务中“混合多任务训练”与“分域训练后模型融合”两种范式的表现,发现跨领域 RLVR 干扰极小且推理密集型领域存在协同增益,并从权重空间几何等角度揭示了其内在机制。

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

本文提出了 SkillsBench 基准,通过 86 个跨领域任务评估发现,精心策划的 Agent 技能能显著提升大语言模型的平均通过率(+16.2%),且小模型借助技能可媲美无技能的大模型,但模型自主生成的技能往往无效,且技能效果在不同领域间存在显著差异。

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

Graph Neural Model Predictive Control for High-Dimensional Systems

本文提出了一种将图神经网络动力学模型与利用结构特性的模型预测控制相结合的框架,通过图表示和定制化的消元算法实现了高维系统(如软体机器人)的实时高效控制,并在仿真与硬件实验中验证了其在千节点规模下的高精度跟踪与避障能力。

Patrick Benito Eberhard, Luis Pabon, Daniele Gammelli, Hugo Buurmeijer, Amon Lahr, Mark Leone, Andrea Carron, Marco Pavone2026-03-10💻 cs

3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis

本文提出了 3DMedAgent,这是一种通过协调异构工具并利用长期结构化记忆,使现有的 2D 多模态大语言模型无需 3D 微调即可执行从感知到理解的渐进式 3D CT 分析的统一智能体,并在 DeepChestVQA 基准及 40 多项任务中展现了超越现有模型的卓越性能。

Ziyue Wang, Linghan Cai, Chang Han Low, Haofeng Liu, Junde Wu, Jingyu Wang, Rui Wang, Lei Song, Jiang Bian, Jingjing Fu, Yueming Jin2026-03-10💻 cs

OVerSeeC: Open-Vocabulary Costmap Generation from Satellite Images and Natural Language

本文提出了 OVerSeeC,一种基于“理解 - 定位 - 合成”模块化流程的零-shot 框架,能够利用大语言模型和开放词汇分割技术,直接从卫星图像和自然语言指令中生成适应未知实体与复杂任务偏好的全局代价图,从而实现可扩展的自主导航规划。

Rwik Rana, Jesse Quattrociocchi, Dongmyeong Lee, Christian Ellis, Amanda Adkins, Adam Uccello, Garrett Warnell, Joydeep Biswas2026-03-10💻 cs

SKYLIGHT: A Scalable Hundred-Channel 3D Photonic In-Memory Tensor Core Architecture for Real-time AI Inference

本文提出了一种名为 SKYLIGHT 的可扩展三维光子存内张量核心架构,通过共设计拓扑、波长路由、信号累加及编程机制,实现了支持实时推理与本地学习的百通道光子 AI 加速器,在能效和推理速度上显著超越现有 GPU 方案并展现出对硬件非理想性的强鲁棒性。

Meng Zhang, Ziang Yin, Nicholas Gangi, Alexander Chen, Brett Bamfo, Tianle Xu, Jiaqi Gu, Zhaoran Rena Huang2026-03-10💻 cs