DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting

本文评估了 DINOv3 作为冻结骨干网络在蓝莓机器人采摘任务(如分割与检测)中的表现,指出其虽能通过轻量级解码器显著提升分割效果,但在处理尺度变化及空间聚合目标(如簇检测)时存在局限,因此更适合作为依赖下游空间建模的语义骨干而非端到端任务模型。

Rui-Feng Wang, Daniel Petti, Yue Chen, Changying Li2026-03-10💻 cs

CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning

本文提出了名为 CGL 的持续 GUI 学习框架,通过基于策略熵动态调整监督微调与强化学习的比例,并采用将 SFT 梯度投影到 GRPO 锚点梯度上的梯度手术策略,有效解决了 GUI 智能体在适应新任务时遗忘旧知识的难题,同时发布了 AndroidControl-CL 基准以评估该性能。

Zhenquan Yao, Zitong Huang, Yihan Zeng, Jianhua Han, Hang Xu, Chun-Mei Feng, Jianwei Ma, Wangmeng Zuo2026-03-10🤖 cs.LG

Roots Beneath the Cut: Uncovering the Risk of Concept Revival in Pruning-Based Unlearning for Diffusion Models

该论文揭示了基于剪枝的扩散模型遗忘方法存在严重安全隐患,即被剪枝的权重位置本身会泄露关键信息,使得攻击者无需额外数据或训练即可完全恢复被遗忘的概念,并据此提出了相应的防御策略。

Ci Zhang, Zhaojun Ding, Chence Yang, Jun Liu, Xiaoming Zhai, Shaoyi Huang, Beiwen Li, Xiaolong Ma, Jin Lu, Geng Yuan2026-03-10🤖 cs.LG

Margin-Consistent Deep Subtyping of Invasive Lung Adenocarcinoma via Perturbation Fidelity in Whole-Slide Image Analysis

该论文提出了一种基于扰动保真度(Perturbation Fidelity)的边际一致性框架,通过结合注意力加权聚合与边际感知训练,显著提升了侵入性肺腺癌全切片图像亚型分类在真实世界扰动下的鲁棒性与跨机构泛化能力。

Meghdad Sabouri Rad (Vincent), Junze (Vincent), Huang, Mohammad Mehdi Hosseini, Rakesh Choudhary, Saverio J. Carello, Ola El-Zammar, Michel R. Nasr, Bardia Rodd2026-03-10💻 cs

ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging

该论文针对注意力机制在基于实例的学习(MIL)中存在的动态不稳定、过拟合及注意力过度集中三大问题,提出了一种引入锚点模型、归一化 Sigmoid 函数及 Token 随机丢弃的 ASMIL 统一框架,显著提升了全切片图像(WSI)诊断的性能。

Linfeng Ye, Shayan Mohajer Hamidi, Zhixiang Chi, Guang Li, Mert Pilanci, Takahiro Ogawa, Miki Haseyama, Konstantinos N. Plataniotis2026-03-10💻 cs