Bootstrap Dynamic-Aware 3D Visual Representation for Scalable Robot Learning

Il paper introduce AFRO, un framework auto-supervisionato che apprende rappresentazioni 3D consapevoli della dinamica robotica senza supervisione sulle azioni o sulla ricostruzione geometrica, migliorando significativamente il successo nelle attività di manipolazione rispetto ai metodi di pre-addestramento esistenti.

Qiwei Liang, Boyang Cai, Minghao Lai, Sitong Zhuang, Tao Lin, Yan Qin, Yixuan Ye, Jiaming Liang, Renjing Xu2026-03-11💻 cs

AVGGT: Rethinking Global Attention for Accelerating VGGT

Il paper AVGGT propone uno schema di accelerazione senza addestramento per i modelli VGGT e π3\pi^3, basato su un'analisi dei ruoli dei livelli di attenzione globale che permette di ottenere un significativo aumento della velocità di inferenza (fino a 10 volte) mantenendo o migliorando la precisione in scenari multi-vista densi.

Xianbing Sun, Zhikai Zhu, Zhengyu Lou, Bo Yang, Jinyang Tang, Liqing Zhang, He Wang, Jianfu Zhang2026-03-11💻 cs

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

Il paper presenta LiM-YOLO, un rilevatore di navi ottimizzato per immagini satellitari che migliora accuratezza ed efficienza attraverso uno spostamento dei livelli della piramide delle caratteristiche da P3-P5 a P2-P4 e l'uso di normalizzazione a gruppi, risolvendo così le sfide poste dalla grande disparità di scala e dai rapporti d'aspetto elevati dei bersagli marittimi.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin Kim2026-03-11⚡ eess

ADHint: Adaptive Hints with Difficulty Priors for Reinforcement Learning

Il paper presenta ADHint, un metodo di apprendimento per rinforzo che integra dinamicamente le difficoltà dei campioni e dei roll-out nella pianificazione degli indizi e nella stima del vantaggio, migliorando così l'efficienza dei campioni, la stabilità dell'addestramento e la capacità di generalizzazione del ragionamento.

Feng Zhang, Zezhong Tan, Xinhong Ma, Ziqiang Dong, Xi Leng, Jianfei Zhao, Xin Sun, Yang Yang2026-03-11🤖 cs.LG

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Questo lavoro introduce il benchmark DivGenBench per quantificare il collasso delle modalità di preferenza nei modelli di diffusione e propone D²-Align, un nuovo framework di allineamento che mitiga tale fenomeno correggendo direzionalmente il segnale di ricompensa per preservare la diversità generativa.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

Il paper presenta CLEAR-Mamba, un framework avanzato basato su MedMamba che integra un layer di condizionamento adattivo (HaC) e un meccanismo di previsione affidabile (RaP) per migliorare l'accuratezza, l'adattabilità e l'affidabilità nella classificazione multi-sequenza di angiografie oftalmiche FFA e ICGA, superando le limitazioni delle metodologie esistenti grazie a un nuovo dataset su larga scala.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Il paper introduce la Correzione in Tempo di Test (TTC), un metodo privo di addestramento che utilizza il primo frame come riferimento stabile per correggere l'accumulo di errori nella generazione di video lunghi tramite modelli autoregressivi distillati, ottenendo risultati di alta qualità con un costo computazionale trascurabile.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo2026-03-11💻 cs

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

Il paper propone B-DENSE, un nuovo framework che migliora l'efficienza dell'inferenza nei modelli di diffusione tramite allineamento denso di traiettorie multi-ramo, permettendo al modello studente di apprendere informazioni strutturali intermedie complete e ottenere una qualità di generazione superiore rispetto alle tecniche di distillazione esistenti.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

Il paper presenta ChimeraLoRA, un metodo che combina un LoRA condiviso a livello di classe con LoRA specifici per immagine, potenziati da un meccanismo di rafforzamento semantico e combinati tramite una distribuzione di Dirichlet, per generare dataset sintetici diversificati e ricchi di dettagli che migliorano l'accuratezza nella classificazione in scenari con pochi dati.

Hoyoung Kim, Minwoo Jang, Jabin Koo, Sangdoo Yun, Jungseul Ok2026-03-11💻 cs