AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Il paper presenta la AgrI Challenge, una competizione incentrata sui dati che introduce la validazione cross-team per valutare la generalizzazione dei modelli di visione artificiale agricola, dimostrando che l'addestramento collaborativo su dataset raccolti indipendentemente riduce drasticamente il divario di prestazione rispetto all'addestramento su singola fonte.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Prompt-Based Caption Generation for Single-Tooth Dental Images Using Vision-Language Models

Questo studio colma una lacuna nella diagnostica dentale digitale proponendo un nuovo approccio per generare didascalie specifiche per singoli denti tramite modelli visione-linguaggio, superando i limiti dei dataset esistenti che si concentrano su immagini dell'intera bocca o su patologie isolate.

Anastasiia Sukhanova, Aiden Taylor, Julian Myers, Zichun Wang, Kartha Veerya Jammuladinne, Satya Sri Rajiteswari Nimmagadda, Aniruddha Maiti, Ananya Jana2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Il paper presenta UnSCAR, un nuovo paradigma di ripristino delle immagini universale che, grazie a un'architettura a miscela di esperti multi-ramo, risolve i problemi di instabilità e dimenticanza delle conoscenze nell'apprendimento congiunto, consentendo un adattamento scalabile, controllabile e robusto a oltre sedici degradazioni e a domini non visti.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Generalization in Online Reinforcement Learning for Mobile Agents

Questo lavoro presenta AndroidWorld-Generalization, un benchmark e un sistema di apprendimento per rinforzo basato su GRPO, per valutare e migliorare la capacità di generalizzazione zero-shot degli agenti mobili VLM su istanze, template e applicazioni non visti, dimostrando significativi guadagni sulle istanze ma sfide persistenti su template e app, con il rilascio completo del codice per la riproducibilità.

Li Gu, Zihuan Jiang, Zhixiang Chi, Huan Liu, Ziqiang Wang, Yuanhao Yu, Glen Berseth, Yang Wang2026-03-10🤖 cs.LG

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

Il paper presenta "Data Agent", un framework end-to-end che formula la selezione dinamica dei dati come un problema di decisione sequenziale guidato da un agente che impara una politica di selezione adattiva, accelerando significativamente l'addestramento dei modelli su diverse architetture e dataset senza comprometterne le prestazioni.

Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria2026-03-10🤖 cs.LG

RPG-SAM: Reliability-Weighted Prototypes and Geometric Adaptive Threshold Selection for Training-Free One-Shot Polyp Segmentation

Il paper introduce RPG-SAM, un nuovo framework di segmentazione polipi one-shot senza addestramento che risolve l'eterogeneità regionale e di risposta attraverso l'estrazione di prototipi pesati per affidabilità, la selezione adattiva geometrica delle soglie e un ciclo di raffinamento iterativo, ottenendo un miglioramento del 5,56% di mIoU sul dataset Kvasir.

Weikun Lin, Yunhao Bai, Yan Wang2026-03-10💻 cs

Med-Evo: Test-time Self-evolution for Medical Multimodal Large Language Models

Il paper presenta Med-Evo, un innovativo framework di auto-evoluzione per modelli linguistici multimodali medici che, sfruttando l'apprendimento per rinforzo senza etichette tramite una strategia di pseudo-etichettatura guidata dalle caratteristiche e un sistema di ricompensa ibrido, migliora le prestazioni del modello su dati di test non annotati senza richiedere ulteriori dati etichettati.

Dunyuan Xu, Xikai Yang, Juzheng Miao, Yaoqian Li, Jinpeng Li, Pheng-Ann Heng2026-03-10💻 cs

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

Il paper presenta SLNet, una rete di riconoscimento per nuvole di punti 3D estremamente leggera e adattiva geometricamente che, grazie a componenti innovativi come NAPE e GMU, raggiunge prestazioni competitive su diversi benchmark con un numero di parametri e un costo computazionale drasticamente inferiori rispetto agli stati dell'arte.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

SIGMAE: A Spectral-Index-Guided Foundation Model for Multispectral Remote Sensing

SIGMAE è un modello fondazionale per il telerilevamento multispettrale che migliora l'apprendimento delle rappresentazioni spaziali e spettrali integrando indici spettrali di dominio in una strategia di mascheramento dinamico dei token guidata dalla salienza semantica, superando le prestazioni dei modelli preesistenti su diverse attività di classificazione e rilevamento.

Xiaokang Zhang, Bo Li, Chufeng Zhou, Weikang Yu, Lefei Zhang2026-03-10💻 cs

Selective Transfer Learning of Cross-Modality Distillation for Monocular 3D Object Detection

Il paper propone MonoSTL, un approccio di apprendimento selettivo che risolve il problema del trasferimento negativo nella distillazione cross-modale per la rilevazione 3D da singola immagine, integrando l'incertezza di profondità per selezionare efficacemente le caratteristiche e le relazioni positive da LiDAR e ottenendo così le migliori prestazioni rispetto agli stati dell'arte su KITTI e NuScenes.

Rui Ding, Meng Yang, Nanning Zheng2026-03-10💻 cs

Classifying Novel 3D-Printed Objects without Retraining: Towards Post-Production Automation in Additive Manufacturing

Questo lavoro presenta ThingiPrint, un nuovo dataset che associa modelli CAD a fotografie di oggetti stampati in 3D, e dimostra che un approccio di classificazione basato su prototipi con fine-tuning contrastivo permette di identificare nuovi oggetti senza necessità di riaddestramento, migliorando l'automazione nei flussi di lavoro post-produzione.

Fanis Mathioulakis, Gorjan Radevski, Silke GC Cleuren, Michel Janssens, Brecht Das, Koen Schauwaert, Tinne Tuytelaars2026-03-10💻 cs