Bandwidth-adaptive Cloud-Assisted 360-Degree 3D Perception for Autonomous Vehicles

Il paper propone un sistema ibrido cloud-veicolo che, sfruttando la comunicazione V2X e modelli transformer per la fusione dei dati sensoriali, adatta dinamicamente il carico computazionale e la quantizzazione delle feature per garantire una percezione 3D a 360 gradi con latenza ridotta e maggiore accuratezza rispetto alle soluzioni puramente onboard.

Faisal Hawladera, Rui Meireles, Gamal Elghazaly + 2 more2026-03-02🤖 cs.LG

Ref-Adv: Exploring MLLM Visual Reasoning in Referring Expression Tasks

Il paper introduce Ref-Adv, un nuovo benchmark per la comprensione delle espressioni referenziali progettato per eliminare scorciatoie e testare rigorosamente il ragionamento visivo dei modelli linguistici multimodali, rivelando che, nonostante le prestazioni elevate su dataset esistenti, gli attuali modelli MLLM falliscono nel gestire espressioni linguisticamente complesse e distrattori difficili.

Qihua Dong, Kuo Yang, Lin Ju + 6 more2026-03-02💬 cs.CL

Experience-Guided Self-Adaptive Cascaded Agents for Breast Cancer Screening and Diagnosis with Reduced Biopsy Referrals

Il paper propone BUSD-Agent, un framework multi-agente auto-adattivo guidato dall'esperienza che riduce significativamente i rinvii per biopsia e le escalation diagnostiche nel screening e nella diagnosi del cancro al seno tramite ultrasuoni, recuperando casi storici simili per adattare dinamicamente le decisioni senza aggiornamenti parametrici.

Pramit Saha, Mohammad Alsharid, Joshua Strong + 1 more2026-03-02🤖 cs.AI

CC-VQA: Conflict- and Correlation-Aware Method for Mitigating Knowledge Conflict in Knowledge-Based Visual Question Answering

Il paper presenta CC-VQA, un metodo senza addestramento per il Visual Question Answering basato sulla conoscenza che mitiga i conflitti di conoscenza integrando un ragionamento sui conflitti centrato sulla visione e una codifica e decodifica guidata dalle correlazioni, ottenendo prestazioni all'avanguardia su diversi benchmark.

Yuyang Hong, Jiaqi Gu, Yujin Lou + 7 more2026-03-02💻 cs

Clinically-aligned ischemic stroke segmentation and ASPECTS scoring on NCCT imaging using a slice-gated loss on foundation representations

Il paper propone un framework di segmentazione dell'ictus ischemico e di scoring ASPECTS su TC non contrastata che, integrando rappresentazioni di modelli foundation con un nuovo meccanismo di perdita "gated" per garantire coerenza anatomica, supera le prestazioni dei metodi precedenti senza aggiungere complessità inferenziale.

Hiba Azeem, Behraj Khan, Tahir Qasim Syed2026-03-02⚡ eess

Extending 2D foundational DINOv3 representations to 3D segmentation of neonatal brain MR images

Il paper propone una strategia di segmentazione volumetrica che estende le rappresentazioni fondazionali 2D congelate di DINOv3 alla segmentazione 3D delle immagini RM cerebrali neonatali, ottenendo una buona accuratezza nell'identificazione dell'ippocampo attraverso un meccanismo strutturato di decomposizione e ricomposizione delle finestre.

Annayah Usman, Behraj Khan, Tahir Qasim Syed2026-03-02⚡ eess