SAMRI-2: A Memory-based Model for Cartilage and Meniscus Segmentation in 3D MRIs of the Knee Joint

Questo studio presenta SAMRI-2, un modello di visione artificiale basato sulla memoria e arricchito da una strategia di mescolamento ibrida, che supera le prestazioni degli attuali metodi di segmentazione per la cartilagine e il menisco nelle risonanze magnetiche 3D del ginocchio, garantendo alta precisione con un ridotto sforzo di annotazione.

Danielle L. Ferreira, Bruno A. A. Nunes, Xuzhe Zhang + 3 more2026-02-24⚡ eess

Can Vision-Language Models Answer Face to Face Questions in the Real-World?

Questo lavoro introduce il dataset e il benchmark Qualcomm Interactive Video Dataset (IVD) per valutare le capacità dei modelli visione-linguaggio di rispondere in tempo reale a domande su scene reali, dimostrando che, sebbene i modelli attuali siano molto inferiori agli esseri umani, il fine-tuning su questo tipo di dati può colmare significativamente il divario nelle competenze percettive necessarie.

Reza Pourreza, Rishit Dagli, Apratim Bhattacharyya + 3 more2026-02-24💻 cs

Learn by Reasoning: Analogical Weight Generation for Few-Shot Class-Incremental Learning

Il paper propone un metodo innovativo per l'apprendimento incrementale di nuove classi con pochi esempi, ispirato all'analogia umana, che genera pesi per le nuove classi senza fine-tuning dei parametri utilizzando un generatore analogico basato su tre moduli specifici, ottenendo risultati superiori rispetto agli stati dell'arte su diversi dataset.

Jizhou Han, Chenhao Ding, Yuhang He + 4 more2026-02-24🤖 cs.AI