JiSAM: Alleviate Labeling Burden and Corner Case Problems in Autonomous Driving via Minimal Real-World Data

Il paper presenta JiSAM, un metodo plug-and-play che combina aumentazione tramite jittering, un backbone consapevole del dominio e un allineamento settoriale basato sulla memoria per ridurre il carico di annotazione dei dati reali e colmare il divario simulazione-realtà, permettendo di ottenere prestazioni di rilevamento 3D paragonabili a quelle ottenute con dati reali completi utilizzando solo il 2,5% di dati etichettati reali.

Runjian Chen, Wenqi Shao, Bo Zhang + 3 more2026-03-02💻 cs

Towards Generating Realistic 3D Semantic Training Data for Autonomous Driving

Questo lavoro propone un nuovo metodo per generare dati sintetici 3D realistici con annotazioni semantiche per la guida autonoma, eliminando le proiezioni intermedie e i modelli decoupled per colmare il divario tra dati reali e simulati, dimostrando che l'uso di questi dati sintetici insieme a quelli reali migliora le prestazioni dei modelli di segmentazione semantica.

Lucas Nunes, Rodrigo Marcuzzi, Jens Behley + 1 more2026-03-02💻 cs

FermatSyn: SAM2-Enhanced Bidirectional Mamba with Isotropic Spiral Scanning for Multi-Modal Medical Image Synthesis

FermatSyn è un nuovo approccio per la sintesi di immagini mediche multimodali che combina un codificatore basato su SAM2, un modulo di downsampling gerarchico e una strategia di scansione a spirale di Fermat all'interno di un Mamba bidirezionale, superando i metodi esistenti nel preservare sia la coerenza anatomica globale che i dettagli locali ad alta fedeltà.

Feng Yuan2026-03-02⚡ eess

Cora: Correspondence-aware image editing using few step diffusion

Il paper presenta Cora, un nuovo framework di editing delle immagini basato su diffusione in pochi passaggi che, grazie alla correzione del rumore consapevole della corrispondenza e alle mappe di attenzione interpolate, risolve le limitazioni strutturali e di preservazione degli attributi tipiche dei metodi esistenti, garantendo risultati superiori nel trasferimento di texture e nella generazione di nuovi contenuti.

Amirhossein Alimohammadi, Aryan Mikaeili, Sauradip Nag + 3 more2026-03-02💻 cs

SelvaBox: A high-resolution dataset for tropical tree crown detection

Il paper introduce SelvaBox, il più grande dataset open-access per il rilevamento delle chiome degli alberi tropicali in immagini da drone ad alta risoluzione, che con oltre 83.000 etichette manuali e risultati di benchmark superiori dimostra come l'addestramento su dati ad alta risoluzione migliori significativamente l'accuratezza e la capacità di generalizzazione dei modelli.

Hugo Baudchon, Arthur Ouaknine, Martin Weiss + 5 more2026-03-02💻 cs

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

Questo lavoro illustra l'uso delle Macchine a Boosting Esplicabili (EBM) in un approccio di Machine Learning guidato dalla conoscenza per identificare le sommità sovrastanti (overshooting tops) nelle immagini satellitari, dimostrando come sia possibile sviluppare algoritmi interpretabili che integrano strategie umane per migliorare l'affidabilità nelle previsioni meteorologiche ad alto rischio.

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG