Weakly Supervised Concept Learning with Class-Level Priors for Interpretable Medical Diagnosis

Il documento presenta il Prior-guided Concept Predictor (PCP), un nuovo framework di apprendimento debolmente supervisionato che, sfruttando prior di classe e meccanismi di regolarizzazione, permette di ottenere diagnosi mediche interpretabili senza costose annotazioni concettuali, superando significativamente le prestazioni dei modelli zero-shot e competendo con quelli completamente supervisionati.

Md Nahiduzzaman, Steven Korevaar, Alireza Bab-Hadiashar + 1 more2026-03-05💻 cs

Improving Multi-View Reconstruction via Texture-Guided Gaussian-Mesh Joint Optimization

Questo articolo propone un nuovo framework unificato che ottimizza simultaneamente la geometria della mesh e i colori dei vertici, guidati dai Gaussiani, per ottenere ricostruzioni 3D di alta qualità da immagini multi-vista, superando la separazione tradizionale tra accuratezza geometrica e rendering fotorealistico e abilitando così compiti di editing downstream come il rilighting e la deformazione.

Zhejia Cai, Puhua Jiang, Shiwei Mao + 2 more2026-03-05🤖 cs.AI

Scriboora: Rethinking Human Pose Forecasting

Il paper "Scriboora" presenta una pipeline unificata per la previsione della posa umana, evidenzia problemi di riproducibilità, dimostra come i modelli linguistici possano migliorare le prestazioni attuali e valuta la robustezza dei modelli su dati rumorosi derivanti da stime di posa reali, proponendo una nuova variante del dataset e tecniche di affinamento non supervisionato per recuperare le prestazioni perse.

Daniel Bermuth, Alexander Poeppel, Wolfgang Reif2026-03-05💻 cs

Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers

Questo lavoro introduce il *Measurement-Consistent Langevin Corrector* (MCLC), un modulo teorico e plug-and-play che stabilizza i risolutori di problemi inversi basati su modelli di diffusione latente riducendo la discrepanza tra le dinamiche del solver e quelle apprese dal modello, garantendo così un comportamento più affidabile nello spazio latente senza fare affidamento su assunzioni di varietà lineare.

Lee Hyoseok, Sohwi Lim, Eunju Cha + 1 more2026-03-05🤖 cs.LG

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Questo studio presenta un pipeline automatizzato end-to-end per l'identificazione delle fratture della colonna cervicale che, combinando rilevamento 2D, segmentazione multi-proiezione e modelli ibridi CNN-Transformer, ricostruisce volumi 3D stimati per ottenere prestazioni diagnostiche comparabili a quelle degli esperti riducendo al contempo la dimensionalità computazionale.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges

Il documento presenta i risultati della prima competizione internazionale sulla biometria del passo, che ha utilizzato il nuovo dataset StepUP-P150 per valutare modelli di riconoscimento, evidenziando un tasso di errore del 10,77% come miglior risultato ma sottolineando le sfide persistenti nella generalizzazione a diversi tipi di calzature.

Robyn Larracy, Eve MacDonald, Angkoon Phinyomark + 5 more2026-03-05🤖 cs.LG

When Safety Collides: Resolving Multi-Category Harmful Conflicts in Text-to-Image Diffusion via Adaptive Safety Guidance

Il paper propone CASG, un framework senza addestramento che risolve i conflitti di sicurezza multi-categoria nella generazione di immagini da testo identificando dinamicamente la categoria dannosa predominante e applicando una guida di sicurezza mirata, riducendo così il tasso di contenuti nocivi fino al 15,4% rispetto ai metodi esistenti.

Yongli Xiang, Ziming Hong, Zhaoqing Wang + 3 more2026-03-05💻 cs