Scaling Laws For Diffusion Transformers

Questo studio conferma per la prima volta l'esistenza di leggi di scalabilità nei Diffusion Transformers (DiT), dimostrando che la perdita di pre-addestramento segue una relazione di potenza con il calcolo computazionale, permettendo così di prevedere con precisione le dimensioni ottimali del modello, i requisiti di dati e le prestazioni di generazione per budget computazionali anche molto elevati.

Zhengyang Liang, Hao He, Ceyuan Yang + 1 more2026-03-05💻 cs

FlowCLAS: Enhancing Normalizing Flow Via Contrastive Learning For Anomaly Segmentation

Il paper introduce FlowCLAS, un framework ibrido che potenzia i flussi normalizzanti per la segmentazione delle anomalie nei robot combinando l'obiettivo di massima verosimiglianza con una perdita di contrasto tramite esposizione agli outlier, ottenendo così prestazioni all'avanguardia e colmando il divario con i metodi discriminatori.

Chang Won Lee, Selina Leveugle, Svetlana Stolpner + 4 more2026-03-05🤖 cs.LG

Building a Mind Palace: Structuring Environment-Grounded Semantic Graphs for Effective Long Video Analysis with LLMs

Il paper presenta VideoMindPalace, un nuovo framework che organizza i momenti chiave dei video in un grafo semantico strutturato ispirato al "palazzo della mente" per migliorare l'analisi di video lunghi e il ragionamento spaziotemporale nei modelli linguistici visivi, accompagnato dal benchmark VMB per valutarne le capacità.

Zeyi Huang, Yuyang Ji, Xiaofang Wang + 11 more2026-03-05💻 cs

A dataset of high-resolution plantar pressures for gait analysis across varying footwear and walking speeds

Il paper introduce il dataset UNB StepUP-P150, una raccolta di oltre 200.000 misurazioni ad alta risoluzione delle pressioni plantari di 150 individui in diverse condizioni di calzatura e velocità, destinata a stabilire un nuovo benchmark per l'analisi e il riconoscimento del passo tramite tecnologie di pressione sotto il piede.

Robyn Larracy, Angkoon Phinyomark, Ala Salehi + 5 more2026-03-05🤖 cs.LG

Generative Human Geometry Distribution

Il paper presenta un nuovo modello generativo basato su distribuzioni geometriche che, attraverso l'encoding delle distribuzioni in mappe di caratteristiche 2D e l'uso di modelli SMPL in un framework di training a due stadi, supera gli stati dell'arte nella generazione di geometrie umane realistiche con dettagli di abbigliamento e interazioni corpo-vestiti, ottenendo un miglioramento del 57% nella qualità geometrica.

Xiangjun Tang, Biao Zhang, Peter Wonka2026-03-05💻 cs

When Memory Becomes a Vulnerability: Towards Multi-turn Jailbreak Attacks against Text-to-Image Generation Systems

Il paper propone "Inception", il primo attacco di jailbreak multi-turno che sfrutta i meccanismi di memoria dei sistemi di generazione testo-immagine per aggirare i filtri di sicurezza suddividendo e ricorsivamente elaborando le intenzioni malevole, ottenendo un tasso di successo superiore del 20% rispetto alle tecniche esistenti.

Shiqian Zhao, Jiayang Liu, Yiming Li + 9 more2026-03-05💻 cs

Apple's Synthetic Defocus Noise Pattern: Characterization and Forensic Applications

Questo articolo caratterizza il "Pattern di Rumore di Sfocatura Sintetica" (SDNP) introdotto da Apple nelle foto in modalità ritratto, proponendo un metodo per la sua stima precisa e dimostrando come il suo utilizzo per mascherare le aree interessate migliori l'accuratezza della verifica forense della fonte della fotocamera, riducendo significativamente i falsi positivi.

David Vázquez-Padín, Fernando Pérez-González, Pablo Pérez-Miguélez2026-03-05💻 cs

BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Digital Behavioural Change

Questo paper introduce il dataset BAH, un nuovo insieme di dati multimodale composto da 1.427 video annotati da esperti per il riconoscimento automatico dell'ambivalenza e dell'esitazione nei contesti di cambiamento comportamentale digitale, fornendo anche risultati preliminari che evidenziano la necessità di modelli spaziotemporali avanzati.

Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan + 6 more2026-03-05🤖 cs.LG