On the Value of Tokeniser Pretraining in Physics Foundation Models

Lo studio dimostra che il preaddestramento del tokenizzatore su un sistema fisico specifico migliora significativamente l'efficienza e l'accuratezza dei modelli fondazione per la fisica, riducendo l'errore di 64% rispetto all'addestramento da zero e introducendo nuove operazioni di compressione spaziotemporale adattabili.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

Identifying Adversary Characteristics from an Observed Attack

Questo articolo presenta un framework per identificare le caratteristiche dell'attaccante partendo da un attacco osservato, dimostrando che tale identificazione è teoricamente non univoca senza informazioni aggiuntive e proponendo un metodo dominio-indipendente per individuare l'aggressore più probabile al fine di migliorare le strategie di difesa sia esterne che interne ai modelli di apprendimento automatico.

Soyon Choi, Scott Alfeld, Meiyi Ma2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Il paper propone l'interpolated FID (iFID), una nuova metrica che interpola le rappresentazioni latenti tra i dati e i loro vicini più prossimi, dimostrando una forte correlazione con la qualità della generazione dei modelli di diffusione e risolvendo il problema della scarsa predittività del reconstruction FID tradizionale.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Questo paper propone l'Implicit Error Counting (IEC), un metodo di apprendimento per rinforzo senza riferimenti che valuta le risposte enumerando gli errori invece di utilizzare rubriche basate su risposte ideali, dimostrando la sua superiorità nel post-training per il virtual try-on su benchmark specifici.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Questo articolo dimostra che, nell'ambito della regressione ridge a caratteristiche casuali, un modello "forte" addestrato su etichette imperfette generate da un modello "debole" può superare significativamente le leggi di scala del proprio insegnante, raggiungendo persino il tasso ottimale minimax indipendentemente dalle prestazioni del teacher.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Questo studio analizza le strategie di parallelizzazione per il deployment di modelli LLM densi, evidenziando come l'uso combinato del parallelismo tensoriale e pipeline permetta di gestire i compromessi tra latenza e throughput in base ai requisiti specifici dell'applicazione.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Questo studio formalizza le limitazioni fondamentali e le opportunità nell'apprendimento delle equazioni differenziali che governano l'evoluzione delle reti temporali all'interno dei Grafi a Prodotto Dotale Casuali (RDPG), sviluppando un quadro geometrico basato su fibrati principali che collega ambiguità di gauge, dinamica e difficoltà statistica attraverso concetti di olonomia e gap spettrale.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

Il paper sostiene che, sebbene l'IA prometta avanzamenti senza precedenti nelle scienze climatiche, il suo attuale sviluppo concentrato nel Nord globale rischia di esacerbare le disuguaglianze Nord-Sud, richiedendo un approccio centrato sui dati, infrastrutture digitali pubbliche e co-produzione della conoscenza per garantire una resilienza sistemica equa.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Questo studio dimostra che l'adattamento di dominio non supervisionato, in particolare mediante la minimizzazione della discrepanza massima del momento medio (MMD), migliora significativamente la capacità di generalizzazione dei modelli di identificazione di radioisotopi addestrati su dati sintetici quando applicati a dati sperimentali reali non etichettati.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

Il paper introduce MIRACL, un nuovo framework gerarchico di Meta-Rinforzo Multi-Obiettivo che, integrando l'apprendimento composito e una strategia di adattamento basata su Pareto, permette una generalizzazione a pochi esempi e un'adattabilità efficiente in ambienti di ottimizzazione della catena di approvvigionamento complessi e dinamici, superando le prestazioni delle basi di riferimento tradizionali.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

Il paper propone SGPP, un quadro geometrico unificato che risolve le sfide del controllo dei modelli Rectified Flow formulando il recupero come un problema di ottimizzazione prossimale, garantendo teoricamente la convergenza sul manifold dei dati e generalizzando i metodi esistenti attraverso un bilanciamento continuo tra fedeltà all'input e libertà generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG