Align and Filter: Improving Performance in Asynchronous On-Policy RL

Il paper propone il metodo TACPO, basato su vincoli di ottimizzazione della politica allineati al vantaggio tramite variazione totale, per mitigare il ritardo della politica (policy lag) nei sistemi di apprendimento per rinforzo on-policy distribuiti e ad alta frequenza di aggiornamento, migliorando così le prestazioni sia in compiti classici che nel ragionamento matematico con LLM.

Homayoun Honari, Roger Creus Castanyer, Michael Przystupa + 3 more2026-03-03⚡ eess

3BASiL: An Algorithmic Framework for Sparse plus Low-Rank Compression of LLMs

Il paper introduce 3BASiL-TM, un metodo efficiente per la compressione one-shot dei Large Language Models basato su una decomposizione in somma di matrici sparse e a basso rango che, grazie a un nuovo algoritmo ADMM a tre blocchi e a un raffinamento di matching dei transformer, riduce significativamente il gap di prestazioni rispetto ai modelli densi e accelera i tempi di compressione rispetto agli stati dell'arte.

Mehdi Makni, Xiang Meng, Rahul Mazumder2026-03-03📊 stat

Tackling multiphysics problems via finite element-guided physics-informed operator learning

Questo lavoro presenta un framework di apprendimento di operatori informato dalla fisica e guidato dagli elementi finiti, implementato su Folax, che risolve con alta accuratezza problemi multifisici accoppiati su domini arbitrari senza dati etichettati, dimostrando l'efficacia di diverse architetture neurali come FNO e iFOL per la previsione indipendente dalla discretizzazione in scenari complessi.

Yusuke Yamazaki, Reza Najian Asl, Markus Apel + 2 more2026-03-03🤖 cs.LG

On the Stability Connection Between Discrete-Time Algorithms and Their Resolution ODEs: Applications to Min-Max Optimisation

Questo lavoro stabilisce un rigoroso legame tra la stabilità esponenziale degli algoritmi di ottimizzazione discreta e quella delle loro corrispondenti equazioni differenziali ordinarie di risoluzione, applicando tale quadro teorico per dimostrare la stabilità di punti di equilibrio in diversi metodi di ottimizzazione min-max, tra cui GEG e TT-PPM, senza richiedere l'assunzione di invarianza dell'Hessiano.

Amir Ali Farzin, Yuen-Man Pun, Philipp Braun + 1 more2026-03-03⚡ eess

Rate-Distortion Signatures of Generalization and Information Trade-offs

Questo studio introduce un quadro teorico basato sulla teoria della distorsione del tasso per analizzare i compromessi tra accuratezza e robustezza nella visione artificiale e biologica, rivelando che, sebbene entrambi i sistemi seguano principi di compressione, gli esseri umani mostrano trade-off più flessibili rispetto alle reti neurali profonde, che operano in regimi più rigidi e fragili.

Leyla Roksan Caglar, Pedro A. M. Mediano, Baihan Lin2026-03-03🧬 q-bio

Jump Like A Squirrel: Optimized Execution Step Order for Anytime Random Forest Inference

Questo articolo propone un approccio "Jump Like A Squirrel" che ottimizza l'ordine di esecuzione dei singoli passi negli alberi decisionali per trasformare le foreste casuali in algoritmi "anytime", permettendo di ottenere previsioni di qualità crescente anche con tempo di esecuzione limitato, con la "Backward Squirrel Order" che si dimostra una soluzione euristica quasi ottimale.

Daniel Biebert, Christian Hakert, Kay Heider + 3 more2026-03-03📊 stat

Transform-Invariant Generative Ray Path Sampling for Efficient Radio Propagation Modeling

Il paper propone un framework di apprendimento automatico basato su Generative Flow Networks che, integrando un buffer di esperienza, una politica esplorativa uniforme e un mascheramento delle azioni basato sulla fisica, supera i limiti computazionali del ray tracing tradizionale per la modellazione della propagazione radio, garantendo velocità di calcolo fino a 1000 volte superiori mantenendo alta accuratezza.

Jérome Eertmans, Enrico M. Vitucci, Vittorio Degli-Esposti + 3 more2026-03-03⚡ eess