cs.LG articoli | Gist.Science

On the Value of Tokeniser Pretraining in Physics Foundation Models

Lo studio dimostra che il preaddestramento del tokenizzatore su un sistema fisico specifico migliora significativamente l'efficienza e l'accuratezza dei modelli fondazione per la fisica, riducendo l'errore di 64% rispetto all'addestramento da zero e introducendo nuove operazioni di compressione spaziotemporale adattabili.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications

Questo lavoro propone il primo framework di verifica robusta accoppiata per i rilevatori di punti chiave basati su heatmap, che utilizza un programma lineare intero misto per garantire la stabilità congiunta di tutti i punti chiave, superando i limiti conservativi dei metodi decoupled precedenti.

Xusheng Luo, Changliu Liu2026-03-09🤖 cs.LG

Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior

Il paper presenta behavior-dLDS, un modello di sistemi dinamici lineari decomposti che disentangla le dinamiche neurali latenti correlate al comportamento da quelle computazionali interne, dimostrando efficacia su dati simulati e su registrazioni su larga scala di zebrafish.

Eva Yezerets, En Yang, Misha B. Ahrens, Adam S. Charles2026-03-09🤖 cs.LG

RACAS: Controlling Diverse Robots With a Single Agentic System

Il paper presenta RACAS, un'architettura agente basata su modelli linguistici che permette il controllo a ciclo chiuso di robot eterogenei tramite descrizioni in linguaggio naturale, eliminando la necessità di riaddestramento o modifiche al codice sorgente quando si cambia piattaforma.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

Identifying Adversary Characteristics from an Observed Attack

Questo articolo presenta un framework per identificare le caratteristiche dell'attaccante partendo da un attacco osservato, dimostrando che tale identificazione è teoricamente non univoca senza informazioni aggiuntive e proponendo un metodo dominio-indipendente per individuare l'aggressore più probabile al fine di migliorare le strategie di difesa sia esterne che interne ai modelli di apprendimento automatico.

Soyon Choi, Scott Alfeld, Meiyi Ma2026-03-09🤖 cs.LG

Making Reconstruction FID Predictive of Diffusion Generation FID

Il paper propone l'interpolated FID (iFID), una nuova metrica che interpola le rappresentazioni latenti tra i dati e i loro vicini più prossimi, dimostrando una forte correlazione con la qualità della generazione dei modelli di diffusione e risolvendo il problema della scarsa predittività del reconstruction FID tradizionale.

Tongda Xu, Mingwei He, Shady Abu-Hussein, Jose Miguel Hernandez-Lobato, Haotian Zhang, Kai Zhao, Chao Zhou, Ya-Qin Zhang, Yan Wang2026-03-09🤖 cs.LG

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Questo paper propone l'Implicit Error Counting (IEC), un metodo di apprendimento per rinforzo senza riferimenti che valuta le risposte enumerando gli errori invece di utilizzare rubriche basate su risposte ideali, dimostrando la sua superiorità nel post-training per il virtual try-on su benchmark specifici.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

The Value of Graph-based Encoding in NBA Salary Prediction

Questo articolo dimostra che l'integrazione di embedding di un grafo della conoscenza, derivato da dati on e off-court, nei modelli di apprendimento supervisionato migliora significativamente la previsione degli stipendi dei giocatori NBA, superando i limiti degli approcci basati esclusivamente su dati tabellari, specialmente per i veterani.

Junhao Su, David Grimsman, Christopher Archibald2026-03-09🤖 cs.LG

Reinforcement Learning for Power-Flow Network Analysis

Questo articolo propone l'uso dell'apprendimento per rinforzo, dotato di una funzione di ricompensa probabilistica e di uno spazio di stati specifico, per progettare reti di flusso di potenza con un numero di punti di equilibrio (soluzioni reali) significativamente superiore alla media statistica, superando così i limiti degli attuali algoritmi di algebra computazionale.

Alperen Ergur, Julia Lindberg, Vinny Miller2026-03-09🤖 cs.LG

Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression

Questo articolo dimostra che, nell'ambito della regressione ridge a caratteristiche casuali, un modello "forte" addestrato su etichette imperfette generate da un modello "debole" può superare significativamente le leggi di scala del proprio insegnante, raggiungendo persino il tasso ottimale minimax indipendentemente dalle prestazioni del teacher.

Diyuan Wu, Lehan Chen, Theodor Misiakiewicz, Marco Mondelli2026-03-09🤖 cs.LG

Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks

Questo studio analizza le strategie di parallelizzazione per il deployment di modelli LLM densi, evidenziando come l'uso combinato del parallelismo tensoriale e pipeline permetta di gestire i compromessi tra latenza e throughput in base ai requisiti specifici dell'applicazione.

Burak Topcu, Musa Oguzhan Cim, Poovaiah Palangappa, Meena Arunachalam, Mahmut Taylan Kandemir2026-03-09🤖 cs.LG

Warm Starting State-Space Models with Automata Learning

Questo lavoro dimostra che è possibile realizzare esattamente le macchine di Moore come modelli a spazio di stato, proponendo un metodo ibrido che utilizza l'apprendimento simbolico degli automi per inizializzare tali modelli, ottenendo così una convergenza più rapida e prestazioni superiori rispetto all'inizializzazione casuale.

William Fishell, Sam Nicholas Kouteili, Mark Santolucito2026-03-09🤖 cs.LG

Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities

Questo studio formalizza le limitazioni fondamentali e le opportunità nell'apprendimento delle equazioni differenziali che governano l'evoluzione delle reti temporali all'interno dei Grafi a Prodotto Dotale Casuali (RDPG), sviluppando un quadro geometrico basato su fibrati principali che collega ambiguità di gauge, dinamica e difficoltà statistica attraverso concetti di olonomia e gap spettrale.

Giulio Valentino Dalla Riva2026-03-09🤖 cs.LG

The Rise of AI in Weather and Climate Information and its Impact on Global Inequality

Il paper sostiene che, sebbene l'IA prometta avanzamenti senza precedenti nelle scienze climatiche, il suo attuale sviluppo concentrato nel Nord globale rischia di esacerbare le disuguaglianze Nord-Sud, richiedendo un approccio centrato sui dati, infrastrutture digitali pubbliche e co-produzione della conoscenza per garantire una resilienza sistemica equa.

Amirpasha Mozaffari, Amanda Duarte, Lina Teckentrup, Stefano Materia, Gina E. C. Charnley, Lluis Palma, Eulalia Baulenas Serra, Dragana Bojovic, Paula Checchia, Aude Carreric, Francisco Doblas-Reyes2026-03-09🤖 cs.AI

Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy

Questo studio dimostra che l'adattamento di dominio non supervisionato, in particolare mediante la minimizzazione della discrepanza massima del momento medio (MMD), migliora significativamente la capacità di generalizzazione dei modelli di identificazione di radioisotopi addestrati su dati sintetici quando applicati a dati sperimentali reali non etichettati.

Peter Lalor, Ayush Panigrahy, Alex Hagen2026-03-09🤖 cs.LG

Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment

Questo studio dimostra che il campionamento Best-of-N, quando opportunamente calibrato, è statisticamente e computazionalmente ottimale per massimizzare il tasso di vittoria (win-rate) nell'allineamento dei modelli linguistici, e propone una variante pratica che elimina il rischio di reward hacking mantenendo prestazioni ottimali.

Ved Sriraman, Adam Block2026-03-09🤖 cs.AI

Full Dynamic Range Sky-Modelling For Image Based Lighting

Il paper presenta Icarus, un modello di cielo meteo-indipendente basato sull'apprendimento profondo che supera i limiti delle soluzioni attuali generando mappe ambientali ad alta dinamica (FDR) fotorealistiche e controllabili dall'utente per un'illuminazione basata sull'immagine (IBL) di precisione senza precedenti.

Ian J. Maquignaz2026-03-09🤖 cs.LG

MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation

Il paper introduce MIRACL, un nuovo framework gerarchico di Meta-Rinforzo Multi-Obiettivo che, integrando l'apprendimento composito e una strategia di adattamento basata su Pareto, permette una generalizzazione a pochi esempi e un'adattabilità efficiente in ambienti di ottimizzazione della catena di approvvigionamento complessi e dinamici, superando le prestazioni delle basi di riferimento tradizionali.

Rifny Rachman, Josh Tingey, Richard Allmendinger, Wei Pan, Pradyumn Shukla, Bahrul Ilmi Nasution2026-03-09🤖 cs.LG

Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing

Il paper propone SGPP, un quadro geometrico unificato che risolve le sfide del controllo dei modelli Rectified Flow formulando il recupero come un problema di ottimizzazione prossimale, garantendo teoricamente la convergenza sul manifold dei dati e generalizzando i metodi esistenti attraverso un bilanciamento continuo tra fedeltà all'input e libertà generativa.

Vansh Bansal, James G Scott2026-03-09🤖 cs.LG

TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks

Il documento presenta TML-Bench, un benchmark per agenti di data science su compiti di apprendimento automatico tabulare che valuta le prestazioni di dieci modelli LLM open source su competizioni Kaggle, rivelando che MiniMax-M2.1 ottiene i migliori risultati complessivi e che le prestazioni migliorano all'aumentare del tempo a disposizione.

Mykola Pinchuk2026-03-09🤖 cs.AI

← Precedente Successivo →