cs.LG articoli | Gist.Science

Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation

Il paper presenta MICoBot, un sistema di dialoghi a iniziativa mista che coordina la collaborazione uomo-robot attraverso una pianificazione a tre livelli per adattare dinamicamente l'allocazione dei compiti alle capacità del robot e alla disponibilità dell'umano, migliorando significativamente il successo del compito e l'esperienza utente rispetto ai metodi tradizionali.

Albert Yu, Chengshu Li, Luca Macesanu + 4 more2026-03-02💬 cs.CL

On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

Questo lavoro introduce Dynamic Fine-Tuning (DFT), un metodo che corregge la struttura di ricompasta implicita nella SFT standard attraverso una ridimensionamento dinamico dei gradienti, migliorando significativamente la generalizzazione dei modelli linguistici su compiti complessi come il ragionamento matematico e la generazione di codice.

Yongliang Wu, Yizhou Zhou, Zhou Ziheng + 7 more2026-03-02🤖 cs.LG

OM2P: Offline Multi-Agent Mean-Flow Policy

Il paper presenta OM2P, un nuovo algoritmo di apprendimento per rinforzo multi-agente offline che integra modelli di flusso medio con supervisione della funzione Q per ottenere un campionamento delle azioni in un singolo passo, riducendo drasticamente l'uso della memoria GPU e accelerando i tempi di addestramento rispetto ai metodi generativi iterativi esistenti.

Zhuoran Li, Xun Wang, Hai Zhong + 3 more2026-03-02🤖 cs.AI

Structure-aware Contrastive Learning for Diagram Understanding of Multimodal Models

Questo paper introduce un nuovo paradigma di apprendimento contrastivo strutturale che, sfruttando le proprietà intrinseche dei diagrammi attraverso funzioni di perdita specializzate e campioni difficili, migliora significativamente la comprensione dei diagrammi nei modelli visione-linguaggio rispetto agli approcci standard come CLIP.

Hiroshi Sasaki2026-03-02🤖 cs.AI

Geometric Autoencoder Priors for Bayesian Inversion: Learn First Observe Later

Il paper introduce GABI, un framework che utilizza autoencoder geometrici per apprendere modelli generativi consapevoli della forma dai dati, consentendo l'inversione bayesiana con quantificazione dell'incertezza su sistemi fisici con geometrie complesse senza richiedere la conoscenza delle equazioni governative.

Arnaud Vadeboncoeur, Gregory Duthé, Mark Girolami + 1 more2026-03-02📊 stat

Efficient Ensemble Conditional Independence Test Framework for Causal Discovery

Il paper presenta E-CIT, un framework generale e plug-and-play che riduce drasticamente il costo computazionale della scoperta causale basata su vincoli partizionando i dati e aggregando i p-value tramite distribuzioni stabili, mantenendo al contempo garanzie teoriche e prestazioni competitive.

Zhengkang Guan, Kun Kuang2026-03-02📊 stat

Context and Diversity Matter: The Emergence of In-Context Learning in World Models

Questo studio dimostra come i modelli del mondo possano sviluppare capacità di apprendimento nel contesto attraverso i meccanismi di riconoscimento e apprendimento ambientale, evidenziando che la diversità dei dati e contesti estesi sono fondamentali per il loro adattamento dinamico.

Fan Wang, Zhiyuan Chen, Yuxuan Zhong + 8 more2026-03-02🤖 cs.AI

Activation Function Design Sustains Plasticity in Continual Learning

Questo lavoro dimostra che la progettazione di funzioni di attivazione, in particolare attraverso l'introduzione di nuove non-linearità come Smooth-Leaky, è uno strumento fondamentale e leggero per preservare la plasticità e mitigare la perdita di capacità di adattamento nell'apprendimento continuo, senza richiedere capacità aggiuntiva o tuning specifico per task.

Lute Lillo, Nick Cheney2026-03-02🤖 cs.AI

ProtoTS: Learning Hierarchical Prototypes for Explainable Time Series Forecasting

Il paper presenta ProtoTS, un innovativo framework di previsione delle serie temporali che combina alta accuratezza e interpretabilità trasparente attraverso l'uso di prototipi temporali gerarchici per modellare modelli globali e variazioni locali, facilitando la comprensione delle decisioni in scenari ad alto rischio.

Ziheng Peng, Shijie Ren, Xinyue Gu + 3 more2026-03-02🤖 cs.LG

Deep Learning for Subspace Regression

Il paper propone un approccio di regressione basato su reti neurali per modellare subspace dipendenti da parametri in spazi ad alta dimensione, introducendo la previsione di subspace ridondanti per semplificare il mapping e migliorare l'accuratezza in applicazioni come problemi agli autovalori parametrici e equazioni differenziali alle derivate parziali.

Vladimir Fanaskov, Vladislav Trifonov, Alexander Rudikov + 2 more2026-03-02🤖 cs.LG

Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization

Il paper presenta MetaAPO, un nuovo framework che allinea i grandi modelli linguistici ai valori umani bilanciando dinamicamente dati offline e campionamento online tramite un meta-apprenditore, ottenendo prestazioni superiori e riducendo i costi di annotazione del 42%.

Junming Yang, Ning Xu, Biao Liu + 2 more2026-03-02💬 cs.CL

In-Context Learning of Temporal Point Processes with Foundation Inference Models

Il paper presenta il FIM-PP, un modello di inferenza fondazionale preaddestrato su processi temporali sintetici che, sfruttando l'apprendimento in contesto, stima le funzioni di intensità dei processi temporali su dati reali senza necessità di addestramento aggiuntivo, raggiungendo prestazioni pari a quelle di modelli specializzati.

David Berghaus, Patrick Seifner, Kostadin Cvejoski + 2 more2026-03-02🤖 cs.LG

Linking Process to Outcome: Conditional Reward Modeling for LLM Reasoning

Il paper propone il Conditional Reward Modeling (CRM), un approccio che migliora il ragionamento dei grandi modelli linguistici collegando esplicitamente le ricompense di ogni singolo passo al risultato finale, risolvendo così l'ambiguità nell'assegnazione dei crediti e riducendo la vulnerabilità all'hacking delle ricompense.

Zheng Zhang, Ziwei Shan, Kaitao Song + 2 more2026-03-02🤖 cs.LG

Unraveling Syntax: How Language Models Learn Context-Free Grammars

Questo lavoro estende la comprensione dell'apprendimento dei modelli linguistici sulle grammatiche libere dal contesto definendo i "sottogrammatici", dimostrando teoricamente che la perdita si decompone linearmente e che i modelli apprendono queste strutture in parallelo, mentre le evidenze empiriche rivelano che il preaddestramento migliora le rappresentazioni interne ma non risolve le difficoltà con la ricorsione profonda.

Laura Ying Schulz, Daniel Mitropolsky, Tomaso Poggio2026-03-02💬 cs.CL

Synthesising Counterfactual Explanations via Label-Conditional Gaussian Mixture Variational Autoencoders

Il paper propone LAPACE, un nuovo framework generativo basato su un VAE a miscela gaussiana condizionata all'etichetta che sintetizza percorsi di spiegazioni controfattuali robuste, diversificate e plausibili, garantendo allo stesso tempo l'incorporazione di vincoli di azionabilità.

Junqi Jiang, Francesco Leofante, Antonio Rago + 1 more2026-03-02🤖 cs.LG

CLEAR-IR: Clarity-Enhanced Active Reconstruction of Infrared Imagery

Il paper presenta CLEAR-IR, un nuovo approccio basato su un'architettura Deep Multi-scale Aware Overcomplete che ricostruisce immagini a infrarossi pulite da segnali disturbati da emettitori attivi, migliorando la qualità visiva e abilitando compiti robotici complessi in condizioni di scarsa illuminazione senza bisogno di illuminazione a bordo.

Nathan Shankar, Pawel Ladosz, Hujun Yin2026-03-02🤖 cs.LG

Embracing Discrete Search: A Reasonable Approach to Causal Structure Learning

Il paper introduce FLOP, un algoritmo di scoperta causale basato su punteggi che, ottimizzando la selezione dei genitori e gli aggiornamenti iterativi, rende fattibile la ricerca discreta su grafi per ottenere strutture altamente accurate e vicine all'ottimo globale.

Marcel Wienöbst, Leonard Henckel, Sebastian Weichwald2026-03-02📊 stat

CMT-Benchmark: A Benchmark for Condensed Matter Theory Built by Expert Researchers

Il paper presenta CMT-Benchmark, un dataset di 50 problemi di teoria della materia condensata verificati da esperti, che dimostra come i modelli linguistici attuali falliscano nel risolvere compiti di ricerca avanzata, evidenziando la necessità di migliorare le capacità di ragionamento fisico dell'IA.

Haining Pan, James V. Roggeveen, Erez Berg + 16 more2026-03-02🤖 cs.AI

Permutation-Invariant Representation Learning for Robust and Privacy-Preserving Feature Selection

Questo lavoro estende un framework di selezione delle caratteristiche basato su intelligenza generativa, introducendo strategie di fusione della conoscenza privacy-preserving e di ponderazione consapevole del campione per gestire efficacemente scenari di apprendimento federato con dati eterogenei, sbilanciati e sensibili.

Rui Liu, Tao Zhe, Yanjie Fu + 3 more2026-03-02🤖 cs.AI

Carré du champ flow matching: better quality-generalisation tradeoff in generative models

Il paper introduce il Carré du champ flow matching (CDC-FM), un metodo che migliora il compromesso tra qualità del campione e generalizzazione nei modelli generativi sostituendo il rumore isotropo standard con un rumore gaussiano anisotropo sensibile alla geometria locale dei dati, dimostrando risultati superiori in scenari con dati scarsi o distribuzioni non uniformi.

Jacob Bamberger, Iolo Jones, Dennis Duncan + 3 more2026-03-02🤖 cs.AI

← Precedente Successivo →