cs.LG articoli | Gist.Science

Meta-Reinforcement Learning for Fast and Data-Efficient Spectrum Allocation in Dynamic Wireless Networks

Questo lavoro propone un framework di meta-apprendimento che, rispetto agli algoritmi DRL tradizionali come PPO, permette un'allocazione dello spettro più rapida, efficiente e sicura nelle reti wireless dinamiche, migliorando significativamente il throughput e riducendo le violazioni di qualità del servizio.

Oluwaseyi Giwa, Tobi Awodunmila, Muhammad Ahmed Mohsin + 2 more2026-03-02🤖 cs.AI

Estimating Treatment Effects with Independent Component Analysis

Questo articolo dimostra che l'Analisi delle Componenti Indipendenti (ICA) può essere utilizzata per stimare in modo coerente ed efficiente gli effetti del trattamento, sfruttando le stesse condizioni di momento dell'Apprendimento Automatico Ortogonale (OML) ma con prestazioni superiori in termini di efficienza del campione anche in presenza di confondenti gaussiani e effetti di disturbo non lineari.

Patrik Reizinger, Lester Mackey, Wieland Brendel + 1 more2026-03-02📊 stat

Fast Learning of Non-Cooperative Spacecraft 3D Models through Primitive Initialization

Questo lavoro propone un metodo per l'apprendimento rapido di modelli 3D di veicoli spaziali non cooperativi che utilizza un'inizializzazione basata su primitive generate da una CNN per ridurre drasticamente i costi computazionali e la dipendenza da pose precise, rendendo così fattibile l'uso della sintesi di nuove viste in ambito spaziale.

Pol Francesch Huc, Emily Bates, Simone D'Amico2026-03-02🤖 cs.LG

From Generator to Embedder: Harnessing Innate Abilities of Multimodal LLMs via Building Zero-Shot Discriminative Embedding Model

Questo paper propone un framework ad alta efficienza dati che trasforma i modelli linguistici multimodali generativi in modelli di embedding discriminativi zero-shot, utilizzando prompt di embedding gerarchici e un campionamento di negativi difficili auto-consapevole per superare i limiti del pre-addestramento contrastivo e delle false negative.

Yeong-Joon Ju, Seong-Whan Lee2026-03-02🤖 cs.AI

Less is More: AMBER-AFNO -- a New Benchmark for Lightweight 3D Medical Image Segmentation

Il paper presenta AMBER-AFNO, un nuovo modello leggero per la segmentazione 3D di immagini mediche che sostituisce l'attenzione self-attention con operatori neurali Fourier adattivi per ottenere una complessità computazionale quasi lineare e prestazioni all'avanguardia su dataset pubblici.

Andrea Dosi, Semanto Mondal, Rajib Chandra Ghosh + 2 more2026-03-02⚡ eess

FeynTune: Large Language Models for High-Energy Theory

Il paper presenta FeynTune, una serie di 20 modelli linguistici specializzati per la fisica teorica delle alte energie, ottenuti tramite l'adattamento fine di Llama-3.1 su abstract di arXiv, che superano il modello base e i principali LLM commerciali nel completamento di testi di fisica teorica.

Paul Richmond, Prarit Agarwal, Borun Chowdhury + 2 more2026-03-02⚛️ hep-th

Mixed-Initiative Dialog for Human-Robot Collaborative Manipulation

Il paper presenta MICoBot, un sistema di dialoghi a iniziativa mista che coordina la collaborazione uomo-robot attraverso una pianificazione a tre livelli per adattare dinamicamente l'allocazione dei compiti alle capacità del robot e alla disponibilità dell'umano, migliorando significativamente il successo del compito e l'esperienza utente rispetto ai metodi tradizionali.

Albert Yu, Chengshu Li, Luca Macesanu + 4 more2026-03-02💬 cs.CL

On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

Questo lavoro introduce Dynamic Fine-Tuning (DFT), un metodo che corregge la struttura di ricompasta implicita nella SFT standard attraverso una ridimensionamento dinamico dei gradienti, migliorando significativamente la generalizzazione dei modelli linguistici su compiti complessi come il ragionamento matematico e la generazione di codice.

Yongliang Wu, Yizhou Zhou, Zhou Ziheng + 7 more2026-03-02🤖 cs.LG

OM2P: Offline Multi-Agent Mean-Flow Policy

Il paper presenta OM2P, un nuovo algoritmo di apprendimento per rinforzo multi-agente offline che integra modelli di flusso medio con supervisione della funzione Q per ottenere un campionamento delle azioni in un singolo passo, riducendo drasticamente l'uso della memoria GPU e accelerando i tempi di addestramento rispetto ai metodi generativi iterativi esistenti.

Zhuoran Li, Xun Wang, Hai Zhong + 3 more2026-03-02🤖 cs.AI

Structure-aware Contrastive Learning for Diagram Understanding of Multimodal Models

Questo paper introduce un nuovo paradigma di apprendimento contrastivo strutturale che, sfruttando le proprietà intrinseche dei diagrammi attraverso funzioni di perdita specializzate e campioni difficili, migliora significativamente la comprensione dei diagrammi nei modelli visione-linguaggio rispetto agli approcci standard come CLIP.

Hiroshi Sasaki2026-03-02🤖 cs.AI

Geometric Autoencoder Priors for Bayesian Inversion: Learn First Observe Later

Il paper introduce GABI, un framework che utilizza autoencoder geometrici per apprendere modelli generativi consapevoli della forma dai dati, consentendo l'inversione bayesiana con quantificazione dell'incertezza su sistemi fisici con geometrie complesse senza richiedere la conoscenza delle equazioni governative.

Arnaud Vadeboncoeur, Gregory Duthé, Mark Girolami + 1 more2026-03-02📊 stat

Efficient Ensemble Conditional Independence Test Framework for Causal Discovery

Il paper presenta E-CIT, un framework generale e plug-and-play che riduce drasticamente il costo computazionale della scoperta causale basata su vincoli partizionando i dati e aggregando i p-value tramite distribuzioni stabili, mantenendo al contempo garanzie teoriche e prestazioni competitive.

Zhengkang Guan, Kun Kuang2026-03-02📊 stat

Context and Diversity Matter: The Emergence of In-Context Learning in World Models

Questo studio dimostra come i modelli del mondo possano sviluppare capacità di apprendimento nel contesto attraverso i meccanismi di riconoscimento e apprendimento ambientale, evidenziando che la diversità dei dati e contesti estesi sono fondamentali per il loro adattamento dinamico.

Fan Wang, Zhiyuan Chen, Yuxuan Zhong + 8 more2026-03-02🤖 cs.AI

Activation Function Design Sustains Plasticity in Continual Learning

Questo lavoro dimostra che la progettazione di funzioni di attivazione, in particolare attraverso l'introduzione di nuove non-linearità come Smooth-Leaky, è uno strumento fondamentale e leggero per preservare la plasticità e mitigare la perdita di capacità di adattamento nell'apprendimento continuo, senza richiedere capacità aggiuntiva o tuning specifico per task.

Lute Lillo, Nick Cheney2026-03-02🤖 cs.AI

ProtoTS: Learning Hierarchical Prototypes for Explainable Time Series Forecasting

Il paper presenta ProtoTS, un innovativo framework di previsione delle serie temporali che combina alta accuratezza e interpretabilità trasparente attraverso l'uso di prototipi temporali gerarchici per modellare modelli globali e variazioni locali, facilitando la comprensione delle decisioni in scenari ad alto rischio.

Ziheng Peng, Shijie Ren, Xinyue Gu + 3 more2026-03-02🤖 cs.LG

Deep Learning for Subspace Regression

Il paper propone un approccio di regressione basato su reti neurali per modellare subspace dipendenti da parametri in spazi ad alta dimensione, introducendo la previsione di subspace ridondanti per semplificare il mapping e migliorare l'accuratezza in applicazioni come problemi agli autovalori parametrici e equazioni differenziali alle derivate parziali.

Vladimir Fanaskov, Vladislav Trifonov, Alexander Rudikov + 2 more2026-03-02🤖 cs.LG

Alignment through Meta-Weighted Online Sampling: Bridging the Gap between Data Generation and Preference Optimization

Il paper presenta MetaAPO, un nuovo framework che allinea i grandi modelli linguistici ai valori umani bilanciando dinamicamente dati offline e campionamento online tramite un meta-apprenditore, ottenendo prestazioni superiori e riducendo i costi di annotazione del 42%.

Junming Yang, Ning Xu, Biao Liu + 2 more2026-03-02💬 cs.CL

In-Context Learning of Temporal Point Processes with Foundation Inference Models

Il paper presenta il FIM-PP, un modello di inferenza fondazionale preaddestrato su processi temporali sintetici che, sfruttando l'apprendimento in contesto, stima le funzioni di intensità dei processi temporali su dati reali senza necessità di addestramento aggiuntivo, raggiungendo prestazioni pari a quelle di modelli specializzati.

David Berghaus, Patrick Seifner, Kostadin Cvejoski + 2 more2026-03-02🤖 cs.LG

Linking Process to Outcome: Conditional Reward Modeling for LLM Reasoning

Il paper propone il Conditional Reward Modeling (CRM), un approccio che migliora il ragionamento dei grandi modelli linguistici collegando esplicitamente le ricompense di ogni singolo passo al risultato finale, risolvendo così l'ambiguità nell'assegnazione dei crediti e riducendo la vulnerabilità all'hacking delle ricompense.

Zheng Zhang, Ziwei Shan, Kaitao Song + 2 more2026-03-02🤖 cs.LG

Unraveling Syntax: How Language Models Learn Context-Free Grammars

Questo lavoro estende la comprensione dell'apprendimento dei modelli linguistici sulle grammatiche libere dal contesto definendo i "sottogrammatici", dimostrando teoricamente che la perdita si decompone linearmente e che i modelli apprendono queste strutture in parallelo, mentre le evidenze empiriche rivelano che il preaddestramento migliora le rappresentazioni interne ma non risolve le difficoltà con la ricorsione profonda.

Laura Ying Schulz, Daniel Mitropolsky, Tomaso Poggio2026-03-02💬 cs.CL

← Precedente Successivo →