cs.LG articoli | Gist.Science

Learning Explicit Single-Cell Dynamics Using ODE Representations

Il paper presenta Cell-MNN, una rete neurale encoder-decoder end-to-end che utilizza rappresentazioni ODE per modellare in modo efficiente e interpretabile le dinamiche di differenziazione cellulare, superando i metodi attuali nella scalabilità e nella scoperta di interazioni geniche biologiche.

Jan-Philipp von Bassewitz, Adeel Pervez, Marco Fumero + 3 more2026-03-05🤖 cs.LG

ELMUR: External Layer Memory with Update/Rewrite for Long-Horizon RL Problems

Il paper presenta ELMUR, un'architettura transformer con memoria esterna strutturata che risolve i problemi di osservabilità parziale e lunghi orizzonti temporali nel reinforcement learning, ottenendo prestazioni superiori rispetto alle basi su task sintetici e robotici complessi.

Egor Cherepanov, Alexey K. Kovalev, Aleksandr I. Panov2026-03-05🤖 cs.AI

Value Flows

Il paper "Value Flows" introduce un nuovo metodo di Reinforcement Learning distribuzionale che utilizza modelli basati su flussi per stimare l'intera distribuzione dei ritorni futuri e quantificare l'incertezza, ottenendo prestazioni superiori rispetto alle tecniche esistenti su numerosi benchmark.

Perry Dong, Chongyi Zheng, Chelsea Finn + 2 more2026-03-05🤖 cs.AI

The Geometry of Reasoning: Flowing Logics in Representation Space

Questo studio propone un nuovo quadro geometrico che modella il ragionamento dei grandi modelli linguistici come flussi nello spazio delle rappresentazioni, dimostrando come essi interiorizzino invarianze logiche indipendentemente dal significato semantico e sfidando così l'ipotesi che siano semplici "pappagalli stocastici".

Yufa Zhou, Yixiao Wang, Xunjian Yin + 2 more2026-03-05🤖 cs.AI

Topological Alignment of Shared Vision-Language Embedding Space

Il paper presenta ToMCLIP, un framework che migliora l'allineamento multilingue nei modelli visione-linguaggio applicando vincoli topologici basati sull'omologia persistente per preservare la geometria globale dello spazio di embedding, ottenendo così prestazioni superiori nel recupero multilingue e nel riconoscimento zero-shot.

Junwon You, Dasol Kang, Jae-Hun Jung2026-03-05🤖 cs.AI

Gym-TORAX: Open-source software for integrating RL with plasma control simulators

Il documento presenta Gym-TORAX, un pacchetto software open-source in Python che facilita la ricerca sul controllo dei plasmi nei tokamak integrando algoritmi di apprendimento per rinforzo con simulatori dinamici, offrendo attualmente un ambiente basato su uno scenario di avvio per ITER.

Antoine Mouchamps, Arthur Malherbe, Adrien Bolland + 1 more2026-03-05🤖 cs.LG

Circuit Insights: Towards Interpretability Beyond Activations

Il paper propone WeightLens e CircuitLens, due metodi complementari che superano l'analisi basata sulle attivazioni per interpretare direttamente i pesi e catturare le dinamiche circuitali, migliorando così la robustezza e la scalabilità dell'interpretabilità meccanica.

Elena Golimblevskaia, Aakriti Jain, Bruno Puri + 3 more2026-03-05🤖 cs.AI

Composition-Grounded Data Synthesis for Visual Reasoning

Il paper presenta COGS, un framework di sintesi dati basato sulla composizione che potenzia le capacità di ragionamento dei modelli linguistici multimodali preaddestrati su domini artificiali come grafici e pagine web, decomponendo le domande in fattori primitici per generare coppie domanda-risposta sintetiche addestrate con ricompense di processo a livello fattoriale.

Xinyi Gu, Jiayuan Mao, Zhang-Wei Hong + 5 more2026-03-05🤖 cs.LG

A Geometry-Based View of Mahalanobis OOD Detection

Questo studio dimostra che l'efficacia del rilevamento OOD basato su Mahalanobis dipende dalla geometria dello spazio delle caratteristiche, introducendo una normalizzazione radialmente scalata che ottimizza le prestazioni sfruttando segnali geometrici intrinseci.

Denis Janiak, Jakub Binkowski, Tomasz Kajdanowicz2026-03-05🤖 cs.LG

AMiD: Knowledge Distillation for LLMs with $α$ -mixture Assistant Distribution

Il paper propone AMiD, un quadro unificato per la distillazione della conoscenza nei grandi modelli linguistici che introduce una distribuzione di assistente a miscela $\alpha$ generalizzata per superare le limitazioni delle metodologie precedenti e garantire prestazioni superiori e maggiore stabilità durante l'addestramento.

Donghyeok Shin, Yeongmin Kim, Suhyeon Jo + 2 more2026-03-05🤖 cs.AI

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

Questo lavoro presenta MAYA, un modello di apprendimento sequenziale basato sui bandit multi-braccio che replica le decisioni di foraggiamento delle api, superando i metodi esistenti grazie alla sua capacità di modellare la memoria limitata e fornire traiettorie realistiche per applicazioni ecologiche.

Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes2026-03-05🤖 cs.LG

Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Self-Attention Transformers

Il paper dimostra teoricamente ed empiricamente che nei trasformatori i pesi della Query sono ridondanti e possono essere sostituiti da una matrice identità, riducendo i parametri del 25% e semplificando l'ottimizzazione senza compromettere le prestazioni.

Marko Karbevski, Antonij Mijoski2026-03-05🤖 cs.AI

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Questo lavoro dimostra che l'implicit bias dell'ottimizzatore Adam su dati separabili dipende criticamente dal regime di batch e dal dataset, potendo convergere verso un classificatore a margine massimo $\ell_2$ in modalità incrementale a differenza della tendenza $\ell_\infty$ del full-batch, mentre l'algoritmo Signum mantiene un bias invariato verso $\ell_\infty$ indipendentemente dalla dimensione del batch.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

CNFP: Optimizing Cloud-Native Network Function Placement with Diffusion Models on the Cloud Continuum

Questo studio propone il framework CNFP, che utilizza modelli di diffusione probabilistici basati su reti neurali grafiche per ottimizzare il posizionamento delle funzioni di rete cloud-native nel continuum cloud, superando i limiti di scalabilità e generalizzazione degli approcci tradizionali attraverso la generazione rapida di soluzioni fattibili.

Álvaro Vázquez Rodríguez, Manuel Fernández-Veiga, Carlos Giraldo-Rodríguez2026-03-05🤖 cs.LG

NeuCLIP: Efficient Large-Scale CLIP Training with Neural Normalizer Optimization

Il paper presenta NeuCLIP, un nuovo framework di ottimizzazione che riformula la funzione di perdita contrastiva CLIP tramite analisi convessa e variazionale per stimare efficientemente il termine di normalizzazione utilizzando una rete neurale ausiliaria, superando così i limiti computazionali e di precisione dei metodi precedenti su dataset su larga scala.

Xiyuan Wei, Chih-Jen Lin, Tianbao Yang2026-03-05🤖 cs.LG

Implicit Bias of the JKO Scheme

Il documento caratterizza il bias implicito dello schema JKO al secondo ordine, dimostrando che esso equivale a un flusso di gradiente di Wasserstein su un'energia modificata che include un termine di decelerazione legato alla curvatura metrica, con implicazioni specifiche per funzioni come l'entropia e la divergenza KL.

Peter Halmos, Boris Hanin2026-03-05🤖 cs.AI

Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Lo studio dimostra che i modelli audio auto-supervisionati ad alte prestazioni sviluppano rappresentazioni interne più simili all'attività cerebrale, rivelando una forte correlazione positiva tra l'accuratezza nei compiti uditivi e l'allineamento con la corteccia uditiva, suggerendo che tale somiglianza biologica emerga come sottoprodotto dell'apprendimento non supervisionato.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

EnECG: Efficient Ensemble Learning for Electrocardiogram Multi-task Foundation Model

Il paper propone EnECG, un framework di apprendimento ensemble basato su un Mixture of Experts che integra modelli fondazione specializzati con un'adattazione LoRA leggera per migliorare l'efficienza computazionale e le prestazioni nell'analisi multi-task dell'elettrocardiogramma.

Yuhao Xu, Xiaoda Wang, Jiaying Lu + 6 more2026-03-05🤖 cs.AI

Soft Quality-Diversity Optimization

Questo paper introduce il "Soft QD", un nuovo approccio alla diversità-qualità che elimina la necessità di discretizzazione dello spazio comportamentale, permettendo di sviluppare l'algoritmo differenziabile SQUAD, il quale dimostra una scalabilità superiore rispetto ai metodi attuali in spazi ad alta dimensionalità.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.LG

Weight Space Representation Learning via Neural Field Adaptation

Questo lavoro dimostra che i pesi di adattamento LoRA moltiplicativi, vincolati da un modello di base pre-addestrato, costituiscono rappresentazioni efficaci e semanticamente strutturate nello spazio dei pesi che migliorano la generazione e l'analisi di dati 2D e 3D rispetto ai metodi esistenti.

Zhuoqian Yang, Mathieu Salzmann, Sabine Süsstrunk2026-03-05🤖 cs.AI

← Precedente Successivo →

cs.LG