cs.LG articoli | Gist.Science

Hybrid Belief Reinforcement Learning for Efficient Coordinated Spatial Exploration

Questo articolo presenta un framework di apprendimento per rinforzo ibrido basato sulla credenza (HBRL) che combina modelli probabilistici e apprendimento profondo per coordinare agenti autonomi nell'esplorazione spaziale, ottenendo risultati superiori in termini di ricompensa cumulativa e velocità di convergenza rispetto alle tecniche esistenti.

Danish Rizvi, David Boyle2026-03-05🤖 cs.LG

MEM: Multi-Scale Embodied Memory for Vision Language Action Models

Il paper introduce MEM (Multi-Scale Embodied Memory), un'architettura di memoria multimodale che combina ricordi a breve termine basati su video e ricordi a lungo termine basati su testo per abilitare i robot a eseguire compiti complessi e di lunga durata, come pulire una cucina o preparare un panino, adattando intelligentemente le proprie strategie di manipolazione.

Marcel Torne, Karl Pertsch, Homer Walke + 14 more2026-03-05🤖 cs.LG

NuMuon: Nuclear-Norm-Constrained Muon for Compressible LLM Training

Il lavoro presenta NuMuon, un ottimizzatore che integra un vincolo sulla norma nucleare nell'aggiornamento di Muon per favorire una struttura a basso rango nelle matrici dei pesi, migliorando così la compressibilità e la qualità dei modelli LLM post-compressione senza comprometterne la convergenza.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 7 more2026-03-05🤖 cs.LG

Riemannian Optimization in Modular Systems

Questo articolo combina geometria Riemanniana, teoria del controllo ottimo e fisica teorica per reinterpretare la backpropagation come un problema di ottimizzazione vincolata, introducendo una metrica Riemanniana a strati ricorsiva e moduli componibili che offrono garanzie di stabilità e un'alternativa pratica alla discesa del gradiente naturale per l'ottimizzazione congiunta di sistemi modulari.

Christian Pehle, Jean-Jacques Slotine2026-03-05🤖 cs.LG

Extending Neural Operators: Robust Handling of Functions Beyond the Training Set

Questo lavoro presenta un quadro rigoroso per estendere gli operatori neurali al di fuori della distribuzione di addestramento, sfruttando tecniche di approssimazione dei kernel e spazi di Hilbert a nucleo riproducente per garantire la robustezza teorica e l'accuratezza nella risoluzione di equazioni differenziali alle derivate parziali su varietà.

Blaine Quackenbush, Paul J. Atzberger2026-03-05🤖 cs.LG

Riemannian Langevin Dynamics: Strong Convergence of Geometric Euler-Maruyama Scheme

Questo lavoro dimostra la convergenza forte di ordine 1/2 per uno schema geometrico di Eulero-Maruyama applicato alle equazioni differenziali stocastiche su varietà Riemanniane, fornendo inoltre un limite di Wasserstein per il campionamento tramite dinamica di Langevin Riemanniana discretizzata.

Zhiyuan Zhan, Masashi Sugiyama2026-03-05🤖 cs.LG

Adaptive Sensing of Continuous Physical Systems for Machine Learning

Questo lavoro propone un quadro computazionale generale in cui un modulo di attenzione addestrabile ottimizza l'estrazione di informazioni dai sistemi dinamici fisici, migliorando significativamente l'accuratezza predittiva attraverso una misurazione spaziale adattiva.

Felix Köster, Atsushi Uchida2026-03-05🤖 cs.LG

Freezing of Gait Prediction using Proactive Agent that Learns from Selected Experience and DDQN Algorithm

Questo studio presenta un agente proattivo basato su un algoritmo DDQN con esperienza prioritaria che, addestrato su 9000 episodi, riesce a prevedere con successo gli episodi di congelamento della marcia nei pazienti con Parkinson fino a 8,72 secondi prima dell'insorgenza, consentendo interventi tempestivi tramite dispositivi indossabili.

Septian Enggar Sukmana, Sang Won Bae, Tomohiro Shibata2026-03-05🤖 cs.LG

Graph Negative Feedback Bias Correction Framework for Adaptive Heterophily Modeling

Il documento presenta GNFBC, un framework innovativo che corregge il bias indotto dall'assunzione di omofilia nelle Graph Neural Networks attraverso un meccanismo di feedback negativo, migliorando così le prestazioni su grafi eterofili senza dipendere da strategie di aggregazione specifiche.

Jiaqi Lv, Qingfeng Du, Yu Zhang + 2 more2026-03-05🤖 cs.AI

Principled Learning-to-Communicate with Quasi-Classical Information Structures

Questo articolo formalizza l'apprendimento della comunicazione in ambienti decentralizzati parzialmente osservabili attraverso la struttura delle informazioni, identificando i casi "quasi-classici" come computazionalmente trattabili e proponendo algoritmi di pianificazione e apprendimento con complessità dimostrabilmente efficiente.

Xiangyu Liu, Haoyi You, Kaiqing Zhang2026-03-05🤖 cs.LG

Machine Pareidolia: Protecting Facial Image with Emotional Editing

Il paper presenta MAP, un nuovo metodo di protezione della privacy facciale che utilizza modifiche emotive per camuffare le identità originali, superando i limiti delle tecniche tradizionali in termini di trasferibilità, qualità percettiva e adattabilità a diversi gruppi demografici e scenari fotografici.

Binh M. Le, Simon S. Woo2026-03-05🤖 cs.LG

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

Il paper propone LSMR, un algoritmo che sfrutta la località indotta dal modello per ridurre la complessità computazionale della valutazione del valore di Shapley dei dati, permettendo il riutilizzo ottimale dei sottoinsiemi di addestramento e ottenendo significativi guadagni di velocità senza compromettere l'accuratezza.

Xuan Yang, Hsi-Wen Chen, Ming-Syan Chen + 1 more2026-03-05🤖 cs.AI

A Stein Identity for q-Gaussians with Bounded Support

Questo lavoro estende l'identità di Stein alle distribuzioni q-Gaussiane a supporto limitato, derivando nuovi teoremi di tipo Bonnet e Price che permettono di costruire stimatori del gradiente facili da implementare e con varianza ridotta, utili per l'apprendimento profondo bayesiano e la minimizzazione sensibile alla nitidezza.

Sophia Sklaviadis, Thomas Moellenhoff, Andre F. T. Martins + 2 more2026-03-05🤖 cs.LG

CONCUR: Benchmarking LLMs for Concurrent Code Generation

Il paper introduce CONCUR, un nuovo benchmark composto da 115 problemi di concorrenza derivati da un testo standard, progettato per valutare le capacità degli LLM nella generazione di codice concorrente e colmare il vuoto lasciato dalle attuali valutazioni focalizzate esclusivamente sul codice sequenziale.

Jue Huang, Tarek Mahmud, Corina Pasareanu + 1 more2026-03-05🤖 cs.LG

Generalization Properties of Score-matching Diffusion Models for Intrinsically Low-dimensional Data

Questo lavoro dimostra che i modelli di diffusione basati sul punteggio adattano la loro velocità di convergenza alla dimensione intrinseca dei dati, superando la maledizione della dimensionalità e fornendo nuovi limiti di errore finiti per distribuzioni con supporto non limitato.

Saptarshi Chakraborty, Quentin Berthet, Peter L. Bartlett2026-03-05🤖 cs.AI

Why Do Unlearnable Examples Work: A Novel Perspective of Mutual Information

Questo articolo propone una nuova prospettiva teorica basata sulla riduzione dell'informazione reciproca per analizzare e migliorare gli esempi non apprendibili, introducendo il metodo MI-UE che massimizza la similarità coseno tra le caratteristiche intra-classe per impedire efficacemente l'apprendimento non autorizzato dei modelli deep learning.

Yifan Zhu, Yibo Miao, Yinpeng Dong + 1 more2026-03-05🤖 cs.AI

JANUS: Structured Bidirectional Generation for Guaranteed Constraints and Analytical Uncertainty

Il paper introduce JANUS, un framework basato su alberi decisionali bayesiani che risolve il quadrilemma della generazione di dati sintetici ad alto rischio garantendo fedeltà distributiva, controllo vincolare al 100% senza campionamento di rifiuto e stime di incertezza analitiche ultra-veloci.

Taha Racicot2026-03-05🤖 cs.AI

MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier

Il paper introduce MOOSE-Star, un framework unificato che supera l'intrattabilità matematica del training diretto per la scoperta scientifica riducendo la complessità da esponenziale a logaritmica attraverso l'addestramento su sottocompiti decomposti, una ricerca gerarchica guidata dalla motivazione e una composizione limitata, supportato dal dataset TOMATO-Star.

Zonglin Yang, Lidong Bing2026-03-05🤖 cs.LG

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Il paper propone un framework di apprendimento alternato per giochi Markoviani cooperativi con vincoli di comunicazione, dimostrando che l'agente globale e gli agenti locali convergono verso un equilibrio di Nash approssimato con complessità campionaria ridotta rispetto allo spazio congiunto di stati e azioni.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

Harmonic Dataset Distillation for Time Series Forecasting

Il paper propone HDT, un metodo di distillazione del dataset per la previsione delle serie temporali che, decomponendo i dati nel dominio della frequenza tramite FFT e allineando le strutture periodiche, supera i limiti delle tecniche tradizionali garantendo alta scalabilità e generalizzazione cross-architettura.

Seungha Hong, Sanghwan Jang, Wonbin Kweon + 3 more2026-03-05🤖 cs.LG

← Precedente Successivo →