cs.LG articoli | Gist.Science

A Covering Framework for Offline POMDPs Learning using Belief Space Metric

Questo articolo presenta un nuovo quadro di analisi per la valutazione fuori politica nei processi decisionali di Markov parzialmente osservabili (POMDP), che sfrutta la struttura metrica intrinseca dello spazio delle credenze per rilassare le ipotesi di copertura tradizionali e mitigare la maledizione dell'orizzonte e della memoria, ottenendo limiti di errore più stretti e una maggiore efficienza nel campionamento.

Youheng Zhu, Yiping Lu2026-03-04📊 stat

MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization

Questo lavoro propone MoD-DPO, un framework di ottimizzazione delle preferenze che mitiga le allucinazioni cross-modali nei modelli linguistici omni-modali introducendo regolarizzazioni specifiche per le modalità e penalità contro i pregiudizi testuali, migliorando così l'accuratezza percettiva e la robustezza del modello.

Ashutosh Chaubey, Jiacheng Pang, Mohammad Soleymani2026-03-04💬 cs.CL

Infinite dimensional generative sensing

Questo lavoro presenta un quadro teorico rigoroso per il sensing compresso generativo in spazi di Hilbert, dimostrando che la stabilità di recupero è garantita quando il numero di misurazioni è proporzionale alla dimensione intrinseca del prior, indipendentemente dalla dimensione ambientale, e validando tali risultati attraverso esperimenti numerici sull'equazione del flusso di Darcy.

Paolo Angella, Vito Paolo Pastore, Matteo Santacesaria2026-03-04⚡ eess

Understanding and Mitigating Dataset Corruption in LLM Steering

Questo studio dimostra che, sebbene il contrastive steering per i LLM sia robusto a una moderata corruzione dei dati, è vulnerabile ad alterazioni maliziose su larga scala, ma tale problema può essere efficacemente mitigato sostituendo il calcolo della media standard con un stimatore robusto della media.

Cullen Anderson, Narmeen Oozeer, Foad Namjoo + 3 more2026-03-04💬 cs.CL

I-CAM-UV: Integrating Causal Graphs over Non-Identical Variable Sets Using Causal Additive Models with Unobserved Variables

Il paper propone I-CAM-UV, un metodo che integra modelli causali additivi con variabili non osservate (CAM-UV) su più dataset con insiemi di variabili non identici, enumerando tutti i grafi causali coerenti per superare i limiti delle tecniche di sovrapposizione tradizionali.

Hirofumi Suzuki, Kentaro Kanamori, Takuya Takagi + 3 more2026-03-04🤖 cs.LG

Shape Derivative-Informed Neural Operators with Application to Risk-Averse Shape Optimization

Il paper presenta Shape-DINO, un framework di operatori neurali informati dalle derivate che accelera l'ottimizzazione della forma sotto incertezza risolvendo problemi PDE su geometrie variabili con maggiore precisione e velocità rispetto ai metodi tradizionali.

Xindi Gong, Dingcheng Luo, Thomas O'Leary-Roseberry + 2 more2026-03-04🤖 cs.LG

Stabilized Adaptive Loss and Residual-Based Collocation for Physics-Informed Neural Networks

Questo lavoro propone un nuovo approccio per le Physics-Informed Neural Networks (PINN) che combina un bilanciamento adattivo della perdita basato su gradienti lisciati e un collocamento adattivo dei residui per risolvere efficacemente problemi ad alta rigidità e dominati da shock, riducendo significativamente l'errore di soluzione rispetto ai metodi tradizionali.

Divyavardhan Singh, Shubham Kamble, Dimple Sonone + 1 more2026-03-04🤖 cs.AI

Adaptive Methods Are Preferable in High Privacy Settings: An SDE Perspective

L'articolo dimostra che, attraverso un'analisi basata sulle equazioni differenziali stocastiche, i metodi di ottimizzazione adattivi come DP-SignSGD sono preferibili in contesti ad alta privacy poiché mantengono prestazioni superiori e richiedono meno ritaratura degli iperparametri rispetto a DP-SGD, specialmente quando si utilizzano tassi di apprendimento fissi.

Enea Monzio Compagnoni, Alessandro Stanghellini, Rustem Islamov + 2 more2026-03-04🤖 cs.LG

Coalgebras for categorical deep learning: Representability and universal approximation

Questo articolo stabilisce una fondazione coalgebrica per l'apprendimento profondo categoriale, dimostrando come le azioni di gruppo e le mappe equivarianti possano essere generalizzate per garantire l'approssimazione universale di funzioni continue in un contesto astratto e indipendente dal dominio.

Dragan Mašulović2026-03-04🤖 cs.LG

SynthCharge: An Electric Vehicle Routing Instance Generator with Feasibility Screening to Enable Learning-Based Optimization and Benchmarking

Il paper presenta SynthCharge, un generatore parametrico di istanze per il problema di routing dei veicoli elettrici con finestre temporali che, attraverso un processo di screening di fattibilità e una configurazione adattiva delle stazioni di ricarica, fornisce un'infrastruttura dinamica e verificabile per valutare modelli di ottimizzazione basati sull'apprendimento.

Mertcan Daysalilar, Fuat Uyguroglu, Gabriel Nicolosi + 1 more2026-03-04🤖 cs.AI

Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations

Questo studio introduce un nuovo algoritmo di apprendimento ispirato ai principi neurobiologici, come la sparsità e la legge di Dale, che permette alle reti neurali di generare rappresentazioni biologicamente plausibili, migliorando significativamente la robustezza, la generalizzazione e l'efficienza nell'apprendimento con pochi esempi.

Patrick Inoue, Florian Röhrbein, Andreas Knoblauch2026-03-04🤖 cs.LG

The elbow statistic: Multiscale clustering statistical significance

Il paper introduce ElbowSig, un quadro inferenziale rigoroso che formalizza il metodo dell'elbow attraverso una statistica di curvatura normalizzata per determinare la significatività statistica di strutture di clustering a più scale, garantendo il controllo dell'errore di Tipo I indipendentemente dall'algoritmo di clustering utilizzato.

Francisco J. Perez-Reche2026-03-04📊 stat

On Geometry Regularization in Autoencoder Reduced-Order Models with Latent Neural ODE Dynamics

Lo studio dimostra che, nei modelli di ordine ridotto basati su autoencoder con dinamiche neurali ODE, la proiezione di Stiefel sul primo strato del decoder migliora costantemente le prestazioni di previsione a lungo termine, mentre altre strategie di regolarizzazione geometrica, pur migliorando la regolarità locale del decoder, spesso ostacolano l'addestramento delle dinamiche latenti.

Mikhail Osipov2026-03-04🤖 cs.LG

Speculative Speculative Decoding

Il paper introduce Saguaro, un algoritmo di "speculative speculative decoding" che parallelizza le fasi di previsione e verifica per accelerare l'inferenza dei modelli linguistici fino a 2 volte rispetto alle tecniche speculative ottimizzate e fino a 5 volte rispetto al decoding autoregressivo tradizionale.

Tanishq Kumar, Tri Dao, Avner May2026-03-04🤖 cs.LG

Physics-informed post-processing of stabilized finite element solutions for transient convection-dominated problems

Questo lavoro presenta un framework computazionale ibrido che estende la metodologia PASSC ai problemi transienti, combinando un metodo agli elementi finiti stabilizzato (SUPG con cattura d'urto) con una rete neurale fisica (PINN) applicata selettivamente vicino al tempo finale per correggere le oscillazioni spuri e migliorare l'accuratezza delle soluzioni in regimi convettivi dominati.

Süleyman Cengizci, Ömür Uğur, Srinivasan Natesan2026-03-04🤖 cs.LG

LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory

LoGeR è un'architettura innovativa che supera i limiti di scala dei modelli geometrici feedforward per la ricostruzione 3D su video di lunga durata, combinando un modulo di memoria ibrido con addestramento test-time e attenzione a finestra scorrevole per garantire coerenza globale e precisione senza post-ottimizzazione.

Junyi Zhang, Charles Herrmann, Junhwa Hur + 5 more2026-03-04🤖 cs.LG

Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing

Questo studio valuta l'efficacia di metodi tradizionali e basati sul machine learning per il rilevamento di algoritmi di generazione di domini (DGA) utilizzati nello smishing, rivelando tramite il nuovo dataset semi-sintetico "Gravity Falls" che le attuali soluzioni hanno prestazioni limitate e variabili a seconda delle tattiche evolutive degli attaccanti, sottolineando così la necessità di approcci più consapevoli del contesto.

Adam Dorian Wong, John D. Hastings2026-03-04🤖 cs.LG

Learning Demographic-Conditioned Mobility Trajectories with Aggregate Supervision

Il paper presenta ATLAS, un approccio di supervisione debole che genera traiettorie di mobilità condizionate da dati demografici utilizzando solo traiettorie individuali non etichettate e statistiche aggregate regionali, migliorando significativamente il realismo demografico rispetto ai metodi esistenti.

Jessie Z. Li, Zhiqing Hong, Toru Shirakawa + 1 more2026-03-04🤖 cs.LG

How to Peel with a Knife: Aligning Fine-Grained Manipulation with Human Preference

Il paper presenta un framework di apprendimento in due fasi per l'automazione di compiti di manipolazione complessi e soggettivi come la sbucciatura con un coltello, che combina l'imitazione guidata dalla forza con un affinamento basato sulle preferenze umane per ottenere tassi di successo superiori al 90% e una forte generalizzazione zero-shot su diverse varietà di frutta e verdura.

Toru Lin, Shuying Deng, Zhao-Heng Yin + 2 more2026-03-04⚡ eess

Privacy-Preserving Logistic Regression Training with A Faster Gradient Variant

Questo articolo presenta un efficiente "gradiente quadratico" che accelera la convergenza dell'addestramento della regressione logistica privacy-preserving, offrendo prestazioni superiori rispetto ai metodi tradizionali e permettendo un'implementazione omomorfica efficace in sole quattro iterazioni.

John Chiang2026-03-03🤖 cs.LG

← Precedente Successivo →