cs.LG articoli | Gist.Science

Synthetic Monitoring Environments for Reinforcement Learning

Il documento presenta gli Ambienti di Monitoraggio Sintetici (SME), una suite infinita di compiti di controllo continuo con politiche ottimali note, progettata per fornire diagnosi precise e trasparenti delle prestazioni degli agenti di Reinforcement Learning attraverso la valutazione sistematica sia in-distribution che out-of-distribution.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Questo articolo propone il BAEN-SVM, un nuovo modello di classificazione binaria basato su una funzione di perdita elastica netta asimmetrica limitata che garantisce robustezza al rumore, consistenza teorica e prestazioni superiori rispetto alle SVM tradizionali, risolvendo il problema di ottimizzazione non convessa tramite un algoritmo specifico.

Haiyan Du, Hu Yang2026-03-09🤖 cs.LG

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

Il paper propone DeCoST, un approccio basato sull'apprendimento che risolve in modo efficiente il problema di orientamento con finestre temporali e profitti variabili decouplando le variabili discrete e continue, superando gli algoritmi attuali in qualità della soluzione e velocità di inferenza.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Lo studio dimostra che l'implementazione di pipeline di ragionamento agentiche con recupero di informazioni (RAG) nel campo della radiologia riduce la dispersione decisionale tra diversi modelli linguistici e ne aumenta la robustezza collettiva, suggerendo che la valutazione di tali sistemi richieda analisi complementari alla sola accuratezza per garantire l'affidabilità clinica.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Looking Through Glass Box

Questo saggio presenta un'implementazione neurale della mappa cognitiva fuzzy (FHM) che utilizza la dinamica di Langevin per apprendere modelli causali, invertire i valori dei nodi di output e fornire criteri di modifica per l'ottimizzazione di servizi o prodotti, valutando le prestazioni su diversi dataset.

Alexis Kafantaris2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

Il paper propone Stem, un modulo di sparsità plug-and-play che ottimizza il flusso di informazioni nelle architetture causalmente vincolate attraverso una selezione top-k dipendente dalla posizione e una metrica consapevole dell'output, riducendo così la complessità computazionale e la latenza di pre-filling mantenendo un'elevata accuratezza.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

Il paper presenta il GMM-PIELM, un framework probabilistico che utilizza un algoritmo EM ponderato per adattare dinamicamente il campionamento dei nuclei nelle PDE rigide, consentendo alle Extreme Learning Machines di risolvere con precisione strati limite sottili e ridurre gli errori di ordini di grandezza rispetto ai metodi tradizionali, mantenendo al contempo la velocità computazionale.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Questo articolo propone un metodo innovativo basato su modelli di diffusione basati su punteggio per l'inpainting tridimensionale degli impianti dentali nel dominio delle proiezioni, che combina due modelli 2D ortogonali per eliminare gli artefatti nelle immagini CBCT preservando la coerenza spaziale tra le proiezioni.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

Polarized Direct Cross-Attention Message Passing in GNNs for Machinery Fault Diagnosis

Questo articolo presenta PolaDCA, un nuovo framework di apprendimento relazionale basato su un meccanismo di attenzione incrociata diretta polarizzata che, costruendo dinamicamente grafi dai dati e aggregando tre tipi di caratteristiche nodali distinte, supera i limiti delle reti neurali grafiche convenzionali offrendo una diagnosi di guasti più robusta e precisa per macchinari rotanti in condizioni rumorose.

Zongyu Shi, Laibin Zhang, Maoyin Chen2026-03-09🤖 cs.LG

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

Il paper propone una pipeline in tre fasi per addestrare i modelli linguistici a generare stime di incertezza calibrate e interpretabili in modo efficiente, superando i limiti dei metodi post-hoc tramite il calcolo di entropia, la calibrazione di Platt e l'addestramento per rinforzo.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Il paper introduce SAHOO, un framework pratico che monitora e controlla la deriva dell'allineamento durante il miglioramento ricorsivo di sé stessi attraverso tre meccanismi di salvaguardia, garantendo significativi guadagni di qualità in compiti di generazione di codice e ragionamento matematico senza compromettere vincoli di sicurezza e veridicità.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

Il paper presenta AIRT, un framework di deep learning end-to-end che genera piani di radioterapia VMAT per il cancro alla prostata in meno di un secondo, dimostrando una qualità non inferiore ai piani standard prodotti da RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

Il paper presenta MoEless, il primo framework di serving serverless per modelli LLM basati su Mixture-of-Experts (MoE), che risolve il problema dello squilibrio del carico tra esperti tramite predittori leggeri e strategie di scaling ottimizzate, riducendo la latenza di inferenza del 43% e i costi dell'84% rispetto alle soluzioni esistenti.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

Il paper introduce il Dynamic Chunking Diffusion Transformer (DC-DiT), un modello che migliora l'efficienza computazionale e la qualità della generazione delle immagini adattando dinamicamente il numero di token in base alla complessità visiva e allo stadio di denoising, ottenendo risultati superiori rispetto ai DiT tradizionali con un costo di addestramento ridotto.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

Frequency-Separable Hamiltonian Neural Network for Multi-Timescale Dynamics

Il paper introduce la Frequency-Separable Hamiltonian Neural Network (FS-HNN), un approccio che supera i limiti delle reti neurali hamiltoniane tradizionali nella modellazione di dinamiche multiscala decomponendo l'hamiltoniana in modi veloci e lenti addestrati su scale temporali distinte, migliorando così l'estrapolazione a lungo termine e la generalizzazione su sistemi ODE e PDE.

Yaojun Li, Yulong Yang, Christine Allen-Blanchette2026-03-09🤖 cs.LG

Tiny, Hardware-Independent, Compression-based Classification

Questo lavoro dimostra che la distanza di compressione normalizzata, sebbene non sia una metrica formale, può essere efficacemente adattata ai metodi kernel e ottimizzata per l'addestramento, consentendo la creazione di modelli di classificazione ad alta precisione, leggeri e indipendenti dall'hardware che operano interamente lato client preservando la privacy dell'utente.

Charles Meyers, Aaron MacSween, Erik Elmroth, Tommy Löfstedt2026-03-09🤖 cs.LG

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

Il paper presenta CLAIRE, un framework ibrido di deep learning che combina autoencoder e classificazione supervisionata per migliorare il rilevamento dei guasti nella manifattura intelligente, offrendo allo stesso tempo interpretabilità delle previsioni tramite tecniche basate sulla teoria dei giochi.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Il paper presenta ALFCG, il primo framework proiettabile libero adattivo per la minimizzazione stocastica composita non convessa che, eliminando la necessità di costanti di regolarità globali o ricerche di linea, utilizza un accumulatore auto-normalizzato per stimare la regolarità locale e raggiungere complessità iterativa ottimali fino a fattori logaritmici.

Ganzhao Yuan2026-03-09🤖 cs.LG

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Il paper estende la regolarizzazione basata sulla cinetica (KBR) per stimare con precisione le derivate spaziali da dati discreti e rumorosi, proponendo schemi espliciti e impliciti che garantiscono convergenza quadratica e permettendo la risoluzione stabile di equazioni differenziali alle derivate parziali iperboliche su nuvole di punti irregolari.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

Il paper propone un'architettura di orchestrazione "schema-gated" che risolve il compromesso tra flessibilità conversazionale e determinismo esecutivo nei flussi di lavoro scientifici, separando l'autorità dialogica da quella operativa per garantire riproducibilità e governance senza rigidità.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

← Precedente Successivo →