cs.LG articoli | Gist.Science

TimeWarp: Evaluating Web Agents by Revisiting the Past

Il paper introduce TimeWarp, un benchmark che valuta la robustezza degli agenti web di fronte ai cambiamenti dell'interfaccia, e propone TimeTraj, un algoritmo che migliora significativamente le prestazioni degli agenti insegnando loro a generalizzare attraverso diverse versioni storiche dei siti web.

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

Uncertainty-aware Blood Glucose Prediction from Continuous Glucose Monitoring Data

Questo studio dimostra che i modelli basati su Transformer con testine di output evidenziali, validati sul dataset HUPA-UCM, offrono il quadro più efficace per la previsione della glicemia e la quantificazione dell'incertezza nel diabete di tipo 1, garantendo sia maggiore accuratezza predittiva sia stime di incertezza meglio calibrate rispetto alle architetture LSTM e GRU.

Hai Siong Tan2026-03-06✓ Author reviewed ⓘ🔬 physics

WaterSIC: information-theoretically (near) optimal linear layer quantization

Il paper presenta WaterSIC, un nuovo algoritmo di quantizzazione lineare che, ispirandosi alla soluzione "waterfilling" dell'informazione teorica, assegna tassi di quantizzazione differenziati alle colonne della matrice dei pesi per raggiungere prestazioni near-ottimali e superare i limiti degli attuali metodi come GPTQ su modelli LLM come Llama e Qwen.

Egor Lifar, Semyon Savkin, Or Ordentlich + 1 more2026-03-06🔢 math

Replaying pre-training data improves fine-tuning

Lo studio dimostra che riproporre i dati generici pre-addestrati durante il fine-tuning migliora le prestazioni sui compiti target, aumentando l'efficienza dei dati e i risultati pratici in domini specifici come la navigazione web e il question-answering in basco.

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

Il paper propone MOUE, un'architettura Mixture-of-Experts generalizzata che introduce la "larghezza virtuale" riutilizzando esperti universali tra i livelli per superare i limiti di scalabilità, risolvendo le sfide di routing e bilanciamento del carico attraverso una topologia rotazionale sfalsata e meccanismi di correzione specifici, ottenendo così prestazioni superiori rispetto ai modelli MoE tradizionali.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

Questo lavoro propone un metodo di fusione di modelli linguistici basato sulla media di Karcher sulla varietà di Fisher-Rao, che supera i limiti delle approssimazioni euclidee preservando la funzionalità e la stabilità anche durante la combinazione di numerosi esperti eterogenei.

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

Lightweight and Scalable Transfer Learning Framework for Load Disaggregation

Il paper propone RefQuery, un framework di apprendimento per trasferimento leggero e scalabile per il monitoraggio non intrusivo dei carichi che, utilizzando un modello preaddestrato congelato e adattabile tramite embedding specifici per apparecchio, risolve le sfide di generalizzazione cross-dominio e permette un'implementazione efficiente su dispositivi edge.

L. E. Garcia-Marrero, G. Petrone, E. Monmasson2026-03-06🤖 cs.LG

Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems

Questo studio introduce un framework di apprendimento per rinforzo multi-operatore che integra la teoria della scelta discreta per modellare la competizione endogena nei sistemi AMoD, dimostrando come l'interazione strategica tra operatori porti a dinamiche di prezzo e riposizionamento delle flotte distinte rispetto agli scenari monopolistici.

Emil Kragh Toft, Carolin Schmidt, Daniele Gammelli + 1 more2026-03-06🤖 cs.LG

Non-Euclidean Gradient Descent Operates at the Edge of Stability

Il paper estende il fenomeno dell'Edge of Stability agli ottimizzatori non euclidei definendo una misura generalizzata di sharpness basata su norme arbitrarie, dimostrando sperimentalmente che anche metodi come la discesa del gradiente $\ell_{\infty}$ e Block CD mostrano una progressiva affilatura seguita da oscillazioni attorno alla soglia teorica $2/\eta$ .

Rustem Islamov, Michael Crawshaw, Jeremy Cohen + 1 more2026-03-06🔢 math

Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks

Questo lavoro propone BA-Logic, un nuovo metodo per attacchi backdoor "clean-label" sulle Graph Neural Networks che, superando i limiti delle tecniche esistenti, modifica la logica predittiva interna del modello per garantire un'efficace avvelenamento senza alterare le etichette di addestramento.

Yuxiang Zhang, Bin Ma, Enyan Dai2026-03-06🤖 cs.AI

Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems

Questo articolo introduce l'indice CIES, una metrica matematicamente fondata per quantificare la stabilità delle spiegazioni dei modelli di Intelligenza Artificiale in contesti aziendali, fornendo agli operatori uno strumento per valutare l'affidabilità delle decisioni automatizzate di fronte a perturbazioni dei dati.

Alin-Gabriel Vaduva, Simona-Vasilica Oprea, Adela Bara2026-03-06🤖 cs.AI

RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform

Il paper introduce RepoLaunch, il primo agente basato su LLM in grado di automatizzare completamente la risoluzione delle dipendenze, la compilazione e l'estrazione dei risultati dei test per repository in qualsiasi linguaggio e piattaforma, abilitando così la creazione scalare di dataset per l'addestramento e il benchmarking di agenti di ingegneria del software con un intervento umano limitato alla sola progettazione dei task.

Kenan Li, Rongzhi Li, Linghao Zhang + 17 more2026-03-06🤖 cs.LG

Good-Enough LLM Obfuscation (GELO)

Il paper presenta GELO, un protocollo di obfuscation leggero per l'inferenza di LLM che protegge la privacy delle prompt su acceleratori non fidati mascherando gli stati nascosti con una miscelazione invertibile e casuale per ogni batch, garantendo così l'equivalenza dei risultati finali con un overhead di latenza contenuto e una forte resistenza agli attacchi statistici.

Anatoly Belikov, Ilya Fedotov2026-03-06🔒 cs.CR

MCEL: Margin-Based Cross-Entropy Loss for Error-Tolerant Quantized Neural Networks

Il paper propone MCEL, una nuova funzione di perdita basata sui margini che migliora significativamente la tolleranza agli errori di bit nelle reti neurali quantizzate senza richiedere l'onerosa iniezione di errori durante l'addestramento.

Mikail Yayla, Akash Kumar2026-03-06🤖 cs.LG

Asymptotic Behavior of Multi--Task Learning: Implicit Regularization and Double Descent Effects

Questo studio analizza l'andamento asintotico dell'apprendimento multi-task, dimostrando che la combinazione di compiti correlati equivale a una regolarizzazione implicita che migliora la generalizzazione e mitiga il fenomeno del "double descent".

Ayed M. Alrashdi, Oussama Dhifallah, Houssem Sifaou2026-03-06🔢 math

Deep Learning-Driven Friendly Jamming for Secure Multicarrier ISAC Under Channel Uncertainty

Questo articolo presenta un framework di jamming amichevole basato sull'apprendimento profondo che garantisce la sicurezza fisica nei sistemi ISAC multicarrier in presenza di incertezza del canale e di posizioni di intercettatori sconosciute, sfruttando l'feedback degli echi radar e un'estimatore non parametrico della matrice di Fisher per ottimizzare congiuntamente la formazione del fascio e il jamming senza richiedere informazioni sul canale dell'intercettatore.

Bui Minh Tuan, Van-Dinh Nguyen, Diep N. Nguyen + 5 more2026-03-06🤖 cs.LG

Reward-Conditioned Reinforcement Learning

Il paper introduce RCRL, un framework che addestra un singolo agente a ottimizzare una famiglia di funzioni di ricompensa condizionate su parametri specifici, permettendo un adattamento efficiente a nuove preferenze di compito senza sacrificare la semplicità dell'addestramento su un singolo obiettivo.

Michal Nauman, Marek Cygan, Pieter Abbeel2026-03-06🤖 cs.LG

Synchronization-based clustering on the unit hypersphere

Questo articolo presenta un nuovo algoritmo di clustering basato sul modello generalizzato di Kuramoto per dati sulla sfera unitaria, che dimostra prestazioni superiori o comparabili rispetto ai metodi tradizionali su dataset sintetici e reali.

Zinaid Kapić, Aladin Crnkić, Goran Mauša2026-03-06🤖 cs.LG

Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series

Il paper presenta Aura, un framework universale che migliora le previsioni delle serie temporali nel settore aeronautico integrando in modo efficace fattori esogeni eterogenei e multimodali attraverso un meccanismo di codifica tripartito, ottenendo prestazioni superiori su un vasto dataset industriale.

Jiafeng Lin, Mengren Zheng, Simeng Ye + 5 more2026-03-06🤖 cs.AI

Axiomatic On-Manifold Shapley via Optimal Generative Flows

Questo lavoro propone un nuovo metodo di attribuzione Shapley basato su flussi generativi ottimali che, minimizzando l'energia cinetica lungo geodetiche di Wasserstein-2, garantisce attribuzioni coerenti con la varietà dei dati, risolvendo i problemi di deriva geometrica e offrendo stabilità teorica rispetto agli approcci esistenti.

Cenwei Zhang, Lin Zhu, Manxi Lin + 1 more2026-03-06🤖 cs.AI

← Precedente Successivo →