cs.LG articoli | Gist.Science

A short tour of operator learning theory: Convergence rates, statistical limits, and open questions

Questo articolo esamina le recenti intersezioni tra apprendimento di operatori, teoria statistica e approssimazione, analizzando i limiti di convergenza, le barriere statistiche fondamentali e le questioni aperte attraverso una prospettiva minimax.

Simone Brugiapaglia, Nicola Rares Franco, Nicholas H. Nelsen2026-03-03📊 stat

Constitutional Black-Box Monitoring for Scheming in LLM Agents

Questo studio dimostra che monitori basati su LLM, ottimizzati su dati sintetici generati da specifiche comportamentali naturali, riescono a generalizzare l'individuazione di schemi di inganno in ambienti realistici, sebbene le prestazioni raggiungano rapidamente un plateau oltre il quale un'ulteriore ottimizzazione porta solo a un sovradattamento.

Simon Storf, Rich Barton-Cooper, James Peters-Gill + 1 more2026-03-03💬 cs.CL

Tiny-Critic RAG: Empowering Agentic Fallback with Parameter-Efficient Small Language Models

Il paper propone Tiny-Critic RAG, un approccio che utilizza un piccolo modello linguistico efficiente in parametri come gatekeeper per il routing binario nei sistemi RAG agentici, riducendo significativamente la latenza e i costi rispetto all'uso di grandi modelli per la valutazione.

Yichao Wu, Penghao Liang, Yafei Xiang + 5 more2026-03-03🤖 cs.LG

GeMi: A Graph-based, Multimodal Recommendation System for Narrative Scroll Paintings

Il paper presenta GeMi, un sistema di raccomandazione basato su reti neurali grafiche e dati multimodali progettato per conservare e promuovere le antiche pitture narrate a rotolo, un'arte performativa a rischio di estinzione.

Haimonti Dutta, Pruthvi Moluguri, Jin Dai + 1 more2026-03-03🤖 cs.LG

Navigating Time's Possibilities: Plausible Counterfactual Explanations for Multivariate Time-Series Forecast through Genetic Algorithms

Questo articolo presenta un metodo innovativo che integra algoritmi genetici, regressione quantile e test di causalità di Granger per generare spiegazioni controfattuali plausibili e proiettare scenari futuri nell'analisi e nella previsione di serie temporali multivariate.

Gianlucca Zuin, Adriano Veloso2026-03-03🤖 cs.LG

MultiPUFFIN: A Multimodal Domain-Constrained Foundation Model for Molecular Property Prediction of Small Molecules

Il paper presenta MultiPUFFIN, un modello fondazionale multimodale vincolato da principi termodinamici che, integrando diverse rappresentazioni molecolari e equazioni fisiche, supera le prestazioni dei modelli pre-addestrati su larga scala nella previsione simultanea di nove proprietà fisico-chimiche, pur richiedendo una frazione minima dei dati e della potenza computazionale.

Idelfonso B. R. Nogueira, Carine M. Rebelloa, Mumin Enis Leblebici + 1 more2026-03-03🤖 cs.LG

Active Flow Matching

Il paper introduce l'Active Flow Matching (AFM), un nuovo metodo che riformula gli obiettivi variazionali per guidare i modelli di flusso verso regioni ad alta fitness in contesti di ottimizzazione black-box online, dimostrando prestazioni competitive in compiti di progettazione di proteine e piccole molecole.

Yashvir S. Grewal, Daniel M. Steinberg, Thang D. Bui + 2 more2026-03-03🤖 cs.LG

Knowledge without Wisdom: Measuring Misalignment between LLMs and Intended Impact

Questo studio dimostra che i principali modelli linguistici fondazionali, pur eccellendo nei benchmark, mostrano un'allineamento negativo con gli esiti di apprendimento degli studenti e che le loro prestazioni su compiti educativi sono più correlate tra loro che con il comportamento umano esperto, suggerendo che la pre-addestramento comune è una fonte significativa di questo disallineamento.

Michael Hardy, Yunsung Kim2026-03-03📊 stat

Evaluating AI Grading on Real-World Handwritten College Mathematics: A Large-Scale Study Toward a Benchmark

Questo studio presenta una valutazione su larga scala di un sistema di grading AI basato su LLM e OCR per compiti di calcolo a mano scritti da studenti universitari, dimostrando un forte allineamento con le valutazioni dei tutor e proponendo un nuovo benchmark standardizzato per la ricerca futura.

Zhiqi Yu, Xingping Liu, Haobin Mao + 4 more2026-03-03🤖 cs.LG

Principled Fast and Meta Knowledge Learners for Continual Reinforcement Learning

Questo studio propone un framework a doppio apprendista, ispirato al sistema di memoria umano, che combina un apprendista veloce per il trasferimento di conoscenze e un meta-apprendista per l'integrazione incrementale e la prevenzione dell'oblio catastrofico, dimostrando prestazioni superiori nell'apprendimento per rinforzo continuo su diversi benchmark.

Ke Sun, Hongming Zhang, Jun Jin + 4 more2026-03-03🤖 cs.LG

Curvature-Weighted Capacity Allocation: A Minimum Description Length Framework for Layer-Adaptive Large Language Model Optimization

Questo lavoro propone un framework teorico basato sul principio della Lunghezza Minima di Descrizione (MDL) che utilizza il guadagno aggiustato per la curvatura per allocare in modo ottimale le capacità computazionali o eseguire il pruning negli strati dei grandi modelli linguistici, garantendo soluzioni a forma chiusa, complessità computazionale efficiente e limiti di rimpianto trasferibili.

Theophilus Amaefuna, Hitesh Vaidya, Anshuman Chhabra + 1 more2026-03-03🤖 cs.LG

Time-Aware Latent Space Bayesian Optimization

Il paper propone TALBO, un metodo di ottimizzazione bayesiana nello spazio latente che integra la variabilità temporale sia nel modello surrogato che nella rappresentazione generativa per adattarsi dinamicamente agli obiettivi in evoluzione, dimostrando prestazioni superiori rispetto alle tecniche esistenti in scenari di progettazione molecolare con obiettivi mutevoli.

Tuan A. Vu, Julien Martinelli, Harri Lähdesmäki2026-03-03📊 stat

When Does Margin Clamping Affect Training Variance? Dataset-Dependent Effects in Contrastive Forward-Forward Learning

Lo studio dimostra che l'uso del clamping del margine nell'apprendimento Contrastive Forward-Forward aumenta significativamente la varianza dell'addestramento su CIFAR-10 a causa della saturazione dei gradienti, un effetto dipendente dal dataset che può essere eliminato sostituendo il clamping con una sottrazione neutra rispetto al gradiente.

Joshua Steier2026-03-03🤖 cs.LG

Stabilizing Policy Optimization via Logits Convexity

Questo lavoro introduce il framework Logits Convex Optimization (LCO), che colma il divario di stabilità tra l'addestramento supervisionato e il reinforcement learning nei grandi modelli linguistici sfruttando la convessità dei logit per garantire un'ottimizzazione più stabile ed efficace rispetto ai metodi tradizionali come PPO.

Hongzhan Chen, Tao Yang, Yuhua Zhu + 3 more2026-03-03💬 cs.CL

Learning with the Nash-Sutcliffe loss

Questo articolo stabilisce una fondazione decisionale per l'uso della perdita di Nash-Sutcliffe nell'addestramento e nella valutazione di modelli su più serie temporali, dimostrando che minimizzarla equivale a stimare una media ponderata dei dati e permettendo così di gestire in modo coerente serie stazionarie con proprietà stocastiche diverse.

Hristos Tyralis, Georgia Papacharalampous2026-03-03📊 stat

Random Features for Operator-Valued Kernels: Bridging Kernel Methods and Neural Operators

Questo lavoro estende l'analisi delle proprietà di generalizzazione dei metodi a caratteri casuali ai kernel a valori operatore, fornendo un quadro teorico unificato per le reti neurali e gli operatori neurali che stabilisce tassi di apprendimento ottimali e condizioni sulla quantità di neuroni necessari.

Mike Nguyen, Nicole Mücke2026-03-03📊 stat

Intent-Context Synergy Reinforcement Learning for Autonomous UAV Decision-Making in Air Combat

Questo paper propone il framework ICS-RL, che combina la previsione delle intenzioni nemiche tramite LSTM con un meccanismo di sinergia contestuale e agenti DQN eterogenei, permettendo ai droni autonomi di prendere decisioni proattive e adattive che massimizzano il successo della missione e riducono l'esposizione in ambienti aerei contesi.

Jiahao Fu, Feng Yang2026-03-03⚡ eess

HiMAC: Hierarchical Macro-Micro Learning for Long-Horizon LLM Agents

Il paper presenta HiMAC, un framework di apprendimento per rinforzo gerarchico che scompone il processo decisionale a lungo termine in pianificazione macro e esecuzione micro, ottenendo prestazioni superiori e una maggiore efficienza nel campionamento rispetto ai metodi esistenti su diversi ambienti complessi.

Hongbo Jin, Rongpeng Zhu, Jiayu Ding + 2 more2026-03-03🤖 cs.LG

SoberDSE: Sample-Efficient Design Space Exploration via Learning-Based Algorithm Selection

Il framework SoberDSE risolve il problema della selezione algoritmica nella esplorazione dello spazio di progettazione (DSE) per la Sintesi di Alto Livello, superando gli stati dell'arte tramite un meccanismo di apprendimento automatico che identifica dinamicamente l'algoritmo più performante per ogni istanza specifica, garantendo risultati superiori anche in scenari con pochi dati.

Lei Xu, Shanshan Wang, Chenglong Xiao2026-03-03🤖 cs.LG

Compensation-free Machine Unlearning in Text-to-Image Diffusion Models by Eliminating the Mutual Information

Questo articolo presenta MiM-MU, un metodo innovativo per l'oblio delle macchine nei modelli di diffusione testo-immagine che elimina i concetti indesiderati minimizzando l'informazione reciproca, ottenendo così una rimozione efficace senza compromettere la qualità delle generazioni rimanenti e senza richiedere alcuna compensazione post-remediale.

Xinwen Cheng, Jingyuan Zhang, Zhehao Huang + 2 more2026-03-03🤖 cs.LG

← Precedente Successivo →