cs.LG articoli | Gist.Science

Uncertainty-aware Language Guidance for Concept Bottleneck Models

Questo lavoro propone un nuovo metodo di Concept Bottleneck Models (CBM) che quantifica rigorosamente l'incertezza delle annotazioni dei concetti fornite dai Large Language Models e la integra nel processo di apprendimento per mitigare i rischi di allucinazione e migliorare l'affidabilità del modello.

Yangyi Li, Mengdi Huai2026-03-02🤖 cs.LG

Spiky Rank and Its Applications to Rigidity and Circuits

Il paper introduce il "spiky rank", un nuovo parametro matriciale che combina struttura combinatoria e flessibilità algebrica, dimostrando come valori elevati di tale misura implichino alta rigidità matriciale e forniscano limiti inferiori per circuiti ReLU di profondità due, con applicazioni a matrici di distanza di Hamming ed espansori spettrali.

Lianna Hambardzumyan, Konstantin Myasnikov, Artur Riazanov + 2 more2026-03-02🤖 cs.LG

FedDAG: Clustered Federated Learning via Global Data and Gradient Integration for Heterogeneous Environments

Il paper presenta FedDAG, un framework di Federated Learning clusterizzato che supera i limiti degli approcci esistenti integrando dati e gradienti per una misurazione più completa della similarità tra client e adottando un'architettura a doppio encoder che permette il trasferimento di caratteristiche tra cluster diversi, ottenendo così prestazioni superiori in ambienti eterogenei.

Anik Pramanik, Murat Kantarcioglu, Vincent Oria + 1 more2026-03-02🤖 cs.LG

Sample Size Calculations for Developing Clinical Prediction Models: Overview and pmsims R package

Questo articolo presenta un nuovo approccio basato sulla simulazione e il pacchetto R open-source pmsims per calcolare in modo flessibile ed efficiente le dimensioni campionarie necessarie allo sviluppo di modelli predittivi clinici, garantendo prestazioni target con alta probabilità.

Diana Shamsutdinova, Felix Zimmer, Oyebayo Ridwan Olaniran + 4 more2026-03-02📊 stat

Modelling and Simulation of Neuromorphic Datasets for Anomaly Detection in Computer Vision

Il paper presenta ANTShapes, un nuovo framework di simulazione basato su Unity che genera dataset neuromorfici sintetici configurabili per superare la scarsità di dati reali e supportare compiti di visione artificiale come il rilevamento di anomalie.

Mike Middleton, Teymoor Ali, Hakan Kayan + 6 more2026-03-02🤖 cs.LG

Uncovering Physical Drivers of Dark Matter Halo Structures with Auxiliary-Variable-Guided Generative Models

Questo lavoro presenta un modello generativo latente guidato da variabili ausiliarie (DL-CFM) che, applicato alle mappe tSZ degli aloni di materia oscura, disentangla le rappresentazioni latenti in base a massa e concentrazione, trasformando lo spazio latente in uno strumento diagnostico per l'astrofisica cosmologica.

Arkaprabha Ganguli, Anirban Samaddar, Florian Kéruzoré + 4 more2026-03-02📊 stat

Neural Operators Can Discover Functional Clusters

Questo lavoro dimostra teoricamente che gli operatori neurali possono apprendere cluster funzionali arbitrari in spazi infinito-dimensionali e presenta una pipeline pratica che, applicata a traiettorie di equazioni differenziali ordinarie, riesce a recuperare strutture dinamiche latenti dove i metodi classici falliscono.

Yicen Li, Jose Antonio Lara Benitez, Ruiyang Hong + 3 more2026-03-02📊 stat

Few-Shot Continual Learning for 3D Brain MRI with Frozen Foundation Models

Il documento presenta un approccio di apprendimento continuo few-shot per risonanze magnetiche cerebrali 3D che combina un backbone preaddestrato congelato con moduli LoRA specifici per ogni compito, ottenendo prestazioni bilanciate su segmentazione di tumori e stima dell'età cerebrale senza dimenticare i compiti precedenti e con meno dello 0,1% di parametri addestrabili per task.

Chi-Sheng Chen, Xinyu Zhang, Guan-Ying Chen + 3 more2026-03-02⚡ eess

Partition Function Estimation under Bounded f-Divergence

Questo lavoro fornisce una caratterizzazione information-theoretica della complessità statistica per la stima delle funzioni di partizione sotto vincoli di divergenza f-limitata, introducendo il profilo di copertura integrato per unificare e generalizzare i risultati esistenti su campionamento per importanza, rifiuto e stime di media a code pesanti.

Adam Block, Abhishek Shetty2026-03-02📊 stat

Component Centric Placement Using Deep Reinforcement Learning

Questo lavoro propone un approccio basato sull'apprendimento per rinforzo profondo e su una disposizione centrata sui componenti per automatizzare il posizionamento su schede a circuito stampato (PCB), riducendo lo spazio di ricerca e integrando conoscenze a priori per ottenere risultati vicini a quelli umani in termini di lunghezza dei collegamenti e fattibilità.

Kart Leong Lim2026-03-02🤖 cs.LG

Rudder: Steering Prefetching in Distributed GNN Training using LLM Agents

Il paper presenta Rudder, un modulo software integrato nel framework AWS DistDGL che utilizza agenti basati su Large Language Models per ottimizzare dinamicamente il prefetching nei training distribuiti di Graph Neural Networks, riducendo le comunicazioni e migliorando le prestazioni fino al 91% rispetto alle soluzioni statiche.

Aishwarya Sarkar, Sayan Ghosh, Nathan Tallent + 3 more2026-03-02🤖 cs.AI

VaSST: Variational Inference for Symbolic Regression using Soft Symbolic Trees

Il paper introduce VaSST, un framework probabilistico scalabile per la regressione simbolica che utilizza inferenza variazionale e alberi simbolici morbidi per trasformare la ricerca combinatoria in un'ottimizzazione basata su gradienti, permettendo una quantificazione rigorosa dell'incertezza e ottenendo prestazioni superiori rispetto agli stati dell'arte.

Somjit Roy, Pritam Dey, Bani K. Mallick2026-03-02📊 stat

Dynamics of Learning under User Choice: Overspecialization and Peer-Model Probing

Il paper evidenzia come l'ottimizzazione locale in contesti multi-piattaforma possa intrappolare gli algoritmi in un ciclo di overspecializzazione che compromette le prestazioni globali, proponendo e validando sperimentalmente un metodo di "sondaggio" tra modelli peer per recuperare dati su utenti non selezionati e garantire una convergenza verso soluzioni ottimali per l'intera popolazione.

Adhyyan Narang, Sarah Dean, Lillian J Ratliff + 1 more2026-03-02🤖 cs.LG

Flowette: Flow Matching with Graphette Priors for Graph Generation

Il paper presenta Flowette, un framework di flow matching continuo che combina un transformer basato su GNN con una nuova famiglia di priors strutturati detti "graphette" per generare grafi complessi preservandone la topologia e le dipendenze a lungo raggio, ottenendo risultati superiori nella generazione di molecole e grafi sintetici.

Asiri Wijesinghe, Sevvandi Kandanaarachchi, Daniel M. Steinberg + 1 more2026-03-02🤖 cs.AI

Tensor Hypercontraction Error Correction Using Regression

Questo lavoro dimostra che l'uso di modelli di regressione non lineare per correggere gli errori introdotti dalla contrazione iper-tensoriale (THC) nei calcoli di teoria di Møller-Plesset del terzo ordine (MP3) riduce significativamente l'errore quadratico medio rispetto ai valori di riferimento canonici, migliorando l'accuratezza sia per le energie molecolari totali che per quelle di reazione.

Ishna Satyarth, Eric C. Larson, Devin A. Matthews2026-03-02🤖 cs.LG

Evidential Neural Radiance Fields

Il paper introduce gli Evidential Neural Radiance Fields, un approccio probabilistico che integra direttamente la quantificazione dell'incertezza aleatoria ed epistemica nel processo di rendering NeRF senza compromettere la qualità o richiedere un eccessivo carico computazionale.

Ruxiao Duan, Alex Wong2026-03-02🤖 cs.AI

Hybrid Quantum Temporal Convolutional Networks

Il documento presenta la Hybrid Quantum Temporal Convolutional Network (HQTCN), un modello ibrido che combina finestre temporali classiche con un nucleo di rete neurale convoluzionale quantistica per analizzare serie temporali multivariate in modo efficiente, offrendo prestazioni superiori e una significativa riduzione dei parametri, specialmente in condizioni di dati limitati.

Junghoon Justin Park, Maria Pak, Sebin Lee + 4 more2026-03-02🤖 cs.LG

Construct, Merge, Solve & Adapt with Reinforcement Learning for the min-max Multiple Traveling Salesman Problem

Il paper propone RL-CMSA, un approccio ibrido che combina Reinforcement Learning per la costruzione di soluzioni e ottimizzazione esatta per la risoluzione del problema min-max mTSP, dimostrando prestazioni superiori rispetto agli algoritmi genetici su istanze di grandi dimensioni.

Guillem Rodríguez-Corominas, Maria J. Blesa, Christian Blum2026-03-02🤖 cs.AI

SDMixer: Sparse Dual-Mixer for Time Series Forecasting

Il paper propone SDMixer, un framework di previsione per serie temporali multivariate basato su un mixer duale sparso che, elaborando i dati nei domini temporale e frequenziale per filtrare le informazioni irrilevanti, supera le limitazioni delle metodologie esistenti e ottiene prestazioni leader su diversi dataset reali.

Xiang Ao2026-03-02🤖 cs.AI

Hyperdimensional Cross-Modal Alignment of Frozen Language and Image Models for Efficient Image Captioning

Il paper introduce HDFLIM, un framework che allinea modelli di linguaggio e visione preaddestrati e congelati in uno spazio iperdimensionale tramite operazioni simboliche leggere, permettendo la generazione di didascalie immagini efficienti e semanticamente solide senza necessità di un addestramento multimodale intensivo.

Abhishek Dalvi, Vasant Honavar2026-03-02🤖 cs.AI

← Precedente Successivo →