cs.LG articoli | Gist.Science

Hierarchical Concept-based Interpretable Models

Il paper presenta gli HiCEMs, un nuovo modello di embedding concettuale gerarchico che, attraverso una tecnica di "Concept Splitting" per scoprire automaticamente sottocconcetti, supera i limiti dei modelli esistenti consentendo spiegazioni interpretabili e interventi di test a diverse granularità senza richiedere annotazioni aggiuntive.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-02🤖 cs.AI

Learning Generation Orders for Masked Discrete Diffusion Models via Variational Inference

Questo lavoro propone un framework di inferenza variazionale per apprendere ordini di generazione parallela nei modelli di diffusione discreta mascherata, dimostrando attraverso esperimenti su GSM8K che tale approccio supera le strategie euristiche esistenti in termini di accuratezza quando si utilizzano un numero ridotto di passaggi di generazione.

David Fox, Sam Bowyer, Song Liu + 3 more2026-03-02🤖 cs.LG

Intrinsic Lorentz Neural Network

Il paper propone la Intrinsic Lorentz Neural Network (ILNN), un'architettura completamente intrinseca basata sul modello di Lorentz che, attraverso nuovi componenti geometrici come il layer fully connected punto-iperpiano e la normalizzazione GyroLBN, supera le prestazioni e l'efficienza dei modelli iperbolici ed euclidei esistenti su dati gerarchici e genomici.

Xianglong Shi, Ziheng Chen, Yunhan Jiang + 1 more2026-03-02🤖 cs.AI

MINT: Multimodal Imaging-to-Speech Knowledge Transfer for Early Alzheimer's Screening

Il paper presenta MINT, un innovativo framework di trasferimento di conoscenza multimodale che allinea le rappresentazioni del parlato a uno spazio di embedding derivato dalla risonanza magnetica (MRI) per abilitare uno screening precoce dell'Alzheimer biologicamente fondato senza necessità di imaging durante l'inferenza.

Vrushank Ahire, Yogesh Kumar, Anouck Girard + 1 more2026-03-02🤖 cs.AI

Foundation World Models for Agents that Learn, Verify, and Adapt Reliably Beyond Static Environments

Questo articolo delinea una visione per i "modelli del mondo fondazionali", un framework unificato che integra apprendimento, verifica formale e sintesi per abilitare agenti autonomi ad adattarsi, apprendere e garantire la propria affidabilità in ambienti dinamici e non statici.

Florent Delgrange2026-03-02🤖 cs.AI

InfoNCE Induces Gaussian Distribution

Questo lavoro dimostra che l'obiettivo InfoNCE induce una struttura gaussiana nelle rappresentazioni apprese tramite l'addestramento contrastivo, fornendo una spiegazione teorica e sperimentale di questo fenomeno in diversi regimi.

Roy Betser, Eyal Gofer, Meir Yossef Levi + 1 more2026-03-02⚡ eess

RewardUQ: A Unified Framework for Uncertainty-Aware Reward Models

Il paper introduce RewardUQ, un framework unificato che valuta sistematicamente le tecniche di quantificazione dell'incertezza per i modelli di reward, dimostrando come dimensioni e inizializzazione del modello influenzino le prestazioni e fornendo un pacchetto open-source per migliorare l'efficienza e l'affidabilità nell'allineamento dei grandi modelli linguistici.

Daniel Yang, Samuel Stante, Florian Redhardt + 5 more2026-03-02💬 cs.CL

Data Driven Optimization of GPU efficiency for Distributed LLM Adapter Serving

Questo articolo presenta una pipeline basata su dati che ottimizza l'efficienza delle GPU nel servizio distribuito di adapter per LLM, combinando un Digital Twin, modelli di machine learning e un algoritmo greedy per determinare il posizionamento degli adapter che minimizza il numero di GPU necessarie massimizzando il throughput.

Ferran Agullo, Joan Oliveras, Chen Wang + 5 more2026-03-02💬 cs.CL

Unsupervised Baseline Clustering and Incremental Adaptation for IoT Device Traffic Profiling

Questo studio presenta una pipeline in due fasi per il profilo del traffico IoT che combina il clustering DBSCAN per l'analisi iniziale e l'adattamento incrementale tramite BIRCH, evidenziando un compromesso pratico tra la purezza del profilo statico e la flessibilità necessaria per ambienti IoT in evoluzione.

Sean M. Alderman, John D. Hastings2026-03-02🤖 cs.LG

pathsig: A GPU-Accelerated Library for Truncated and Projected Path Signatures

Il paper introduce pathsig, una libreria PyTorch nativa accelerata da GPU che calcola efficientemente firme di percorso troncate e proiettate, offrendo velocità superiori e un uso ottimizzato della memoria rispetto alle soluzioni esistenti.

Tobias Nygaard2026-03-02🤖 cs.LG

Leveraging Non-linear Dimension Reduction and Random Walk Co-occurrence for Node Embedding

Il paper presenta COVE, un metodo di embedding dei nodi ad alta dimensionalità e interpretabile basato su ridimensionamento non lineare e camminate casuali, che, combinato con UMAP e HDBSCAN, ottiene prestazioni paragonabili all'algoritmo Louvain nei compiti di clustering e previsione dei collegamenti.

Ryan DeWolfe2026-03-02🤖 cs.LG

Adaptive Correlation-Weighted Intrinsic Rewards for Reinforcement Learning

Il paper propone ACWI, un framework di ricompensa intrinseca adattivo che utilizza una rete Beta per apprendere dinamicamente coefficienti di scalazione dipendenti dallo stato, migliorando l'efficienza del campione e la stabilità dell'addestramento negli ambienti a ricompensa rada rispetto ai metodi basati su coefficienti fissi.

Viet Bac Nguyen, Phuong Thai Nguyen2026-03-02🤖 cs.AI

Neural Diffusion Intensity Models for Point Process Data

Il paper introduce i Neural Diffusion Intensity Models, un framework variazionale basato su SDE neurali che, grazie a un teorema teorico sulla correzione della deriva, permette di inferire efficientemente le intensità latenti dei processi di Cox con un singolo passaggio in avanti, sostituendo i costosi metodi MCMC.

Xinlong Du, Harsha Honnappa, Vinayak Rao2026-03-02📊 stat

The Subjectivity of Monoculture

Questo paper sostiene che la monocultura nei modelli di machine learning non sia una proprietà assoluta, ma un'inferenza soggettiva e dipendente dal contesto che varia in base alla scelta del modello nullo di riferimento e alla popolazione di modelli e item considerati.

Nathanael Jo, Nikhil Garg, Manish Raghavan2026-03-02🤖 cs.LG

Artificial Agency Program: Curiosity, compression, and communication in agents

Questo articolo presenta il Programma di Agenzia Artificiale (AAP), un quadro di ricerca che definisce l'IA come un sistema embedded e limitato da risorse, guidato dalla curiosità come progresso nell'apprendimento e unificato attraverso compressione predittiva, motivazione intrinseca e interfacce comunicative per potenziare l'interazione uomo-strumento-ambiente.

Richard Csaky2026-03-02🤖 cs.AI

Agentic AI-RAN: Enabling Intent-Driven, Explainable and Self-Evolving Open RAN Intelligence

Questo articolo propone un framework di Intelligenza Artificiale Agente per l'O-RAN che, integrando pianificazione, uso di strumenti, memoria e auto-gestione, abilita il controllo intenzionale, spiegabile ed evolutivo delle reti, migliorando le prestazioni delle fette di rete e la gestione delle risorse radio rispetto alle soluzioni tradizionali.

Zhizhou He, Yang Luo, Xinkai Liu + 4 more2026-03-02🤖 cs.LG

Learning with a Budget: Identifying the Best Arm with Resource Constraints

Questo articolo presenta l'algoritmo SH-RR, una soluzione per l'identificazione del braccio migliore in presenza di vincoli di risorse che integra un'allocazione consapevole dei costi sia in contesti stocastici che deterministici.

Zitian Li, Wang Chi Cheung2026-03-02🤖 cs.LG

RAViT: Resolution-Adaptive Vision Transformer

Il paper presenta RAViT, un nuovo framework per la classificazione delle immagini basato su un trasformatore visivo multi-ramo con meccanismo di uscita anticipata, che riduce significativamente il costo computazionale mantenendo un'accuratezza equivalente ai modelli classici.

Martial Guidez, Stefan Duffner, Christophe Garcia2026-03-02🤖 cs.LG

Sandwiching Polynomials for Geometric Concepts with Low Intrinsic Dimension

Questo lavoro presenta un nuovo metodo semplice per costruire polinomi approssimanti a sandwich con gradi notevolmente ridotti per funzioni a bassa dimensione intrinseca, ottenendo miglioramenti esponenziali rispetto agli stati dell'arte precedenti per classi come le funzioni di $k$ semispazi e le funzioni soglia polinomiali sotto distribuzioni gaussiane.

Adam R. Klivans, Konstantinos Stavropoulos, Arsen Vasilyan2026-03-02🤖 cs.LG

Multi-Objective Reinforcement Learning for Large-Scale Tote Allocation in Human-Robot Collaborative Fulfillment Centers

Questo articolo presenta un approccio di Apprendimento per Rinforzo Multi-Obiettivo basato su dinamiche minimax e giochi a somma zero per ottimizzare l'allocazione dei contenitori nei centri di smistamento collaborativi uomo-robot, dimostrando la capacità di bilanciare obiettivi conflittuali e rispettare vincoli operativi complessi in ambienti su larga scala.

Sikata Sengupta, Guangyi Liu, Omer Gottesman + 4 more2026-03-02🤖 cs.LG

← Precedente Successivo →