cs.LG articoli | Gist.Science

Implicit U-KAN2.0: Dynamic, Efficient and Interpretable Medical Image Segmentation

Il paper presenta Implicit U-KAN 2.0, una nuova architettura di segmentazione medica basata su equazioni differenziali ordinarie neurali del secondo ordine e strati MultiKAN, che migliora l'efficienza, l'interpretabilità e le prestazioni teoriche rispetto ai metodi esistenti.

Chun-Wun Cheng, Yining Zhao, Yanqi Cheng + 3 more2026-03-05🤖 cs.LG

Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment

Questo articolo propone l'approccio TS4NAP, che utilizza la similarità tra tassonomie mediche (ICD-10-CM e ICD-10-PCS) e il matching di grafi per migliorare e rendere spiegabile la previsione del prossimo passo terapeutico nei processi di cura dei pazienti, valutata su dati del dataset MIMIC-IV.

Martin Kuhn, Joscha Grüger, Tobias Geyer + 1 more2026-03-05🤖 cs.AI

Beyond Accuracy: What Matters in Designing Well-Behaved Image Classification Models?

Questo studio analizza nove dimensioni di qualità dei modelli di classificazione delle immagini oltre alla sola accuratezza, rivelando l'impatto di diverse strategie di addestramento e introducendo il punteggio QUBA per valutare e raccomandare modelli ben comportati in base alle esigenze specifiche.

Robin Hesse, Doğukan Bağcı, Bernt Schiele + 2 more2026-03-05🤖 cs.LG

Generating Fine Details of Entity Interactions

Questo paper presenta \data, un dataset focalizzato sulle interazioni tra entità, e \model, un metodo che sfrutta i Modelli Linguistici Multimodali per decomporre le interazioni e raffinare le immagini generate, migliorando significativamente la qualità delle relazioni spaziali e funzionali tra gli oggetti.

Xinyi Gu, Jiayuan Mao2026-03-05🤖 cs.LG

PinRec: Outcome-Conditioned, Multi-Token Generative Retrieval for Industry-Scale Recommendation Systems

Il documento presenta PinRec, un modello di recupero generativo scalabile sviluppato da Pinterest che utilizza la generazione condizionata agli esiti e multi-token per bilanciare efficacemente metriche aziendali, diversità ed efficienza nei sistemi di raccomandazione su larga scala.

Prabhat Agarwal, Anirudhan Badrinath, Laksh Bhasin + 4 more2026-03-05🤖 cs.LG

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

Il documento presenta il modello formale N2M-RSI, che dimostra come un agente AI che utilizza i propri output come dati di addestramento possa generare una crescita illimitata della complessità interna una volta superata una specifica soglia di integrazione informativa, unificando concetti di auto-prompting e riferimento godeliano in un framework agnostico rispetto all'implementazione.

Rintaro Ando2026-03-05🤖 cs.AI

Akkumula: Evidence accumulation driver models with Spiking Neural Networks

Il paper presenta Akkumula, un framework basato su reti neurali a impulsi (SNN) che migliora i modelli di guida simulando l'accumulo di prove per rendere più realistici e adattabili i processi decisionali dei conducenti.

Alberto Morando2026-03-05🤖 cs.LG

Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information

Questo studio introduce PubHealthBench, un nuovo benchmark basato su oltre 8000 domande derivate dalle linee guida del governo britannico, per valutare le conoscenze di 24 modelli linguistici (LLM) nel campo della sanità pubblica, rivelando che, sebbene i modelli proprietari più recenti superino gli umani nelle risposte a scelta multipla, mostrano prestazioni inferiori nelle risposte in formato libero, indicando la necessità di ulteriori misure di sicurezza.

Joshua Harris, Fan Grayson, Felix Feldman + 8 more2026-03-05🤖 cs.LG

Emotion-Gradient Metacognitive RSI (Part I): Theoretical Foundations and Single-Agent Architecture

Questo articolo presenta le fondamenta teoriche e l'architettura di un singolo agente del framework EG-MRSI, un sistema innovativo che integra metacognizione, motivazione intrinseca basata sulle emozioni e auto-modifica ricorsiva per guidare lo sviluppo verso un'AGI aperta e sicura.

Rintaro Ando2026-03-05🤖 cs.AI

Unsupervised Representation Learning - an Invariant Risk Minimization Perspective

Gli autori propongono un nuovo framework di apprendimento non supervisionato per la Minimizzazione del Rischio Invariante (IRM) che, attraverso i metodi PICA e VIAE, allinea le distribuzioni delle caratteristiche per apprendere rappresentazioni robuste e generalizzabili tra diversi ambienti senza fare affidamento su dati etichettati.

Yotam Norman, Ron Meir2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

TSPulse è una famiglia di modelli pre-addestrati ultra-leggeri che, grazie a rappresentazioni disaccoppiate in domini temporali, spettrali e semantici, supera le prestazioni di modelli molto più grandi su diverse attività di diagnostica delle serie temporali abilitando un trasferimento zero-shot efficiente e un deployment senza GPU.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

Optimal Best-Arm Identification under Fixed Confidence with Multiple Optima

Questo lavoro introduce un nuovo limite inferiore teorico e un algoritmo modificato basato su Track-and-Stop che, sfruttando la conoscenza a priori del numero di bracci ottimali, raggiungono l'ottimalità asintotica nell'identificazione di un braccio migliore in contesti con più soluzioni ottimali.

Lan V. Truong2026-03-05🤖 cs.LG

Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation

Questo lavoro propone "Feature Mixing", un metodo semplice e veloce per la sintesi di outlier multimodali che, insieme al nuovo dataset CARLA-OOD, raggiunge prestazioni all'avanguardia nella rilevazione e segmentazione di dati fuori distribuzione con un significativo aumento di velocità rispetto alle tecniche esistenti.

Moru Liu, Hao Dong, Jessica Kelly + 2 more2026-03-05🤖 cs.AI

Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD

Lo studio analizza le proprietà di convergenza e le dinamiche di fuga dello Stochastic Gradient Descent (SGD) in paesaggi unidimensionali, dimostrando come il rumore e la geometria della funzione influenzino i tempi di transizione tra i minimi locali e i massimi, evidenziando che l'algoritmo può rimanere intrappolato vicino a massimi locali ma tende a sfuggire da massimi "acuti" per raggiungere i minimi adiacenti.

Dmitry Dudukalov, Artem Logachov, Vladimir Lotov + 3 more2026-03-05🤖 cs.LG

BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Digital Behavioural Change

Questo paper introduce il dataset BAH, un nuovo insieme di dati multimodale composto da 1.427 video annotati da esperti per il riconoscimento automatico dell'ambivalenza e dell'esitazione nei contesti di cambiamento comportamentale digitale, fornendo anche risultati preliminari che evidenziano la necessità di modelli spaziotemporali avanzati.

Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan + 6 more2026-03-05🤖 cs.LG

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

Il paper presenta SafeDPO, un metodo leggero e teoricamente fondato che ottimizza direttamente la sicurezza dei modelli linguistici senza reward model o campionamento online, ottenendo eccellenti compromessi tra sicurezza e utilità su benchmark come PKU-SafeRLHF-30K.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

Do We Need All the Synthetic Data? Targeted Image Augmentation via Diffusion Models

Il paper presenta TADA, un framework che utilizza modelli di diffusione per generare dati sintetici mirati solo su un sottogruppo di esempi non appresi durante l'addestramento, migliorando significativamente la generalizzazione dei classificatori di immagini con un costo computazionale ridotto rispetto alle tecniche di aumento tradizionali.

Dang Nguyen, Jiping Li, Jinghao Zheng + 1 more2026-03-05🤖 cs.LG

A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning

Il paper propone un filtro supervisionato basato sulla copula di Gumbel per la selezione delle caratteristiche nella previsione del rischio di diabete, che identifica in modo efficiente i fattori di rischio estremi e dimostra prestazioni competitive rispetto ai metodi standard su dataset clinici e di salute pubblica.

Agnideep Aich, Md Monzur Murshed, Sameera Hewage + 1 more2026-03-05🤖 cs.LG

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Il paper propone la Calibrazione Supervisionata (SC), un nuovo framework basato sulla minimizzazione della perdita che supera i limiti delle tecniche di calibrazione esistenti per l'Apprendimento in Contesto (ICL) nei LLM, permettendo di modificare l'orientamento dei confini decisionali e integrando regolarizzatori per migliorare la stabilità e le prestazioni su diversi modelli e dataset.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

An Approximation Theory Perspective on Machine Learning

Questo articolo esamina il divario tra la teoria dell'approssimazione e la pratica dell'apprendimento automatico, analizzando le tendenze emergenti e presentando una nuova ricerca per l'approssimazione funzionale su varietà sconosciute senza la necessità di apprendere caratteristiche specifiche della varietà.

Hrushikesh N. Mhaskar, Efstratios Tsoukanis, Ameya D. Jagtap2026-03-05🤖 cs.LG

← Precedente Successivo →