cs.LG articoli | Gist.Science

Generalizing Fair Top- $k$ Selection: An Integrative Approach

Questo lavoro generalizza la selezione top- $k$ equa a più gruppi protetti, analizzandone la complessità computazionale e proponendo una soluzione pratica che bilancia l'efficienza, la minimizzazione della disparità rispetto a una funzione di riferimento e la stabilità della funzione di punteggio rispetto alle perturbazioni.

Guangya Cai2026-03-06💻 cs

Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings

Questo articolo presenta TREDBench e un metodo di adattamento guidato da embedding che, utilizzando esclusivamente dati sintetici curati, migliora significativamente l'efficienza e l'accuratezza del modello fondazionale TabPFN 2.5 nelle regressioni ingegneristiche, colmando il divario tra domini sintetici e reali senza richiedere dati ingegneristici reali per l'addestramento.

Lyle Regenwetter, Rosen Yu, Cyril Picard + 1 more2026-03-06💻 cs

Implicit Bias and Loss of Plasticity in Matrix Completion: Depth Promotes Low-Rankness

Questo lavoro dimostra che l'aumento della profondità nelle reti lineari per il completamento della matrice intensifica le dinamiche accoppiate, favorendo un pregiudizio implicito verso soluzioni a basso rango che risolve questioni aperte sulla convergenza e previene la perdita di plasticità osservata nei modelli superficiali.

Baekrok Shin, Chulhee Yun2026-03-06💻 cs

When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper

Questo studio dimostra che, contrariamente all'assunto comune, l'uso del modello di enhancement audio SAM-Audio come pre-elaborazione per sistemi ASR zero-shot basati su Whisper peggiora sistematicamente le prestazioni di riconoscimento, rivelando una fondamentale discrepanza tra la qualità acustica percepita dall'uomo e la robustezza necessaria per l'elaborazione automatica.

Akif Islam, Raufun Nahar, Md. Ekramul Hamid2026-03-06💻 cs

Probabilistic Dreaming for World Models

Questo lavoro propone un'evoluzione del modello Dreamer basata su metodi probabilistici che permettono l'esplorazione parallela di stati latenti e il mantenimento di ipotesi distinte per futuri mutualmente esclusivi, ottenendo su MPE SimpleTag un miglioramento del punteggio del 4,5% e una riduzione del 28% della varianza rispetto al metodo standard.

Gavin Wong2026-03-06💻 cs

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Questo articolo propone un approccio ibrido che combina modellazione teorica e benchmark empirico per determinare l'allocazione ottimale delle risorse hardware nella disaggregazione Prefill-Decode per l'inferenza di LLM, garantendo il rispetto degli obiettivi di livello di servizio (SLO) relativi a throughput e latenza.

Luchang Li, Dongfang Li, Bozhao Gong + 1 more2026-03-06🔢 math

A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

Questo studio presenta una valutazione sistematica di tre strategie di compressione delle reti neurali (pruning, quantizzazione e distillazione della conoscenza) per la classificazione di immagini iperspettrali, dimostrando che è possibile ridurre significativamente le dimensioni e i costi computazionali dei modelli mantenendo prestazioni competitive per le applicazioni di telerilevamento.

Sai Shi2026-03-06💻 cs

Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models

Questo documento presenta "Model Medicine", un quadro clinico interdisciplinare che applica principi biologici e medici per diagnosticare, trattare e prevenire disturbi nei modelli di intelligenza artificiale, introducendo una tassonomia di discipline, strumenti diagnostici come la "Neural MRI" e framework terapeutici per gestire la complessità dei sistemi AI.

Jihoon Jeong2026-03-06💻 cs

Count Bridges enable Modeling and Deconvolving Transcriptomic Data

Il paper introduce "Count Bridges", un processo stocastico su interi che permette la modellazione generativa e la deconvoluzione di dati trascrittomici aggregati, ottenendo prestazioni all'avanguardia nella risoluzione di profili di espressione genica a livello di singola cella.

Nic Fishman, Gokul Gowri, Tanush Kumar + 4 more2026-03-06💻 cs

When Priors Backfire: On the Vulnerability of Unlearnable Examples to Pretraining

Questo articolo identifica la vulnerabilità degli esempi inapprendibili (UE) quando utilizzati su modelli preaddestrati, poiché le conoscenze pregresse permettono di aggirare le perturbazioni, e propone il metodo BAIT, un'ottimizzazione bi-livello che vincola le perturbazioni a target errati per garantire la protezione dei dati anche in presenza di priors semantici.

Zhihao Li, Gezheng Xu, Jiale Cai + 5 more2026-03-06💻 cs

Distribution-Conditioned Transport

Il paper introduce la Distribution-Conditioned Transport (DCT), un framework che generalizza i modelli di trasporto tra distribuzioni sconosciute condizionandoli su embedding appresi, permettendo così applicazioni semi-supervisionate e migliorando risultati in ambiti biologici come la genomica a singola cellula e l'evoluzione dei recettori delle cellule T.

Nic Fishman, Gokul Gowri, Paolo L. B. Fischer + 3 more2026-03-06💻 cs

Interactive Benchmarks

Il paper propone "Interactive Benchmarks", un nuovo paradigma di valutazione unificato che misura l'intelligenza dei modelli attraverso processi interattivi sotto vincoli di budget, dimostrando che tale approccio offre una valutazione più robusta e fedele rispetto ai benchmark standard saturi.

Baoqing Yue, Zihan Zhu, Yifan Zhang + 3 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

Il paper presenta CONE, un modello ibrido pre-addestrato che utilizza un nuovo algoritmo di embedding composito per codificare numeri, intervalli e gaussiane insieme alle loro unità e attributi, preservando le relazioni semantiche e di distanza e ottenendo risultati superiori rispetto agli stati dell'arte in compiti di ragionamento numerico su dataset diversificati.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

KindSleep: Knowledge-Informed Diagnosis of Obstructive Sleep Apnea from Oximetry

Il paper introduce KindSleep, un framework di deep learning che integra segnali di ossimetria e dati clinici per diagnosticare in modo preciso e trasparente l'apnea ostruttiva del sonno, superando le prestazioni dei metodi esistenti su ampi dataset indipendenti.

Micky C Nnamdi, Wenqi Shi, Cheng Wan + 4 more2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Questo commento paesaggistico valuta la famiglia GPT-5 come ragionatore clinico multimodale, evidenziando significativi progressi nel ragionamento testuale e nella sintesi multimodale rispetto a GPT-4o, pur rilevando che i modelli generalisti non sostituiscono ancora i sistemi specializzati in compiti critici di percezione come la neuroradiologia e la mammografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation

Il paper introduce ConTSG-Bench, un benchmark unificato e su larga scala che fornisce dataset allineati e metriche comprehensive per valutare sistematicamente i modelli di generazione di serie temporali condizionate, rivelandone limiti e indirizzando le future ricerche verso un migliore controllo strutturale e utilità nei task downstream.

Shaocheng Lan, Shuqi Gu, Zhangzhi Xiong + 1 more2026-03-06💻 cs

Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization

Questo lavoro propone un framework di apprendimento per rinforzo distribuito basato sul collo di bottiglia dell'informazione e sul valore a rischio condizionato che ottimizza gli equalizzatori DRAM garantendo prestazioni nel caso peggiore, riducendo i tempi di calcolo di 51 volte e fornendo stime di incertezza certificate per l'implementazione industriale.

Muhammad Usama, Dong Eui Chang2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Questo lavoro presenta la prima caratterizzazione dell'equivalenza distribuzionale e un metodo di apprendimento senza assunzioni strutturali per modelli causali ciclici lineari non gaussiani con variabili latenti, introducendo nuovi vincoli di rango sugli archi per identificare le classi di equivalenza.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

Diffusion Policy through Conditional Proximal Policy Optimization

Il paper propone un metodo efficiente per addestrare politiche di diffusione in contesti di apprendimento per rinforzo on-policy, superando le sfide computazionali del calcolo della verosimiglianza attraverso un nuovo allineamento tra iterazione della politica e processo di diffusione, ottenendo prestazioni superiori e comportamenti multimodali su diversi benchmark.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Il paper propone la Ricostruzione Contrastiva Diffusiva (DCR), un metodo che integra segnali contrastivi derivati dalle immagini ricostruite nel processo di diffusione per bilanciare la capacità discriminativa e la percezione dei dettagli, superando così i limiti degli encoder visivi CLIP.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

← Precedente Successivo →

cs.LG

Generalizing Fair Top-kkk Selection: An Integrative Approach