cs.LG articoli | Gist.Science

KindSleep: Knowledge-Informed Diagnosis of Obstructive Sleep Apnea from Oximetry

Il paper introduce KindSleep, un framework di deep learning che integra segnali di ossimetria e dati clinici per diagnosticare in modo preciso e trasparente l'apnea ostruttiva del sonno, superando le prestazioni dei metodi esistenti su ampi dataset indipendenti.

Micky C Nnamdi, Wenqi Shi, Cheng Wan + 4 more2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Questo commento paesaggistico valuta la famiglia GPT-5 come ragionatore clinico multimodale, evidenziando significativi progressi nel ragionamento testuale e nella sintesi multimodale rispetto a GPT-4o, pur rilevando che i modelli generalisti non sostituiscono ancora i sistemi specializzati in compiti critici di percezione come la neuroradiologia e la mammografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation

Il paper introduce ConTSG-Bench, un benchmark unificato e su larga scala che fornisce dataset allineati e metriche comprehensive per valutare sistematicamente i modelli di generazione di serie temporali condizionate, rivelandone limiti e indirizzando le future ricerche verso un migliore controllo strutturale e utilità nei task downstream.

Shaocheng Lan, Shuqi Gu, Zhangzhi Xiong + 1 more2026-03-06💻 cs

Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization

Questo lavoro propone un framework di apprendimento per rinforzo distribuito basato sul collo di bottiglia dell'informazione e sul valore a rischio condizionato che ottimizza gli equalizzatori DRAM garantendo prestazioni nel caso peggiore, riducendo i tempi di calcolo di 51 volte e fornendo stime di incertezza certificate per l'implementazione industriale.

Muhammad Usama, Dong Eui Chang2026-03-06💻 cs

Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning

Questo lavoro presenta la prima caratterizzazione dell'equivalenza distribuzionale e un metodo di apprendimento senza assunzioni strutturali per modelli causali ciclici lineari non gaussiani con variabili latenti, introducendo nuovi vincoli di rango sugli archi per identificare le classi di equivalenza.

Haoyue Dai, Immanuel Albrecht, Peter Spirtes + 1 more2026-03-06💻 cs

Diffusion Policy through Conditional Proximal Policy Optimization

Il paper propone un metodo efficiente per addestrare politiche di diffusione in contesti di apprendimento per rinforzo on-policy, superando le sfide computazionali del calcolo della verosimiglianza attraverso un nuovo allineamento tra iterazione della politica e processo di diffusione, ottenendo prestazioni superiori e comportamenti multimodali su diversi benchmark.

Ben Liu, Shunpeng Yang, Hua Chen2026-03-06💻 cs

Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation

Il paper propone la Ricostruzione Contrastiva Diffusiva (DCR), un metodo che integra segnali contrastivi derivati dalle immagini ricostruite nel processo di diffusione per bilanciare la capacità discriminativa e la percezione dei dettagli, superando così i limiti degli encoder visivi CLIP.

Boyu Han, Qianqian Xu, Shilong Bao + 4 more2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Questo studio dimostra che l'induttività architetturale delle reti neurali convoluzionali, in particolare la località e la condivisione dei pesi, modifica l'implicita regolarizzazione indotta dal fenomeno dell'instabilità al bordo, permettendo una generalizzazione efficace su dati sferici ad alta dimensionalità dove le reti fully connected falliscono.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Questo articolo presenta WhisperAlign, una soluzione per il riconoscimento automatico del parlato e la diarizzazione in bengalese a lungo termine che combina l'uso strategico di WhisperX per la segmentazione temporale e il fine-tuning specifico del dominio del modello Pyannote per migliorare l'accuratezza nella trascrizione e nella distinzione dei parlanti.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Quadratic polarity and polar Fenchel-Young divergences from the canonical Legendre polarity

Questo articolo dimostra come le polarità quadratiche possano essere espresse tramite la polarità di Legendre deformata e come le divergenze polari Fenchel-Young generalizzino le divergenze di Bregman, offrendo una nuova comprensione della dualità di riferimento nell'informazione geometrica.

Frank Nielsen, Basile Plus-Gourdon, Mahito Sugiyama2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Questo studio analizza i punti di forza e le debolezze dei dati per l'assistenza incorporata in scenari open-set, dimostrando che la generazione di dataset sintetici diversificati e multimodali è fondamentale per addestrare modelli in grado di generalizzare a nuovi comportamenti utente e configurazioni di compiti.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Mitigating Instance Entanglement in Instance-Dependent Partial Label Learning

Il paper propone il framework CAD (Class-specific Augmentation based Disentanglement), una soluzione innovativa che mitiga l'intreccio delle istanze nell'apprendimento da etichette parziali dipendenti dall'istanza regolando le caratteristiche intra-classe e applicando penalità inter-classe per migliorare la chiarezza dei confini tra le classi.

Rui Zhao, Bin Shi, Kai Sun + 1 more2026-03-06🤖 cs.LG

Multilevel Training for Kolmogorov Arnold Networks

Questo articolo propone un approccio di addestramento multilivello per le reti Kolmogorov-Arnold (KAN) che, sfruttando la loro struttura basata su funzioni spline e una mappatura equivalente alle MLP, ottiene accelerazioni nell'addestramento e miglioramenti significativi della precisione, specialmente nelle reti neurali per la fisica informata.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

Missingness Bias Calibration in Feature Attribution Explanations

Il paper introduce MCal, un metodo post-hoc leggero che corregue il bias di missingness nelle spiegazioni di attribuzione delle caratteristiche affinando una semplice testa lineare su un modello base congelato, ottenendo prestazioni competitive o superiori rispetto agli approcci esistenti su diversi benchmark medici.

Shailesh Sridhar, Anton Xue, Eric Wong2026-03-06🤖 cs.LG

Why Is RLHF Alignment Shallow? A Gradient Analysis

Questo articolo dimostra che l'allineamento basato su RLHF è intrinsecamente superficiale perché i gradienti di sicurezza si concentrano esclusivamente sui token in cui il danno è determinato, proponendo un nuovo obiettivo basato su penalità di recupero per garantire segnali di gradiente su tutta la sequenza.

Robin Young2026-03-06🤖 cs.LG

Osmosis Distillation: Model Hijacking with the Fewest Samples

Il paper introduce l'attacco "Osmosis Distillation", una strategia di hijacking del modello che sfrutta dataset sintetici distillati per iniettare compiti nascosti con un numero minimo di campioni, compromettendo la sicurezza dell'apprendimento per trasferimento senza degradare significativamente le prestazioni originali.

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Questo studio dimostra che è possibile prevedere con un'accuratezza dell'80,4% il tipo di lancio di baseball analizzando esclusivamente la cinematica 3D del corpo del lanciatore, rivelando che la meccanica del busto e la posizione del polso sono i fattori più determinanti, mentre le varianti di presa non sono distinguibili dal movimento corporeo.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

Differential Privacy in Two-Layer Networks: How DP-SGD Harms Fairness and Robustness

Questo studio introduce un quadro teorico unificato che dimostra come il rumore necessario per la privacy differenziale nei due strati delle reti neurali comprometta l'apprendimento delle caratteristiche, peggiorando la giustizia, la robustezza e l'efficacia del fine-tuning privato su dati sbilanciati o a coda lunga.

Ruichen Xu, Kexin Chen2026-03-06🤖 cs.LG

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

Il paper propone FedAFD, un quadro unificato per l'apprendimento federato multimodale che, attraverso allineamento avversariale, fusione adattiva e distillazione guidata dalla similarità, risolve le sfide dell'eterogeneità dei dati e dei modelli per migliorare le prestazioni sia lato client che server.

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

← Precedente Successivo →