cs.LG articoli | Gist.Science

When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift

Questo studio dimostra che l'integrazione di modelli sequenziali temporali, in particolare i Transformer, nell'algoritmo PPO migliora significativamente la robustezza dei sistemi di apprendimento per rinforzo contro la deriva dei sensori e la parzialità delle osservazioni, garantendo prestazioni elevate anche in scenari di guasto estremo.

Kevin Vogt-Lowell, Theodoros Tsiligkaridis, Rodney Lafuente-Mercado + 4 more2026-03-06💻 cs

iAgentBench: Benchmarking Sensemaking Capabilities of Information-Seeking Agents on High-Traffic Topics

Il paper presenta iAgentBench, un nuovo benchmark dinamico per valutare le capacità di sintesi e integrazione di informazioni da più fonti degli agenti di ricerca, superando i limiti dei test attuali che si basano spesso sul recupero di un singolo passaggio.

Preetam Prabhu Srikar Dammu, Arnav Palkhiwala, Tanya Roosta + 1 more2026-03-06💻 cs

Neuro-Symbolic Financial Reasoning via Deterministic Fact Ledgers and Adversarial Low-Latency Hallucination Detector

Il paper presenta VeNRA, un agente di ragionamento finanziario neuro-simbolico che supera i limiti delle architetture RAG tradizionali sostituendo il recupero testuale probabilistico con un registro di fatti deterministici e un modello Sentinel addestrato tramite simulazione avversaria per garantire ragionamento numerico verificabile e privo di allucinazioni.

Pedram Agand2026-03-06💻 cs

Improving the accuracy of physics-informed neural networks via last-layer retraining

L'articolo propone un metodo per migliorare l'accuratezza delle reti neurali informate dalla fisica (PINN) tramite un addestramento finale che combina la rete con un passo di post-elaborazione, riducendo gli errori di quattro-cinque ordini di grandezza e permettendo il riutilizzo delle funzioni di base per problemi più complessi.

Saad Qadeer, Panos Stinis2026-03-06🔢 math

Direct Estimation of Tree Volume and Aboveground Biomass Using Deep Regression with Synthetic Lidar Data

Questo studio propone un approccio diretto basato su reti di regressione profonda addestrate su dati Lidar sintetici per stimare con maggiore precisione il volume e la biomassa degli alberi a livello di parcelle, superando le significative sottostime dei metodi indiretti tradizionali.

Habib Pourdelan, Zhengkang Xiang, Hugh Stewart + 3 more2026-03-06💻 cs

Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation

Il paper propone che il consolidamento della memoria non serva solo a stabilizzare le rappresentazioni, ma ottimizzi la generalizzazione attraverso una "dimenticanza predittiva" che comprime selettivamente le informazioni per conservare solo ciò che prevede esiti futuri, un processo iterativo reso necessario dai vincoli di codifica ad alta fedeltà e validato da simulazioni in modelli biologici e linguistici.

Zafeirios Fountas, Adnan Oomerjee, Haitham Bou-Ammar + 2 more2026-03-06💻 cs

Generalizing Fair Top- $k$ Selection: An Integrative Approach

Questo lavoro generalizza la selezione top- $k$ equa a più gruppi protetti, analizzandone la complessità computazionale e proponendo una soluzione pratica che bilancia l'efficienza, la minimizzazione della disparità rispetto a una funzione di riferimento e la stabilità della funzione di punteggio rispetto alle perturbazioni.

Guangya Cai2026-03-06💻 cs

Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings

Questo articolo presenta TREDBench e un metodo di adattamento guidato da embedding che, utilizzando esclusivamente dati sintetici curati, migliora significativamente l'efficienza e l'accuratezza del modello fondazionale TabPFN 2.5 nelle regressioni ingegneristiche, colmando il divario tra domini sintetici e reali senza richiedere dati ingegneristici reali per l'addestramento.

Lyle Regenwetter, Rosen Yu, Cyril Picard + 1 more2026-03-06💻 cs

Implicit Bias and Loss of Plasticity in Matrix Completion: Depth Promotes Low-Rankness

Questo lavoro dimostra che l'aumento della profondità nelle reti lineari per il completamento della matrice intensifica le dinamiche accoppiate, favorendo un pregiudizio implicito verso soluzioni a basso rango che risolve questioni aperte sulla convergenza e previene la perdita di plasticità osservata nei modelli superficiali.

Baekrok Shin, Chulhee Yun2026-03-06💻 cs

When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper

Questo studio dimostra che, contrariamente all'assunto comune, l'uso del modello di enhancement audio SAM-Audio come pre-elaborazione per sistemi ASR zero-shot basati su Whisper peggiora sistematicamente le prestazioni di riconoscimento, rivelando una fondamentale discrepanza tra la qualità acustica percepita dall'uomo e la robustezza necessaria per l'elaborazione automatica.

Akif Islam, Raufun Nahar, Md. Ekramul Hamid2026-03-06💻 cs

Probabilistic Dreaming for World Models

Questo lavoro propone un'evoluzione del modello Dreamer basata su metodi probabilistici che permettono l'esplorazione parallela di stati latenti e il mantenimento di ipotesi distinte per futuri mutualmente esclusivi, ottenendo su MPE SimpleTag un miglioramento del punteggio del 4,5% e una riduzione del 28% della varianza rispetto al metodo standard.

Gavin Wong2026-03-06💻 cs

SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference

Questo articolo propone un approccio ibrido che combina modellazione teorica e benchmark empirico per determinare l'allocazione ottimale delle risorse hardware nella disaggregazione Prefill-Decode per l'inferenza di LLM, garantendo il rispetto degli obiettivi di livello di servizio (SLO) relativi a throughput e latenza.

Luchang Li, Dongfang Li, Bozhao Gong + 1 more2026-03-06🔢 math

A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

Questo studio presenta una valutazione sistematica di tre strategie di compressione delle reti neurali (pruning, quantizzazione e distillazione della conoscenza) per la classificazione di immagini iperspettrali, dimostrando che è possibile ridurre significativamente le dimensioni e i costi computazionali dei modelli mantenendo prestazioni competitive per le applicazioni di telerilevamento.

Sai Shi2026-03-06💻 cs

Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models

Questo documento presenta "Model Medicine", un quadro clinico interdisciplinare che applica principi biologici e medici per diagnosticare, trattare e prevenire disturbi nei modelli di intelligenza artificiale, introducendo una tassonomia di discipline, strumenti diagnostici come la "Neural MRI" e framework terapeutici per gestire la complessità dei sistemi AI.

Jihoon Jeong2026-03-06💻 cs

Count Bridges enable Modeling and Deconvolving Transcriptomic Data

Il paper introduce "Count Bridges", un processo stocastico su interi che permette la modellazione generativa e la deconvoluzione di dati trascrittomici aggregati, ottenendo prestazioni all'avanguardia nella risoluzione di profili di espressione genica a livello di singola cella.

Nic Fishman, Gokul Gowri, Tanush Kumar + 4 more2026-03-06💻 cs

When Priors Backfire: On the Vulnerability of Unlearnable Examples to Pretraining

Questo articolo identifica la vulnerabilità degli esempi inapprendibili (UE) quando utilizzati su modelli preaddestrati, poiché le conoscenze pregresse permettono di aggirare le perturbazioni, e propone il metodo BAIT, un'ottimizzazione bi-livello che vincola le perturbazioni a target errati per garantire la protezione dei dati anche in presenza di priors semantici.

Zhihao Li, Gezheng Xu, Jiale Cai + 5 more2026-03-06💻 cs

Distribution-Conditioned Transport

Il paper introduce la Distribution-Conditioned Transport (DCT), un framework che generalizza i modelli di trasporto tra distribuzioni sconosciute condizionandoli su embedding appresi, permettendo così applicazioni semi-supervisionate e migliorando risultati in ambiti biologici come la genomica a singola cellula e l'evoluzione dei recettori delle cellule T.

Nic Fishman, Gokul Gowri, Paolo L. B. Fischer + 3 more2026-03-06💻 cs

Interactive Benchmarks

Il paper propone "Interactive Benchmarks", un nuovo paradigma di valutazione unificato che misura l'intelligenza dei modelli attraverso processi interattivi sotto vincoli di budget, dimostrando che tale approccio offre una valutazione più robusta e fedele rispetto ai benchmark standard saturi.

Baoqing Yue, Zihan Zhu, Yifan Zhang + 3 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

Il paper presenta CONE, un modello ibrido pre-addestrato che utilizza un nuovo algoritmo di embedding composito per codificare numeri, intervalli e gaussiane insieme alle loro unità e attributi, preservando le relazioni semantiche e di distanza e ottenendo risultati superiori rispetto agli stati dell'arte in compiti di ragionamento numerico su dataset diversificati.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

KindSleep: Knowledge-Informed Diagnosis of Obstructive Sleep Apnea from Oximetry

Il paper introduce KindSleep, un framework di deep learning che integra segnali di ossimetria e dati clinici per diagnosticare in modo preciso e trasparente l'apnea ostruttiva del sonno, superando le prestazioni dei metodi esistenti su ampi dataset indipendenti.

Micky C Nnamdi, Wenqi Shi, Cheng Wan + 4 more2026-03-06💻 cs

← Precedente Successivo →

cs.LG