Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings

Questo articolo presenta TREDBench e un metodo di adattamento guidato da embedding che, utilizzando esclusivamente dati sintetici curati, migliora significativamente l'efficienza e l'accuratezza del modello fondazionale TabPFN 2.5 nelle regressioni ingegneristiche, colmando il divario tra domini sintetici e reali senza richiedere dati ingegneristici reali per l'addestramento.

Lyle Regenwetter, Rosen Yu, Cyril Picard + 1 more2026-03-06💻 cs

When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper

Questo studio dimostra che, contrariamente all'assunto comune, l'uso del modello di enhancement audio SAM-Audio come pre-elaborazione per sistemi ASR zero-shot basati su Whisper peggiora sistematicamente le prestazioni di riconoscimento, rivelando una fondamentale discrepanza tra la qualità acustica percepita dall'uomo e la robustezza necessaria per l'elaborazione automatica.

Akif Islam, Raufun Nahar, Md. Ekramul Hamid2026-03-06💻 cs

A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification

Questo studio presenta una valutazione sistematica di tre strategie di compressione delle reti neurali (pruning, quantizzazione e distillazione della conoscenza) per la classificazione di immagini iperspettrali, dimostrando che è possibile ridurre significativamente le dimensioni e i costi computazionali dei modelli mantenendo prestazioni competitive per le applicazioni di telerilevamento.

Sai Shi2026-03-06💻 cs

When Priors Backfire: On the Vulnerability of Unlearnable Examples to Pretraining

Questo articolo identifica la vulnerabilità degli esempi inapprendibili (UE) quando utilizzati su modelli preaddestrati, poiché le conoscenze pregresse permettono di aggirare le perturbazioni, e propone il metodo BAIT, un'ottimizzazione bi-livello che vincola le perturbazioni a target errati per garantire la protezione dei dati anche in presenza di priors semantici.

Zhihao Li, Gezheng Xu, Jiale Cai + 5 more2026-03-06💻 cs

CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

Il paper presenta CONE, un modello ibrido pre-addestrato che utilizza un nuovo algoritmo di embedding composito per codificare numeri, intervalli e gaussiane insieme alle loro unità e attributi, preservando le relazioni semantiche e di distanza e ottenendo risultati superiori rispetto agli stati dell'arte in compiti di ragionamento numerico su dataset diversificati.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Questo commento paesaggistico valuta la famiglia GPT-5 come ragionatore clinico multimodale, evidenziando significativi progressi nel ragionamento testuale e nella sintesi multimodale rispetto a GPT-4o, pur rilevando che i modelli generalisti non sostituiscono ancora i sistemi specializzati in compiti critici di percezione come la neuroradiologia e la mammografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization

Questo lavoro propone un framework di apprendimento per rinforzo distribuito basato sul collo di bottiglia dell'informazione e sul valore a rischio condizionato che ottimizza gli equalizzatori DRAM garantendo prestazioni nel caso peggiore, riducendo i tempi di calcolo di 51 volte e fornendo stime di incertezza certificate per l'implementazione industriale.

Muhammad Usama, Dong Eui Chang2026-03-06💻 cs