Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

Questo commento paesaggistico valuta la famiglia GPT-5 come ragionatore clinico multimodale, evidenziando significativi progressi nel ragionamento testuale e nella sintesi multimodale rispetto a GPT-4o, pur rilevando che i modelli generalisti non sostituiscono ancora i sistemi specializzati in compiti critici di percezione come la neuroradiologia e la mammografia.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization

Questo lavoro propone un framework di apprendimento per rinforzo distribuito basato sul collo di bottiglia dell'informazione e sul valore a rischio condizionato che ottimizza gli equalizzatori DRAM garantendo prestazioni nel caso peggiore, riducendo i tempi di calcolo di 51 volte e fornendo stime di incertezza certificate per l'implementazione industriale.

Muhammad Usama, Dong Eui Chang2026-03-06💻 cs

The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization

Questo studio dimostra che l'induttività architetturale delle reti neurali convoluzionali, in particolare la località e la condivisione dei pesi, modifica l'implicita regolarizzazione indotta dal fenomeno dell'instabilità al bordo, permettendo una generalizzazione efficace su dati sferici ad alta dimensionalità dove le reti fully connected falliscono.

Tongtong Liang, Esha Singh, Rahul Parhi + 2 more2026-03-06💻 cs

WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Questo articolo presenta WhisperAlign, una soluzione per il riconoscimento automatico del parlato e la diarizzazione in bengalese a lungo termine che combina l'uso strategico di WhisperX per la segmentazione temporale e il fine-tuning specifico del dominio del modello Pyannote per migliorare l'accuratezza nella trascrizione e nella distinzione dei parlanti.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Osmosis Distillation: Model Hijacking with the Fewest Samples

Il paper introduce l'attacco "Osmosis Distillation", una strategia di hijacking del modello che sfrutta dataset sintetici distillati per iniettare compiti nascosti con un numero minimo di campioni, compromettendo la sicurezza dell'apprendimento per trasferimento senza degradare significativamente le prestazioni originali.

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI