WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Questo articolo presenta WhisperAlign, una soluzione per il riconoscimento automatico del parlato e la diarizzazione in bengalese a lungo termine che combina l'uso strategico di WhisperX per la segmentazione temporale e il fine-tuning specifico del dominio del modello Pyannote per migliorare l'accuratezza nella trascrizione e nella distinzione dei parlanti.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Osmosis Distillation: Model Hijacking with the Fewest Samples

Il paper introduce l'attacco "Osmosis Distillation", una strategia di hijacking del modello che sfrutta dataset sintetici distillati per iniettare compiti nascosti con un numero minimo di campioni, compromettendo la sicurezza dell'apprendimento per trasferimento senza degradare significativamente le prestazioni originali.

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Questo lavoro dimostra che, per dati casuali ad alta dimensionalità, il bias implicito della discesa del gradiente su una rete neurale ReLU approssima con alta probabilità la soluzione a norma L2 minima, con un errore dell'ordine di Θ(n/d)\Theta(\sqrt{n/d}), grazie a una nuova analisi primale-duale che traccia l'evoluzione delle previsioni e la rapida stabilizzazione dei pattern di attivazione.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning

Questa dimostrazione presenta U-Parking, un sistema distribuito di parcheggio autonomo assistito da UWB che integra la pianificazione basata su modelli linguistici di grandi dimensioni (LLM) con una localizzazione robusta e un tracciamento della traiettoria per garantire un parcheggio automatizzato affidabile in ambienti interni complessi.

Yiang Wu, Qiong Wu, Pingyi Fan + 4 more2026-03-06🤖 cs.LG

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Il paper introduce BandPO, un nuovo metodo di ottimizzazione per l'apprendimento per rinforzo dei modelli linguistici che sostituisce il clipping canonico con un operatore teorico unificato e consapevole delle probabilità, risolvendo il collo di bottiglia esplorativo e prevenendo il collasso dell'entropia senza compromettere la stabilità.

Yuan Li, Bo Wang, Yufei Gao + 4 more2026-03-06🤖 cs.AI

Semantic Communication-Enhanced Split Federated Learning for Vehicular Networks: Architecture, Challenges, and Case Study

Questo articolo presenta il framework SC-USFL, che integra la comunicazione semantica nell'apprendimento federato diviso per le reti veicolari, riducendo l'overhead di comunicazione e migliorando la privacy delle etichette attraverso la trasmissione selettiva di informazioni rilevanti per il compito e l'adattamento dinamico alle condizioni del canale.

Lu Yu, Zheng Chang, Ying-Chang Liang2026-03-06🤖 cs.LG

\nabla-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space

Il paper presenta \nabla-Reasoner, un nuovo framework che integra l'ottimizzazione differenziabile tramite discesa del gradiente nello spazio latente durante l'inferenza per affinare il processo decisionale dei LLM, ottenendo significativi miglioramenti nel ragionamento matematico e riducendo il numero di chiamate al modello rispetto ai metodi basati su ricerca discreta.

Peihao Wang, Ruisi Cai, Zhen Wang + 4 more2026-03-06🤖 cs.LG