cs.LG articoli | Gist.Science

WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech

Questo articolo presenta WhisperAlign, una soluzione per il riconoscimento automatico del parlato e la diarizzazione in bengalese a lungo termine che combina l'uso strategico di WhisperX per la segmentazione temporale e il fine-tuning specifico del dominio del modello Pyannote per migliorare l'accuratezza nella trascrizione e nella distinzione dei parlanti.

Aurchi Chowdhury, Rubaiyat -E-Zaman, Sk. Ashrafuzzaman Nafees2026-03-06💻 cs

Quadratic polarity and polar Fenchel-Young divergences from the canonical Legendre polarity

Questo articolo dimostra come le polarità quadratiche possano essere espresse tramite la polarità di Legendre deformata e come le divergenze polari Fenchel-Young generalizzino le divergenze di Bregman, offrendo una nuova comprensione della dualità di riferimento nell'informazione geometrica.

Frank Nielsen, Basile Plus-Gourdon, Mahito Sugiyama2026-03-06💻 cs

On the Strengths and Weaknesses of Data for Open-set Embodied Assistance

Questo studio analizza i punti di forza e le debolezze dei dati per l'assistenza incorporata in scenari open-set, dimostrando che la generazione di dataset sintetici diversificati e multimodali è fondamentale per addestrare modelli in grado di generalizzare a nuovi comportamenti utente e configurazioni di compiti.

Pradyumna Tambwekar, Andrew Silva, Deepak Gopinath + 3 more2026-03-06🤖 cs.AI

Mitigating Instance Entanglement in Instance-Dependent Partial Label Learning

Il paper propone il framework CAD (Class-specific Augmentation based Disentanglement), una soluzione innovativa che mitiga l'intreccio delle istanze nell'apprendimento da etichette parziali dipendenti dall'istanza regolando le caratteristiche intra-classe e applicando penalità inter-classe per migliorare la chiarezza dei confini tra le classi.

Rui Zhao, Bin Shi, Kai Sun + 1 more2026-03-06🤖 cs.LG

Multilevel Training for Kolmogorov Arnold Networks

Questo articolo propone un approccio di addestramento multilivello per le reti Kolmogorov-Arnold (KAN) che, sfruttando la loro struttura basata su funzioni spline e una mappatura equivalente alle MLP, ottiene accelerazioni nell'addestramento e miglioramenti significativi della precisione, specialmente nelle reti neurali per la fisica informata.

Ben S. Southworth, Jonas A. Actor, Graham Harper + 1 more2026-03-06🔢 math

Missingness Bias Calibration in Feature Attribution Explanations

Il paper introduce MCal, un metodo post-hoc leggero che corregue il bias di missingness nelle spiegazioni di attribuzione delle caratteristiche affinando una semplice testa lineare su un modello base congelato, ottenendo prestazioni competitive o superiori rispetto agli approcci esistenti su diversi benchmark medici.

Shailesh Sridhar, Anton Xue, Eric Wong2026-03-06🤖 cs.LG

Why Is RLHF Alignment Shallow? A Gradient Analysis

Questo articolo dimostra che l'allineamento basato su RLHF è intrinsecamente superficiale perché i gradienti di sicurezza si concentrano esclusivamente sui token in cui il danno è determinato, proponendo un nuovo obiettivo basato su penalità di recupero per garantire segnali di gradiente su tutta la sequenza.

Robin Young2026-03-06🤖 cs.LG

Osmosis Distillation: Model Hijacking with the Fewest Samples

Il paper introduce l'attacco "Osmosis Distillation", una strategia di hijacking del modello che sfrutta dataset sintetici distillati per iniettare compiti nascosti con un numero minimo di campioni, compromettendo la sicurezza dell'apprendimento per trasferimento senza degradare significativamente le prestazioni originali.

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Il paper presenta ReCouPLe, un framework leggero che utilizza rationales in linguaggio naturale per guidare l'apprendimento delle ricompense basato sulle preferenze, mitigando la confusione causale e migliorando significativamente la generalizzazione e le prestazioni delle politiche in nuovi compiti senza richiedere ulteriori dati o fine-tuning del modello linguistico.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Questo studio dimostra che è possibile prevedere con un'accuratezza dell'80,4% il tipo di lancio di baseball analizzando esclusivamente la cinematica 3D del corpo del lanciatore, rivelando che la meccanica del busto e la posizione del polso sono i fattori più determinanti, mentre le varianti di presa non sono distinguibili dal movimento corporeo.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

Differential Privacy in Two-Layer Networks: How DP-SGD Harms Fairness and Robustness

Questo studio introduce un quadro teorico unificato che dimostra come il rumore necessario per la privacy differenziale nei due strati delle reti neurali comprometta l'apprendimento delle caratteristiche, peggiorando la giustizia, la robustezza e l'efficacia del fine-tuning privato su dati sbilanciati o a coda lunga.

Ruichen Xu, Kexin Chen2026-03-06🤖 cs.LG

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

Il paper propone FedAFD, un quadro unificato per l'apprendimento federato multimodale che, attraverso allineamento avversariale, fusione adattiva e distillazione guidata dalla similarità, risolve le sfide dell'eterogeneità dei dati e dei modelli per migliorare le prestazioni sia lato client che server.

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Questo lavoro dimostra che, per dati casuali ad alta dimensionalità, il bias implicito della discesa del gradiente su una rete neurale ReLU approssima con alta probabilità la soluzione a norma L2 minima, con un errore dell'ordine di $\Theta(\sqrt{n/d})$ , grazie a una nuova analisi primale-duale che traccia l'evoluzione delle previsioni e la rapida stabilizzazione dei pattern di attivazione.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning

Questa dimostrazione presenta U-Parking, un sistema distribuito di parcheggio autonomo assistito da UWB che integra la pianificazione basata su modelli linguistici di grandi dimensioni (LLM) con una localizzazione robusta e un tracciamento della traiettoria per garantire un parcheggio automatizzato affidabile in ambienti interni complessi.

Yiang Wu, Qiong Wu, Pingyi Fan + 4 more2026-03-06🤖 cs.LG

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

Il paper propone VPWEM, una politica visuomotoria non markoviana che integra memoria di lavoro ed episodica tramite un compressore contestuale basato su Transformer, permettendo ai robot di gestire compiti a lungo termine con costi computazionali costanti e superando significativamente gli stati dell'arte su benchmark di manipolazione.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

EVMbench: Evaluating AI Agents on Smart Contract Security

Il paper introduce EVMbench, un benchmark che valuta la capacità degli agenti AI di rilevare, correggere e sfruttare vulnerabilità negli smart contract, dimostrando che i modelli più avanzati sono già in grado di eseguire attacchi end-to-end su istanze reali della blockchain Ethereum.

Justin Wang, Andreas Bigger, Xiaohai Xu, Justin W. Lin, Andy Applebaum, Tejal Patwardhan, Alpin Yukseloglu, Olivia Watkins2026-03-06🔒 cs.CR

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Il paper introduce BandPO, un nuovo metodo di ottimizzazione per l'apprendimento per rinforzo dei modelli linguistici che sostituisce il clipping canonico con un operatore teorico unificato e consapevole delle probabilità, risolvendo il collo di bottiglia esplorativo e prevenendo il collasso dell'entropia senza compromettere la stabilità.

Yuan Li, Bo Wang, Yufei Gao + 4 more2026-03-06🤖 cs.AI

Semantic Communication-Enhanced Split Federated Learning for Vehicular Networks: Architecture, Challenges, and Case Study

Questo articolo presenta il framework SC-USFL, che integra la comunicazione semantica nell'apprendimento federato diviso per le reti veicolari, riducendo l'overhead di comunicazione e migliorando la privacy delle etichette attraverso la trasmissione selettiva di informazioni rilevanti per il compito e l'adattamento dinamico alle condizioni del canale.

Lu Yu, Zheng Chang, Ying-Chang Liang2026-03-06🤖 cs.LG

Person Detection and Tracking from an Overhead Crane LiDAR

Questo articolo presenta un dataset specifico per la rilevazione e il tracciamento di persone tramite LiDAR montato su gru a ponte, valutando l'adattamento di vari rilevatori 3D e algoritmi di tracciamento in un ambiente industriale per colmare il divario tra i dati di guida standard e la visione dall'alto.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

$\nabla$ -Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space

Il paper presenta $\nabla$ -Reasoner, un nuovo framework che integra l'ottimizzazione differenziabile tramite discesa del gradiente nello spazio latente durante l'inferenza per affinare il processo decisionale dei LLM, ottenendo significativi miglioramenti nel ragionamento matematico e riducendo il numero di chiamate al modello rispetto ai metodi basati su ricerca discreta.

Peihao Wang, Ruisi Cai, Zhen Wang + 4 more2026-03-06🤖 cs.LG

← Precedente Successivo →

cs.LG