cs.LG articoli | Gist.Science

Uncertainty-Aware Subset Selection for Robust Visual Explainability under Distribution Shifts

Questo articolo presenta un framework che combina la selezione di sottoinsiemi submodulare con la stima dell'incertezza basata su gradienti per migliorare la robustezza e la fedeltà delle spiegazioni visive in scenari fuori distribuzione, senza richiedere addestramento aggiuntivo.

Madhav Gupta, Vishak Prasad C, Ganesh Ramakrishnan2026-03-09🤖 cs.LG

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Questo articolo propone una nuova metrica di sensibilità globale basata sulle curve di aspettativa condizionata individuale (ICE) per superare i limiti dei Partial Dependence Plots nell'analisi delle interazioni tra variabili nei modelli di apprendimento automatico applicati al design ingegneristico, dimostrando la sua superiorità attraverso prove matematiche e valutazioni comparative su casi di studio aerospaziali.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

Questo studio introduce un nuovo approccio basato su patch per l'analisi topologica dei dati (TDA) applicato alle immagini TC volumetriche, che supera i metodi tradizionali in termini di accuratezza diagnostica e tempi di calcolo, offrendo inoltre un pacchetto Python per facilitarne l'uso.

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Understanding and Improving Hyperbolic Deep Reinforcement Learning

Il paper introduce Hyper++, un nuovo agente di reinforcement learning iperbolico che risolve le sfide di ottimizzazione attraverso regolarizzazione delle feature, una funzione di perdita categorica e un'architettura di rete ottimizzata, garantendo così una stabilità di apprendimento superiore e prestazioni migliori rispetto ai metodi esistenti su benchmark come ProcGen e Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

Il paper presenta CARE, un framework di post-training multimodale che trasforma gli errori in segnali di supervisione attraverso un obiettivo contrastivo ancorato e un campionamento guidato dalla riflessione, migliorando significativamente l'accuratezza e la stabilità dell'addestramento rispetto ai metodi esistenti.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Il paper presenta LLMTM, un benchmark completo per valutare e ottimizzare le prestazioni dei modelli linguistici nell'analisi dei motivi temporali nei grafi dinamici, proponendo un agente potenziato da strumenti e un dispatcher intelligente che bilancia accuratezza e costi computazionali.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Bayesian Monocular Depth Refinement via Neural Radiance Fields

Il paper propone MDENeRF, un framework iterativo che affina le stime di profondità monoculare fondendo un prior globale con dettagli geometrici ad alta frequenza e incertezze bayesiane estratte da Neural Radiance Fields (NeRF) per migliorare la comprensione della scena.

Arun Muthukkumar2026-03-09🤖 cs.LG

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Il paper propone un nuovo framework end-to-end per il riconoscimento visivo-uditivo del parlato che, eliminando la necessità di maschere esplicita per la rimozione del rumore, utilizza un modulo di fusione basato su Conformer per migliorare implicitamente le caratteristiche audio tramite quelle video, ottenendo prestazioni superiori rispetto ai metodi esistenti in condizioni rumorose.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

Questo lavoro propone un metodo per ottenere rappresentazioni invarianti al dominio tramite l'embedding spettrale di piani di trasporto ottimo regolarizzati, interpretati come matrici di adiacenza di grafi bipartiti, dimostrando prestazioni elevate su benchmark di riconoscimento musicale e classificazione di difetti nei cavi elettrici.

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

Il paper presenta un metodo per realizzare una rete neurale ottica utilizzando esclusivamente risorse lineari e stati coerenti di luce, dove la non linearità necessaria per l'apprendimento è ottenuta tramite codifica di fase, consentendo sia l'inferenza che l'addestramento *in situ* con una notevole resilienza alle perdite di fotoni.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Neural Signals Generate Clinical Notes in the Wild

Il paper presenta CELM, il primo modello fondazionale multimodale in grado di generare automaticamente rapporti clinici completi a partire da registrazioni EEG a lungo termine, ottenendo miglioramenti significativi rispetto alle tecniche esistenti grazie all'integrazione di modelli linguistici e supervisione sulla storia del paziente.

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Gli autori presentano e dimostrano sperimentalmente una rete neurale fotonica profonda che realizza l'apprendimento non supervisionato online tramite un meccanismo di feedback locale ottico e sinapsi a materiali a cambiamento di fase, ottenendo il riconoscimento completo di lettere senza conversioni elettro-ottiche.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

ZK-HybridFL: Zero-Knowledge Proof-Enhanced Hybrid Ledger for Federated Learning

Il paper presenta ZK-HybridFL, un framework decentralizzato per l'apprendimento federato che integra un registro DAG, sidechain dedicate e prove a conoscenza zero per garantire validazione sicura dei modelli, resistenza agli attacchi e prestazioni superiori rispetto alle soluzioni esistenti.

Amirhossein Taherpour, Xiaodong Wang2026-03-09🤖 cs.LG

EDIS: Diagnosing LLM Reasoning via Entropy Dynamics

Il paper introduce EDIS, una metrica basata sull'evoluzione temporale dell'entropia che rileva pattern di instabilità nelle traiettorie di generazione per distinguere ragionamenti corretti da quelli errati, migliorando così l'accuratezza dei modelli linguistici sia durante l'inferenza che nella curatela dei dati di addestramento.

Chenghua Zhu, Siyan Wu, Xiangkang Zeng, Zishan Xu, Zhaolu Kang, Yifu Guo, Yuquan Lu, Junduan Huang, Guojing Zhou2026-03-09🤖 cs.LG

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Il paper propone la Latent Exploration Decoding (LED), una strategia di decodifica senza costi di addestramento che ripristina l'esplorazione nei Large Reasoning Models post-allenati aggregando le distribuzioni posteriori degli strati intermedi per migliorare l'accuratezza nei compiti di ragionamento.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Questo articolo presenta un pipeline automatico di red-teaming che dimostra come strategie di inganno a livello di prompt possano fuorviare sia i metodi di audit in scatola nera che in scatola bianca, rivelando per la prima volta la possibilità di un inganno strategico basato sull'attivazione e mettendo in dubbio la robustezza delle attuali tecniche di allineamento contro modelli disallineati sufficientemente capaci.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Latent Poincaré Shaping for Agentic Reinforcement Learning

Il paper propone LaPha, un metodo che addestra agenti LLM simili ad AlphaZero in uno spazio latente di Poincaré, sfruttando la curvatura negativa per migliorare l'efficienza della ricerca e ottenendo risultati significativi su benchmark matematici come MATH-500 e AIME.

Hanchen Xia, Baoyou Chen, Zelin Zang, Yutang Ge, Guojiang Zhao, Siyu Zhu2026-03-09🤖 cs.LG

Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol

Questo articolo introduce un protocollo di validazione basato su perturbazioni per garantire la fedeltà delle mappe di salienza nei modelli di previsione dell'efficacia degli siRNA, rivelando fallimenti critici nel trasferimento tra dataset e proponendo un regolarizzatore biologico (BioPrior) per migliorare l'affidabilità della progettazione terapeutica prima della sintesi.

Zahra Khodagholi, Niloofar Yousefi2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

Il paper presenta Aletheia, un agente di ricerca matematica autonomo basato su modelli avanzati e scaling dell'inferenza, capace di generare, verificare e revisionare soluzioni end-to-end per problemi che spaziano dalle Olimpiadi Matematiche alla ricerca di livello PhD, dimostrando risultati significativi come la produzione autonoma di articoli scientifici e la risoluzione di problemi aperti.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink

Il paper analizza il fenomeno del "diagonal sink" nei meccanismi di attenzione temporale, dimostrando teoricamente come le punteggiature fuori diagonale dipendano dalla lunghezza della sequenza e proponendo metodi di regolarizzazione per mitigare la degenerazione delle informazioni.

Victoria Hankemeier, Malte Schilling2026-03-09🤖 cs.LG

← Precedente Successivo →