cs.LG articoli | Gist.Science

Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking

Questo studio presenta un quadro diagnostico sistematico che quantifica l'instabilità dei ranking nell'inferenza delle reti di regolazione genica sotto diverse scelte protocollari, rivelando come le inversioni siano guidate da variazioni nella capacità discriminativa dei metodi piuttosto che da effetti di tasso base, e proponendo pratiche di reporting consapevoli della stabilità.

Ihor Kendiukhov2026-03-05🤖 cs.LG

Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data

Questo studio presenta un nuovo approccio bayesiano basato su Transformer ad alta risoluzione che fonde dati Sentinel-1, RCM e AMSR2 per mappare la concentrazione del ghiaccio marino artico a 200 metri e quantificare l'incertezza, superando le sfide delle etichette imprecise e dell'eterogeneità dei dati grazie a una funzione di perdita supervisionata debole geograficamente ponderata e a un'architettura che integra moduli globali e locali.

Mabel Heffring, Lincoln Linlin Xu2026-03-05🤖 cs.LG

Solving adversarial examples requires solving exponential misalignment

Lo studio dimostra che la vulnerabilità agli esempi avversari deriva da un disallineamento esponenziale tra le varietà percettive delle reti neurali e quelle umane, suggerendo che la robustezza può essere raggiunta solo allineando la dimensionalità di questi spazi concettuali.

Alessandro Salvatore, Stanislav Fort, Surya Ganguli2026-03-05🤖 cs.LG

Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory

Il lavoro presenta OrbEvo, un modello basato su trasformatori grafici equivarianti che apprende efficientemente l'evoluzione temporale delle funzioni d'onda nella teoria del funzionale densità dipendente dal tempo (TDDFT) per prevedere con precisione le dinamiche elettroniche e le proprietà ottiche sotto l'effetto di campi esterni.

Xuan Zhang, Haiyang Yu, Chengdong Wang + 3 more2026-03-05🔬 cond-mat.mtrl-sci

MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery

Il paper introduce l'MMAI Gym for Science, un framework completo per addestrare modelli fondazionali liquidi (LFM) specializzati nella scoperta di farmaci, dimostrando che questi modelli più piccoli e mirati superano in efficienza e prestazioni i grandi modelli generici su compiti critici come l'ottimizzazione molecolare e la previsione delle proprietà ADMET.

Maksim Kuznetsov, Zulfat Miftahutdinov, Rim Shayakhmetov + 17 more2026-03-05🤖 cs.AI

Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence

Questo articolo propone il Q-Measure-Learning, un nuovo algoritmo di apprendimento per rinforzo a spazio continuo che stima efficientemente la funzione valore tramite una misura empirica e kernel smoothing, garantendo convergenza quasi certa e offrendo un'implementazione computazionalmente efficiente con complessità lineare.

Shengbo Wang2026-03-05🤖 cs.LG

Test-Time Meta-Adaptation with Self-Synthesis

Il paper introduce MASS, un framework di meta-apprendimento che permette ai grandi modelli linguistici di adattarsi al momento del test generando dati sintetici specifici per il problema e aggiornando i propri parametri attraverso un'ottimizzazione a due livelli che massimizza le prestazioni sul compito finale.

Zeyneb N. Kaya, Nick Rui2026-03-05🤖 cs.AI

Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis

Questo studio propone un framework di quantificazione dell'incertezza a livello di logit per l'analisi di immagini istopatologiche tramite modelli visione-linguaggio, evidenziando la necessità di tale approccio per garantire affidabilità e trasparenza in ambito sanitario nonostante l'elevata sensibilità stocastica e la minima influenza della temperatura osservate.

Betul Yurdem, Ferhat Ozgur Catak, Murat Kuzlu + 1 more2026-03-05🤖 cs.LG

mlx-snn: Spiking Neural Networks on Apple Silicon via MLX

Il paper introduce mlx-snn, la prima libreria nativa per le reti neurali a impulsi (SNN) basata sul framework MLX di Apple, che offre un'efficiente pipeline di addestramento e modelli neuronali avanzati per l'hardware Apple Silicon, superando le prestazioni e l'efficienza della memoria delle soluzioni PyTorch esistenti.

Jiahao Qin2026-03-05🤖 cs.AI

Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning

Il paper dimostra che la "Neural Collapse Direzionale", ovvero la ridotta variabilità lungo le direzioni di separazione delle classi, è il fattore geometrico fondamentale che spiega sia l'efficace trasferimento few-shot sia la bassa interferenza tra più compiti nell'apprendimento auto-supervisionato.

Achleshwar Luthra, Yash Salunkhe, Tomer Galanti2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

Role-Aware Conditional Inference for Spatiotemporal Ecosystem Carbon Flux Prediction

Il lavoro propone RACI, un framework di apprendimento informato dai processi che migliora la previsione dei flussi di carbonio negli ecosistemi disgregando le condizioni ambientali in ruoli distinti (regimi lenti e forzanti dinamici) per garantire una generalizzazione spaziale robusta in presenza di eterogeneità.

Yiming Sun, Runlong Yu, Rongchao Dong + 6 more2026-03-05🤖 cs.AI

Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts

Lo studio valuta empiricamente i compromessi tra ensembling, merging e routing di esperti efficienti nei parametri, dimostrando che il routing offre i migliori guadagni di prestazioni e che tecniche di selezione degli esperti come il clustering possono mitigarne i costi computazionali.

Sanae Lotfi, Lucas Caccia, Alessandro Sordoni + 2 more2026-03-05🤖 cs.LG

Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs

Questo lavoro propone un framework di apprendimento online per verificate di ragionamento a catena di pensiero che, caratterizzando i limiti degli errori tramite estensioni della dimensione di Littlestone, ottimizza il compromesso tra correttezza e completezza per migliorare l'accuratezza dei prover e generare dimostrazioni complesse.

Maria-Florina Balcan, Avrim Blum, Kiriaki Fragkia + 2 more2026-03-05🤖 cs.LG

Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization

Il documento propone un'architettura di integrazione GNSS/IMU in tempo reale basata sull'ottimizzazione del grafo dei fattori (FGO) che, pur comportando una lieve riduzione della precisione rispetto ai metodi batch, garantisce un'operatività in tempo reale e una maggiore disponibilità del servizio in ambienti urbani complessi.

Radu-Andrei Cioaca, Cristian Rusu, Paul Irofti + 3 more2026-03-05🤖 cs.LG

Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization

Questo lavoro presenta un metodo di integrazione GNSS-IMU in tempo reale basato sull'ottimizzazione del grafo fattoriale, che utilizza l'ottimizzazione incrementale con marginalizzazione a finestra fissa per garantire una stima causale dello stato e dimostrare elevate prestazioni in ambienti urbani degradati.

Radu-Andrei Cioaca, Paul Irofti, Cristian Rusu + 3 more2026-03-05🤖 cs.LG

Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants

Questo articolo presenta un blueprint pratico per valutare e ottimizzare gli assistenti alla spesa conversazionali multi-agente, introducendo un sistema di valutazione basato su LLM e due strategie di ottimizzazione dei prompt (Sub-agent GEPA e MAMuT GEPA) per migliorare le interazioni complesse e vincolate nel contesto della spesa alimentare.

Alejandro Breen Herrera, Aayush Sheth, Steven G. Xu + 5 more2026-03-05🤖 cs.AI

Transport Clustering: Solving Low-Rank Optimal Transport via Clustering

Il paper introduce "Transport Clustering", un algoritmo che risolve il problema NP-difficile del trasporto ottimo a rango ridotto riducendolo a un problema di clustering su corrispondenze, garantendo approssimazioni in tempo polinomiale e superando le prestazioni dei solutori esistenti su dataset su larga scala.

Henri Schmidt, Peter Halmos, Ben Raphael2026-03-05🤖 cs.LG

ByteFlow: Language Modeling through Adaptive Byte Compression without a Tokenizer

Il paper introduce ByteFlow Net, un'architettura gerarchica che elimina i tokenizzatori predefiniti permettendo ai modelli linguistici di apprendere autonomamente segmentazioni adattive dei flussi di byte tramite compressione, ottenendo così prestazioni superiori rispetto ai metodi basati su tokenizzazione fissa.

Chunyuan Deng, Sanket Lokegaonkar, Colin Lockard + 3 more2026-03-05🤖 cs.LG

Controllable Generative Sandbox for Causal Inference

Il paper introduce CausalMix, un framework generativo variazionale che colma il divario tra realismo distributivo e controllabilità causale nella sintesi di dati tabellari misti, permettendo la manipolazione indipendente di sovrapposizione, confondimento ed eterogeneità degli effetti per validare studi causali e analisi di potenza.

Qi Zhang, Harsh Parikh, Ashley Naimi + 3 more2026-03-05🤖 cs.LG

SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training

Il paper propone SENTINEL, un meccanismo di verifica leggero basato su medie esponenziali mobili che garantisce l'integrità dell'addestramento decentralizzato con parallelismo di pipeline su nodi inaffidabili, permettendo l'addestramento di grandi modelli linguistici senza duplicazione computazionale.

Hadi Mohaghegh Dolatabadi, Thalaiyasingam Ajanthan, Sameera Ramasinghe + 5 more2026-03-05🤖 cs.LG

← Precedente Successivo →