cs.LG articoli | Gist.Science

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

Il paper propone Spatial-TTT, un approccio basato sull'addestramento al momento del test (TTT) che utilizza un'architettura ibrida e un meccanismo di previsione spaziale per migliorare la comprensione intelligente dello spazio a partire da flussi video continui e a lungo termine.

Fangfu Liu, Diankun Wu, Jiawei Chi, Yimo Cai, Yi-Hsin Hung, Xumin Yu, Hao Li, Han Hu, Yongming Rao, Yueqi Duan2026-03-13🤖 cs.LG

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Il paper presenta un metodo privo di addestramento per il controllo fine dei colori nelle immagini generate da FLUX.1, basato sull'identificazione e manipolazione di un sottospazio latente strutturato secondo i parametri di Tonalità, Saturazione e Luminosità.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

BEFANA: A Tool for Biodiversity-Ecosystem Functioning Assessment by Network Analysis

Il documento presenta BEFANA, un software open-source in Python basato su notebook interattivi, progettato per facilitare l'analisi, la visualizzazione e la modellazione predittiva delle reti ecologiche attraverso l'integrazione di metodi di apprendimento automatico.

Martin Marzidovšek, Vid Podpečan, Erminia Conti + 2 more2026-03-12🤖 cs.LG

Efficient Bayesian Updates for Deep Active Learning via Laplace Approximations

Questo articolo propone un metodo di aggiornamento bayesiano efficiente basato sull'approssimazione di Laplace per l'apprendimento attivo profondo, che sostituisce il costoso riaddestramento delle reti neurali con un passo di ottimizzazione del secondo ordine, consentendo una selezione di batch più rapida e diversificata.

Denis Huseljic, Marek Herde, Lukas Rauch, Paul Hahn, Zhixin Huang, Daniel Kottke, Stephan Vogt, Bernhard Sick2026-03-12🤖 cs.LG

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Questo paper propone una nuova misura di equità chiamata "rischio discriminatorio" che integra aspetti individuali e di gruppo, dimostrando teoricamente come la combinazione di ensemble possa migliorare l'equità dei modelli di machine learning attraverso limiti dipendenti dal margine e introducendo metodi di potatura per ottenere sottogruppi sia accurati che equi.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Questo studio offre una valutazione aggiornata dell'approccio di apprendimento per rinforzo di Google Brain per il posizionamento dei macro, introducendo nuovi benchmark open-source, confrontando l'implementazione Circuit Training con baselines avanzate come la ricottura simulata e strumenti commerciali, e sollevando questioni critiche sulla riproducibilità e la scalabilità dei metodi esistenti.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Questo articolo propone un metodo di branch-and-bound disgiuntivo e nuove rilassazioni convesse per risolvere il completamento di matrici a basso rango con garanzia di ottimalità certificata, riducendo significativamente il divario di ottimalità e l'errore di generalizzazione rispetto ai metodi euristici esistenti.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

Il paper propone e sperimenta le "società di menti" basate sul linguaggio naturale (NLSOM), in cui grandi modelli linguistici e altri esperti neurali collaborano tramite un'interfaccia linguistica per superare i limiti dei singoli modelli e risolvere compiti multimodali complessi, aprendo al contempo nuove questioni di ricerca sulla struttura sociale e l'economia di tali sistemi di intelligenza artificiale emergenti.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Riemannian Laplace Approximation with the Fisher Metric

Questo lavoro corregge le limitazioni dell'approssimazione di Laplace riemanniana basata sulla metrica di Fisher, introducendo due varianti alternative che garantiscono l'esattezza asintotica e migliorano le prestazioni pratiche nelle inferenze bayesiane.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Large Language Models for Travel Behavior Prediction

Questo studio dimostra che i grandi modelli linguistici (LLM), utilizzati sia tramite prompting zero-shot che come generatori di embedding per modelli supervisionati, offrono un'alternativa flessibile ed efficiente dal punto di vista dei dati per la previsione dei comportamenti di viaggio, raggiungendo prestazioni competitive rispetto ai modelli tradizionali.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Questo articolo propone un metodo di aggregazione basato sul trasporto ottimo per combinare modelli Mixture-of-Experts distribuiti in un unico stimatore globale, garantendo efficienza computazionale, bassi costi di comunicazione e prestazioni statistiche comparabili all'addestramento centralizzato.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

Il paper presenta MFedMC, un framework di apprendimento federato multimodale efficiente nelle comunicazioni che, attraverso un'architettura disaccoppiata e un algoritmo di selezione congiunta di client e modalità basato su valori di Shapley, riduce l'overhead di comunicazione di oltre 20 volte mantenendo prestazioni comparabili ai metodi esistenti.

Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. Brinton2026-03-12🤖 cs.LG

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Il paper presenta HyWIA, un metodo innovativo per la potatura strutturata dei grandi modelli linguistici che, integrando valutazioni di importanza dei pesi a granularità fine e grossolana tramite un meccanismo di attenzione adattivo, supera le tecniche esistenti mantenendo prestazioni superiori nei compiti downstream.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Fast Fishing: Approximating BAIT for Efficient and Scalable Deep Active Image Classification

Questo articolo presenta due metodi per approssimare l'informazione di Fisher nel metodo BAIT, riducendone drasticamente la complessità computazionale e rendendolo scalabile per dataset di grandi dimensioni come ImageNet, mantenendo al contempo prestazioni elevate nell'apprendimento attivo profondo.

Denis Huseljic, Paul Hahn, Marek Herde + 2 more2026-03-12🤖 cs.LG

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Questo studio applica tecniche di machine learning spiegabile a un dataset di 28 anni nel Golfo di Trieste per prevedere con successo la tossicità delle cozze causata da fioriture algali, identificando specie specifiche e fattori ambientali come predittori chiave per migliorare i sistemi di allerta precoce e l'acquacoltura sostenibile.

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Exploratory Optimal Stopping: A Singular Control Formulation

Questo articolo propone una formulazione di controllo singolare regolarizzato per problemi di arresto ottimale esplorativo, risolvendoli tramite il principio di programmazione dinamica e sviluppando algoritmi di apprendimento per rinforzo, sia basati su modello che liberi da modello, per identificare strategie ottimali scalabili in spazi ad alta dimensionalità.

Jodi Dianetti, Giorgio Ferrari, Renyuan Xu2026-03-12💰 q-fin

Mamba Neural Operator: Who Wins? Transformers vs. State-Space Models for PDEs

Il paper introduce il Mamba Neural Operator (MNO), un nuovo framework che supera i limiti dei Transformer nell'analisi delle equazioni differenziali alle derivate parziali (PDE) integrando i modelli a stato strutturato (SSM) per catturare in modo più efficace le dipendenze a lungo raggio e la dinamica continua, risultando così superiore in termini di accuratezza ed efficienza.

Chun-Wun Cheng, Jiahao Huang, Yi Zhang, Guang Yang, Carola-Bibiane Schönlieb, Angelica I. Aviles-Rivero2026-03-12🤖 cs.LG

EarthquakeNPP: A Benchmark for Earthquake Forecasting with Neural Point Processes

Il paper introduce EarthquakeNPP, un nuovo benchmark che corregge le carenze dei precedenti dataset e dimostra che, nonostante i recenti progressi, i processi puntuali neurali attuali non superano ancora le prestazioni del modello ETAS classico per la previsione sismica.

Samuel Stockman, Daniel Lawson, Maximilian Werner2026-03-12🔬 physics

Losing dimensions: Geometric memorization in generative diffusion

Questo studio rivela che i modelli di diffusione non memorizzano i dati in modo improvviso, ma subiscono un collasso geometrico graduale in cui, all'aumentare della scarsità dei dati, le capacità generative si restringono progressivamente su pochi esempi, passando dalla generalizzazione alla copia puntuale attraverso un processo di "congelamento" delle variazioni.

Beatrice Achilli, Enrico Ventura, Gianluigi Silvestri, Bao Pham, Gabriel Raya, Dmitry Krotov, Carlo Lucibello, Luca Ambrogioni2026-03-12📊 stat

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

Il paper propone il metodo ibrido 3D-PIUNet, che migliora la ricostruzione delle sorgenti cerebrali EEG integrando una stima iniziale basata sulla fisica con una rete neurale 3D U-Net per affinare la soluzione, ottenendo una maggiore accuratezza spaziale rispetto ai metodi tradizionali e puramente data-driven.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi Nakajima2026-03-12⚡ eess

← Precedente Successivo →