cs.LG articoli | Gist.Science

ms-Mamba: Multi-scale Mamba for Time-Series Forecasting

Il paper presenta ms-Mamba, una nuova architettura basata su Mamba che utilizza multipli blocchi con diversi tassi di campionamento per catturare scale temporali multiple, ottenendo prestazioni superiori rispetto agli stati dell'arte su diverse metriche e dataset con un'efficienza computazionale e parametrica ridotta.

Yusuf Meric Karadag, Ismail Talaz, Ipek Gursel Dino + 1 more2026-03-06💻 cs

TianQuan-S2S: A Subseasonal-to-Seasonal Global Weather Model via Incorporate Climatology State

Il paper presenta TianQuan-S2S, un modello globale di previsione meteorologica da substagionale a stagionale che integra stati climatici e un Transformer aumentato dall'incertezza per superare i limiti delle metodologie attuali, ottenendo prestazioni superiori rispetto ai modelli numerici e data-driven esistenti.

Guowen Li, Xintong Liu, Yang Liu + 11 more2026-03-06💻 cs

Noise2Ghost: Self-supervised deep convolutional reconstruction for ghost imaging

Il paper presenta Noise2Ghost, un nuovo metodo di ricostruzione per l'imaging fantasma basato su deep learning auto-supervisionato che elimina la necessità di dati di riferimento puliti, offrendo una riduzione del rumore superiore e permettendo applicazioni in scenari a bassa luminosità come l'imaging a raggi X di campioni sensibili.

Mathieu Manni, Dmitry Karpov, K. Joost Batenburg + 2 more2026-03-06🔬 physics

Differentially Private and Scalable Estimation of the Network Principal Component

Il paper propone un nuovo framework Differentially Private basato su Propose-Test-Release che, garantendo la privacy per tutti i dataset, offre un'estimazione scalabile e ad alta accuratezza della componente principale di grafi reali, superando i limiti di complessità e precisione degli algoritmi esistenti e abilitando per la prima volta la risoluzione privata del problema del Densest-k-subgraph.

Alireza Khayatian, Anil Vullikanti, Aritra Konar2026-03-06💻 cs

Variational Formulation of Particle Flow

Questo articolo presenta una formulazione variazionale del flusso delle particelle log-omotopico, dimostrando che la densità transiente segue un gradiente di Fisher-Rao e derivando flussi approssimati Gaussiani e a miscela che, in casi specifici, si riducono al flusso esatto di Daum e Huang o ne migliorano l'espressività.

Yinzhuang Yi, Jorge Cortés, Nikolay Atanasov2026-03-06💻 cs

ReactDance: Hierarchical Representation for High-Fidelity and Coherent Long-Form Reactive Dance Generation

Il paper presenta ReactDance, un framework di diffusione basato su uno spazio latente gerarchico che utilizza la quantizzazione scalare finita gerarchica (HFSQ) e una strategia di campionamento contestuale locale a blocchi (BLC) per generare danze reattive a lungo termine ad alta fedeltà e coerenti.

Jingzhong Lin, Xinru Li, Yuanyuan Qi + 8 more2026-03-06💻 cs

Learning Virtual Machine Scheduling in Cloud Computing through Language Agents

Il paper presenta MiCo, un framework gerarchico basato su agenti linguistici che utilizza modelli di linguaggio di grandi dimensioni per progettare euristiche adattive, risolvendo in modo efficace ed interpretabile il complesso problema di scheduling delle macchine virtuali nel cloud computing.

JieHao Wu, Ziwei Wang, Junjie Sheng + 3 more2026-03-06💻 cs

Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference

Il paper introduce CausalPitfalls, un benchmark completo progettato per valutare rigorosamente le capacità di ragionamento causale statistico dei modelli linguistici di grandi dimensioni, evidenziando le loro attuali limitazioni nel superare errori comuni come la paradosso di Simpson e il bias di selezione.

Jin Du, Li Chen, Xun Xian + 6 more2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

Il paper presenta ShIOEnv, un ambiente Bash basato su Gymnasium che, sfruttando la sintesi vincolata alla grammatica e un segnale di irreducibilità auto-supervisionato, genera un dataset di 2,1 milioni di coppie input-output per migliorare l'accuratezza dei modelli nel prevedere il comportamento di esecuzione dei comandi rispetto alle basi di riferimento senza esecuzione.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

Il paper presenta VTool-R1, un framework pionieristico che addestra i modelli visione-linguaggio a generare catene di pensiero multimodali intercalando testo e passaggi visivi intermedi tramite l'uso strategico di strumenti di editing grafico e apprendimento per rinforzo, migliorando così le capacità di ragionamento su dati strutturati come grafici e tabelle.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

Attribute-Efficient PAC Learning of Sparse Halfspaces with Constant Malicious Noise Rate

Questo articolo presenta un algoritmo di apprendimento PAC efficiente in termini di attributi per iperpiani sparsi, che rimane robusto a un tasso costante di rumore malevolo grazie a una nuova analisi del gradiente applicata alla minimizzazione della perdita hinge.

Shiwei Zeng, Jie Shen2026-03-06💻 cs

Highly Efficient and Effective LLMs with Multi-Boolean Architectures

Il documento propone un nuovo framework che rappresenta i modelli linguistici su larga scala con parametri booleani multi-nucleo, permettendo per la prima volta un adattamento diretto nel dominio booleano senza pesi latenti a precisione intera, ottenendo così una maggiore capacità rappresentativa e una drastica riduzione della complessità rispetto alle tecniche di quantizzazione esistenti.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs

Continuous Chain of Thought Enables Parallel Exploration and Reasoning

Questo lavoro introduce il Chain of Thought a token continui (CoT2), un approccio che permette l'esplorazione parallela di più tracce di ragionamento, offrendo garanzie teoriche e strategie di supervisione che migliorano l'efficienza inferenziale e le prestazioni su compiti logici complessi rispetto ai metodi autoregressivi discreti tradizionali.

Halil Alperen Gozeten, M. Emrullah Ildiz, Xuechen Zhang + 3 more2026-03-06💻 cs

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

Il paper introduce SealQA, un nuovo benchmark che valuta le capacità di ragionamento e accuratezza fattuale dei modelli linguistici potenziati dalla ricerca web, rivelando che anche i modelli più avanzati faticano a gestire risultati di ricerca conflittuali, rumorosi o contesti lunghi.

Thinh Pham, Nguyen Nguyen, Pratibha Zunjare + 3 more2026-03-06💻 cs

FPGA-Enabled Machine Learning Applications in Earth Observation: A Systematic Review

Questa revisione sistematica analizza 68 esperimenti sull'impiego di modelli di Machine Learning su FPGA per l'osservazione della Terra, proponendo due tassonomie distinte per ottimizzare architetture e strategie di implementazione nel contesto delle nuove tecnologie UAV e NewSpace.

Cédric Léonard, Dirk Stober, Martin Schulz2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

Il paper introduce HSG-12M, un dataset su larga scala di 16,7 milioni di grafi multigrafo spaziali derivati dagli spettri energetici di cristalli non hermitiani, generato tramite il nuovo strumento automatizzato Poly2Graph per colmare il divario tra fisica della materia condensata e apprendimento automatico geometrico.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

Il paper introduce EDINET-Bench, un benchmark open-source giapponese basato su dieci anni di relazioni annuali per valutare le capacità di ragionamento esperto dei modelli linguistici su compiti finanziari complessi come il rilevamento delle frodi, dimostrando che gli attuali LLM faticano a superare le prestazioni di modelli statistici semplici e sottolineando la necessità di framework di valutazione più strutturati che simulino l'ambiente professionale reale.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

SPEED-RL: Faster Training of Reasoning Models via Online Curriculum Learning

Il paper introduce SPEED-RL, un metodo di apprendimento curricolare online adattivo che accelera l'addestramento dei modelli di ragionamento basati sul reinforcement learning selezionando dinamicamente prompt di difficoltà intermedia, ottenendo un'efficienza computazionale fino a 6 volte superiore senza compromettere l'accuratezza.

Ruiqi Zhang, Daman Arora, Song Mei + 1 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

Questo articolo introduce BWFlow, un framework di flow matching per la generazione di grafi che supera le limitazioni delle interpolazioni lineari tradizionali modellando l'evoluzione congiunta di nodi e archi attraverso campi casuali di Markov e il trasporto ottimo di Wasserstein, garantendo così percorsi probabilistici più lisci, una convergenza di addestramento migliorata e un campionamento efficiente.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs

From Bandit Regret to FDR Control: Online Selective Generation with Adversarial Feedback Unlocking

Il paper propone ExSUL, un nuovo framework di apprendimento online per la generazione selettiva che, sfruttando un feedback avversario parziale e tecniche di "sblocco del feedback", garantisce un controllo del FDR e una bassa regret per sistemi generativi interattivi come gli LLM in ambienti non stazionari.

Minjae Lee, Yoonjae Jung, Sangdon Park2026-03-06💻 cs

← Precedente Successivo →