Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Questo studio dimostra che, nel contesto della previsione delle vendite al dettaglio caratterizzata da dati intermittenti e mancanti, i metodi basati su ensemble come XGBoost superano le architetture di deep learning più complesse, suggerendo che la scelta del modello debba privilegiare l'adeguatezza alle caratteristiche del problema rispetto alla sofisticazione architetturale.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Il paper presenta ReLIFT, un nuovo approccio di addestramento che alterna l'apprendimento per rinforzo (RL) al fine-tuning supervisionato online per superare i limiti del RL nel gestire domande complesse, permettendo al modello di acquisire nuove conoscenze e ragionamenti con un'efficienza dei dati superiore rispetto ai metodi esistenti.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

Il paper introduce i "Prefix-Scannable Models" (PSM), una classe generalizzata di modelli neurali che unificano architetture esistenti come Mamba e Gated Linear Attention permettendo sia l'addestramento parallelo che l'inferenza sequenziale efficiente, estendendo il concetto di dualità sequenziale-parallelo anche a operatori non associativi come l'attenzione softmax.

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Questo articolo introduce l'Ambiente di Apprendimento Yokai (YLE), un nuovo benchmark open-source per il coordinamento a zero-shot che supera i limiti dell'ambiente Hanabi richiedendo agli agenti di costruire un terreno comune attraverso il ragionamento su credenze dinamiche e informazioni ambigue, rivelando così che i metodi all'avanguardia falliscono nel mantenere modelli interni coerenti con partner sconosciuti.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Questo lavoro stabilisce le condizioni per l'universalità dei simulatori quantistici analogici con controllo globale, dimostrando sperimentalmente su array di atomi di Rydberg come il controllo diretto ottimizzi la sintesi di Hamiltoniani efficaci complessi e la dinamica topologica.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Questo articolo presenta un metodo di soluzione trasferibile a zero-shot per problemi di controllo ottimo parametrici, basato su politiche con codificatori di funzioni che apprendono un insieme riutilizzabile di funzioni di base neurali per abilitare un adattamento efficiente e quasi ottimale a nuovi obiettivi senza necessità di ricalcolo.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Questo articolo analizza teoricamente i minimi globali della funzione di perdita contrastiva sigmoide, introducendo le "costellazioni" come nuova struttura combinatoria per spiegare il successo dei modelli SigLIP, il fenomeno del divario modale e l'importanza della sincronizzazione di temperatura e bias, proponendo inoltre una riparametrizzazione che migliora la dinamica di addestramento.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Questo studio dimostra che i modelli di deep learning, in particolare U-Net e SCAN, superano i metodi convenzionali nel rilevamento di nuvole e ombre nelle immagini iperspettrali ad alta risoluzione delle missioni MethaneSAT e MethaneAIR, migliorando significativamente l'accuratezza del rilevamento delle emissioni di metano.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Composer: A Search Framework for Hybrid Neural Architecture Design

Il paper presenta Composer, un framework di ricerca modulare per architetture neurali ibride che, esplorando efficientemente lo spazio di design a piccola scala e scalando i risultati, individua nuovi modelli LLM che superano Llama 3.2 riducendo la perdita di validazione e migliorando l'accuratezza e l'efficienza.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

Il paper presenta MIG-Vis, un metodo che combina autoencoder variazionali e sintesi guidata dalla mutua informazione tramite modelli di diffusione per rivelare e visualizzare gruppi neurali nel cortice temporale inferiore con selettività semantica specifica verso caratteristiche visive come la posa degli oggetti e le trasformazioni intra-classe.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Questo studio presenta la prima valutazione sistematica dell'apprendimento auto-supervisionato per la stadiazione del sonno tramite EEG indossabile, dimostrando che tale approccio supera i modelli supervisionati e quelli generici, raggiungendo accuratezza clinica con una frazione significativamente inferiore di dati etichettati.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI