cs.LG articoli | Gist.Science

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Questo studio dimostra che, nel contesto della previsione delle vendite al dettaglio caratterizzata da dati intermittenti e mancanti, i metodi basati su ensemble come XGBoost superano le architetture di deep learning più complesse, suggerendo che la scelta del modello debba privilegiare l'adeguatezza alle caratteristiche del problema rispetto alla sofisticazione architetturale.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Il paper presenta ReLIFT, un nuovo approccio di addestramento che alterna l'apprendimento per rinforzo (RL) al fine-tuning supervisionato online per superare i limiti del RL nel gestire domande complesse, permettendo al modello di acquisire nuove conoscenze e ragionamenti con un'efficienza dei dati superiore rispetto ai metodi esistenti.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Sequential-Parallel Duality in Prefix Scannable Models

Il paper introduce i "Prefix-Scannable Models" (PSM), una classe generalizzata di modelli neurali che unificano architetture esistenti come Mamba e Gated Linear Attention permettendo sia l'addestramento parallelo che l'inferenza sequenziale efficiente, estendendo il concetto di dualità sequenziale-parallelo anche a operatori non associativi come l'attenzione softmax.

Morris Yau, Sharut Gupta, Valerie Engelmayer, Kazuki Irie, Stefanie Jegelka, Jacob Andreas2026-03-12🤖 cs.LG

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Questo articolo offre un'analisi completa dell'evoluzione e dell'integrazione della privacy differenziale nei modelli di machine learning, spaziando dai sistemi simbolici ai grandi modelli linguistici, con l'obiettivo di promuovere lo sviluppo di sistemi di intelligenza artificiale sicuri e responsabili.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Silhouette-Driven Instance-Weighted $k$ -means

Il paper introduce K-Sil, una variante del k-means che utilizza un meccanismo di ponderazione basato sul punteggio silhouette per ridurre l'impatto di outlier e punti ambigui, ottenendo risultati superiori rispetto ai metodi tradizionali su diversi dataset reali.

Aggelos Semoglou, Aristidis Likas, John Pavlopoulos2026-03-12🤖 cs.LG

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Questo articolo introduce l'Ambiente di Apprendimento Yokai (YLE), un nuovo benchmark open-source per il coordinamento a zero-shot che supera i limiti dell'ambiente Hanabi richiedendo agli agenti di costruire un terreno comune attraverso il ragionamento su credenze dinamiche e informazioni ambigue, rivelando così che i metodi all'avanguardia falliscono nel mantenere modelli interni coerenti con partner sconosciuti.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

Order Optimal Regret Bounds for Sharpe Ratio Optimization under Thompson Sampling

Questo articolo presenta l'algoritmo \texttt{SRTS} basato sul campionamento di Thompson per l'ottimizzazione del rapporto di Sharpe in un contesto di banditi stocastici, dimostrando teoricamente che esso raggiunge un rimpianto logaritmico ottimale e superando le prestazioni degli algoritmi esistenti nelle simulazioni empiriche.

Mohammad Taha Shah, Sabrina Khurshid, Gourab Ghatak2026-03-12🤖 cs.LG

Universal Dynamics with Globally Controlled Analog Quantum Simulators

Questo lavoro stabilisce le condizioni per l'universalità dei simulatori quantistici analogici con controllo globale, dimostrando sperimentalmente su array di atomi di Rydberg come il controllo diretto ottimizzi la sintesi di Hamiltoniani efficaci complessi e la dinamica topologica.

Hong-Ye Hu, Abigail McClain Gomez, Liyuan Chen, Aaron Trowbridge, Andy J. Goldschmidt, Zachary Manchester, Frederic T. Chong, Arthur Jaffe, Susanne F. Yelin2026-03-12⚛️ quant-ph

Tensor Train Completion from Fiberwise Observations Along a Single Mode

Questo lavoro presenta un metodo rapido e deterministico basato sull'algebra lineare per completare tensori osservati tramite intere fibre lungo una singola modalità, sfruttando la struttura a "Train Tensor" per garantire il recupero dei dati senza ricorrere a ottimizzazioni numeriche complesse.

Shakir Showkat Sofi, Lieven De Lathauwer2026-03-12⚡ eess

Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems

Questo articolo presenta un metodo di soluzione trasferibile a zero-shot per problemi di controllo ottimo parametrici, basato su politiche con codificatori di funzioni che apprendono un insieme riutilizzabile di funzioni di base neurali per abilitare un adattamento efficiente e quasi ottimale a nuovi obiettivi senza necessità di ricalcolo.

Xingjian Li, Kelvin Kan, Deepanshu Verma, Krishna Kumar, Stanley Osher, Ján Drgona2026-03-12🤖 cs.LG

Global Minimizers of Sigmoid Contrastive Loss

Questo articolo analizza teoricamente i minimi globali della funzione di perdita contrastiva sigmoide, introducendo le "costellazioni" come nuova struttura combinatoria per spiegare il successo dei modelli SigLIP, il fenomeno del divario modale e l'importanza della sincronizzazione di temperatura e bias, proponendo inoltre una riparametrizzazione che migliora la dinamica di addestramento.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

Deep Learning for Clouds and Cloud Shadow Segmentation in Methane Satellite and Airborne Imaging Spectroscopy

Questo studio dimostra che i modelli di deep learning, in particolare U-Net e SCAN, superano i metodi convenzionali nel rilevamento di nuvole e ombre nelle immagini iperspettrali ad alta risoluzione delle missioni MethaneSAT e MethaneAIR, migliorando significativamente l'accuratezza del rilevamento delle emissioni di metano.

Manuel Perez-Carrasco, Maya Nasr, Sebastien Roche + 12 more2026-03-12🤖 cs.LG

Multi-modal Data Spectrum: Multi-modal Datasets are Multi-dimensional

Questo studio empirico su larga scala rivela che molti benchmark visivi esistenti, pur mirando a ridurre i pregiudizi testuali, hanno involontariamente amplificato la dipendenza dalle sole immagini, dimostrando che le attuali valutazioni non catturano adeguatamente l'interazione multimodale necessaria per un vero apprendimento multimodale.

Divyam Madaan, Varshan Muhunthan, Kyunghyun Cho, Sumit Chopra2026-03-12💬 cs.CL

Proposing a Framework for Machine Learning Adoption on Legacy Systems

Questo articolo propone un framework basato su API che disaccoppia il ciclo di vita dei modelli di machine learning dall'ambiente di produzione, consentendo alle aziende di integrare analisi avanzate tramite un'interfaccia web leggera senza richiedere aggiornamenti hardware costosi o causare interruzioni operative.

Ashiqur Rahman, Hamed Alhoori2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

Il paper propone SMoPE, un nuovo framework per l'apprendimento continuo basato su prompt che integra una struttura a Mixture of Experts sparsa per bilanciare efficienza computazionale e prestazioni, mitigando l'interferenza tra compiti attraverso l'attivazione dinamica di un sottoinsieme di "esperti prompt" condivisi.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

Il paper presenta RADAR, un framework di routing leggero e interpretabile che ottimizza il compromesso tra prestazioni e costi nei modelli di ragionamento assegnando dinamicamente le query in base alla loro difficoltà e alle capacità specifiche delle coppie modello-budget.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

Il paper presenta Composer, un framework di ricerca modulare per architetture neurali ibride che, esplorando efficientemente lo spazio di design a piccola scala e scalando i risultati, individua nuovi modelli LLM che superano Llama 3.2 riducendo la perdita di validazione e migliorando l'accuratezza e l'efficienza.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

Il paper presenta MIG-Vis, un metodo che combina autoencoder variazionali e sintesi guidata dalla mutua informazione tramite modelli di diffusione per rivelare e visualizzare gruppi neurali nel cortice temporale inferiore con selettività semantica specifica verso caratteristiche visive come la posa degli oggetti e le trasformazioni intra-classe.

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

Lo studio dimostra che nei sistemi multi-agente LLM, la comunicazione diretta è un meccanismo di coordinamento più robusto ed efficace rispetto all'apprendimento curricolare, il quale, se mal progettato, può indurre un pessimismo appreso e ridurre la cooperazione.

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Questo studio presenta la prima valutazione sistematica dell'apprendimento auto-supervisionato per la stadiazione del sonno tramite EEG indossabile, dimostrando che tale approccio supera i modelli supervisionati e quelli generici, raggiungendo accuratezza clinica con una frazione significativamente inferiore di dati etichettati.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

← Precedente Successivo →

cs.LG