cs.LG articoli | Gist.Science

Uncertainty-Aware Solar Flare Regression

Questo studio dimostra che l'applicazione della regressione quantilica conformalizzata ai modelli di deep learning per la previsione dei brillamenti solari migliora significativamente l'affidabilità delle previsioni spaziali fornendo intervalli di confidenza con copertura valida e lunghezze ottimali.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

Il paper presenta ATLAS, un framework di reinforcement finetuning che permette ai piccoli modelli linguistici di operare efficacemente in vasti ecosistemi di strumenti, trasformando il controllo del contesto e l'esecuzione in decisioni apprese e utilizzando una ricompensa basata su rubriche per superare i limiti delle risorse e avvicinarsi alle prestazioni dei modelli frontier.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

Questo studio presenta una pipeline integrata che combina generazione ad alta fedeltà e audit automatizzato tramite modelli linguistici per produrre tracciati sintetici di pazienti clinicamente coerenti e privi di rischi per la privacy, migliorando le prestazioni dei modelli downstream rispetto ai dati reali.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

Il paper introduce ProtAlign, un framework di apprendimento contrastivo che allinea le rappresentazioni delle sequenze e delle strutture proteiche in uno spazio condiviso per migliorare il recupero incrociato, le previsioni funzionali e l'interpretabilità biologica.

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

Il paper propone un framework di fusione a feedback bidirezionale che integra dati ambientali e comportamenti umani per migliorare l'accuratezza delle previsioni della qualità dell'aria interna (CO2 e PM2.5), superando i limiti dei modelli tradizionali attraverso una modellazione adattiva e stime di incertezza interpretabili.

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

Il paper propone FutureBoosting, un approccio ibrido che potenzia i modelli di regressione per la previsione dei prezzi elettrici integrandoli con caratteristiche predette da modelli fondazione temporali, ottenendo così una riduzione dell'errore superiore al 30% rispetto agli stati dell'arte.

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

Il paper propone "Safe Transformer", un approccio modulare che inserisce un bit di sicurezza esplicito e interpretabile all'interno dei modelli linguistici pre-addestrati per garantire un allineamento controllabile e trasparente, ottenendo prestazioni di sicurezza superiori rispetto ai metodi tradizionali con un fine-tuning leggero.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

Il paper presenta Orion, il primo sistema end-to-end open che bypassa CoreML per abilitare l'addestramento e l'inferenza di modelli linguistici direttamente sul Neural Engine di Apple, superando le limitazioni di compilazione tramite tecniche di patching dei pesi e ottenendo un significativo aumento della velocità di addestramento.

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

Questo lavoro propone un approccio di apprendimento per rinforzo che, grazie a una codifica delle osservazioni invariante alla densità e a un addestramento randomizzato, permette a un agente di navigare in folle dense con generalizzazione zero-shot, evitando sia il congelamento tipico dei metodi analitici sia i crash dei metodi basati sull'apprendimento tradizionali.

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

Il paper presenta PolyBlocks, un'infrastruttura di compilazione modulare basata su MLIR per framework AI e chip, che genera automaticamente codice ad alte prestazioni per nuove architetture e dimostra prestazioni competitive rispetto a Torch Inductor e XLA su GPU NVIDIA.

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

Il documento presenta Calibrated Credit Intelligence (CCI), un framework di valutazione del rischio creditizio che combina reti neurali bayesiane, gradient boosting vincolato alla parità e una strategia di fusione adattiva per garantire previsioni accurate, ben calibrate ed eque anche in presenza di cambiamenti distributivi nel tempo.

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

Il paper propone la Rank-Factorized Implicit Neural Bias (RIB), un metodo che sostituisce il bias posizionale relativo per abilitare FlashAttention nei Transformer per la super-risoluzione, permettendo di scalare le finestre di attenzione fino a 96×96 e ottenendo prestazioni superiori con tempi di addestramento e inferenza significativamente ridotti.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

Il paper presenta un framework decentralizzato efficiente per l'addestramento di modelli di diffusione eterogenei che, combinando obiettivi di training diversi (DDPM e Flow Matching) e un'architettura ottimizzata, riduce drasticamente i requisiti computazionali e di dati rispetto alle approcci precedenti mantenendo o migliorando la qualità e la diversità dei risultati.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

Il paper propone un framework di generazione vincolata che, tramite il fine-tuning di modelli generativi preaddestrati, permette di produrre campioni realistici all'interno di regioni fattibili complesse e non lineari, come quelle tipiche della guida autonoma e del controllo robotico, trovando un nuovo compromesso tra soddisfazione dei vincoli e qualità del campionamento.

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

Il paper propone StableDRL, un nuovo algoritmo di ottimizzazione della politica che risolve il collasso del reward nei modelli linguistici a diffusione applicando tecniche di clipping incondizionato e auto-normalizzazione per stabilizzare l'addestramento basato su GRPO.

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

Il paper introduce DIRECTER, un metodo di steering delle attivazioni che migliora il rispetto delle istruzioni nei LLM modulando dinamicamente la forza di steering tramite un ciclo di decodifica guidato dalla plausibilità, riducendo così il rischio di oversteering senza compromettere la qualità del testo.

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

Il paper presenta ProtAlign, un framework di allineamento delle preferenze multi-obiettivo che ottimizza i modelli di ripiegamento inverso pre-addestrati per bilanciare la progettabilità strutturale con proprietà di sviluppabilità come solubilità e stabilità, superando i limiti degli approcci esistenti senza richiedere un'esperta conoscenza di dominio.

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Latent Autoencoder Ensemble Kalman Filter for Data assimilation

Il documento propone il LAE-EnKF, un nuovo filtro di Kalman basato su autoencoder latenti che riformula l'assimilazione dei dati in uno spazio latente a dinamica lineare e stabile, superando i limiti di non linearità del filtro di Kalman standard e garantendo maggiore accuratezza e stabilità nei sistemi caotici.

Xin T. Tong, Yanyan Wang, Liang Yan2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

Il paper propone un autoencoder e un variational autoencoder basati su rappresentazioni neurali implicite quantistiche (QINR) che, combinando un codificatore CNN classico con un decodificatore quantistico, migliorano la ricostruzione e la generazione di immagini con maggiore stabilità, diversità e dettaglio rispetto ai modelli generativi quantistici esistenti.

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

Il documento presenta l'approccio ICD3, un metodo interpretabile e robusto che rileva il drift concettuale nei dati sbilanciati identificando e monitorando indipendentemente i concetti minoritari per superare l'effetto di mascheramento causato dalle classi dominanti.

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

← Precedente Successivo →