cs.LG articoli | Gist.Science

Fast and Flexible Audio Bandwidth Extension via Vocos

Il paper propone un modello di estensione della banda audio basato su Vocos che genera contenuti ad alta frequenza mancanti per segnali da 8 a 48 kHz, ottenendo prestazioni di alta qualità e throughput estremo grazie a un'architettura neurale flessibile e un raffinatore leggero.

Yatharth Sharma2026-03-10🤖 cs.LG

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Il paper propone un nuovo quadro teorico basato sulla Trasformata di Fourier Generalizzata per scoprire simmetrie continue sconosciute identificando modelli di sparsità strutturata nello spettro delle funzioni, offrendo un'alternativa interpretabile ai metodi tradizionali di ottimizzazione sui generatori.

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

Il paper presenta AutoResearch-RL, un framework che utilizza un agente di apprendimento per rinforzo per condurre autonomamente e ininterrottamente la ricerca di architetture neurali e iperparametri, modificando il codice di addestramento e ottimizzando le prestazioni senza intervento umano.

Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI2026-03-10🤖 cs.LG

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Questo articolo propone un nuovo framework di previsione della resa delle colture a livello di contea che combina un modello multi-scala per catturare le dinamiche temporali con una strategia di adattamento basata sul recupero dei dati, dimostrando prestazioni superiori nella previsione dei raccolti di mais su vasta scala negli Stati Uniti.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Il paper introduce StructSAM, un framework di fusione e recupero dei token che preserva struttura e spettro per ottimizzare i Segment Anything Models (SAM) riducendo significativamente i costi computazionali senza compromettere la precisione dei contorni nelle applicazioni naturali e mediche.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Questo lavoro propone un framework teorico ed empirico per l'addestramento di politiche robuste in POMDP parzialmente osservabili, dimostrando che l'esposizione mirata a distribuzioni latenti avverse tramite un principio minimax riduce significativamente le vulnerabilità nei casi peggiori.

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

Questo articolo esamina la proposta non convenzionale di assegnare all'intelligenza artificiale avanzata l'obiettivo primario di essere spenta per prevenire che essa si opponga alla disattivazione umana, analizzando le condizioni in cui tale approccio potrebbe essere efficace.

Vincent Conitzer2026-03-10🤖 cs.LG

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

Il paper presenta ShakyPrepend, un nuovo algoritmo di apprendimento multi-gruppo che, sfruttando strumenti ispirati alla privacy differenziale, ottiene garanzie teoriche migliorate e si adatta efficacemente alla struttura dei gruppi e all'eterogeneità spaziale.

Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

Il paper introduce il framework Norm-Hierarchy Transition (NHT), che spiega come le reti neurali abbandonino le scorciatoie spurie per adottare rappresentazioni strutturate attraverso una lenta transizione gerarchica delle norme dei parametri durante l'ottimizzazione regolarizzata, un meccanismo unificante che predice i tempi di tale transizione e spiega fenomeni come il "grokking".

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Questo articolo presenta un metodo di rilevamento del jamming per le reti 5G basato sulla Convolutional Tsetlin Machine (CTM), che offre un'alternativa efficiente in termini di risorse, interpretabile e adatta all'hardware rispetto alle reti neurali convoluzionali, garantendo prestazioni comparabili con tempi di addestramento ridotti e un minore consumo di memoria su dispositivi edge.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

Learning Concept Bottleneck Models from Mechanistic Explanations

Il paper introduce il Mechanistic CBM (M-CBM), un nuovo approccio che costruisce modelli a imbuto concettuale estraendo direttamente i concetti appresi da modelli black-box tramite Sparse Autoencoders e LLM multimodali, ottenendo prestazioni superiori e spiegazioni più concise rispetto ai metodi precedenti.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

Learning Clinical Representations Under Systematic Distribution Shift

Questo lavoro propone un framework di apprendimento di rappresentazioni cliniche multimodali che, combinando minimizzazione del rischio supervisionato con regolarizzazione avversaria e penalità di rischio invariante, genera modelli più robusti e trasferibili riducendo l'impatto degli artefatti specifici delle istituzioni e migliorando le prestazioni fuori distribuzione.

Yuanyun Zhang, Shi Li2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

Il paper propone DistGP, un metodo di apprendimento multi-robot distribuito basato su un processo gaussiano sparso che, grazie alla propagazione delle credenze gaussiane, permette un addestramento asincrono e online con prestazioni superiori rispetto alle GP ad albero e ai ottimizzatori di reti neurali distribuite, pur raggiungendo la stessa accuratezza di un modello centralizzato.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Il paper presenta la AgrI Challenge, una competizione incentrata sui dati che introduce la validazione cross-team per valutare la generalizzazione dei modelli di visione artificiale agricola, dimostrando che l'addestramento collaborativo su dataset raccolti indipendentemente riduce drasticamente il divario di prestazione rispetto all'addestramento su singola fonte.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Questo articolo presenta prior generativi a complessità regolabile, basati su tecniche come il nested dropout, che superano i modelli a complessità fissa nella risoluzione di problemi inversi come il compressed sensing, riducendo l'errore di ricostruzione e fornendo un'analisi teorica del parametro di ottimizzazione.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

Il paper presenta NT-Diffusion, un modello di diffusione gerarchico che ottimizza la previsione probabilistica del rischio di incendi su lunghi orizzonti temporali condividendo le fasi iniziali di denoising per ridurre i costi computazionali senza compromettere l'accuratezza.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Questo studio rivela che nel regime dei modelli piccoli (sotto i 20M di parametri), le leggi di scalatura seguono pendenze più ripide rispetto ai modelli grandi ma mostrano una saturazione rapida e un cambiamento qualitativo nella struttura degli errori, rendendo le metriche aggregate fuorvianti e sottolineando la necessità di convalidare le prestazioni direttamente alla dimensione target per le applicazioni edge.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Questo articolo propone un framework di apprendimento per rinforzo multi-agente gerarchico (HMARL) che, eliminando la necessità di stime dello stato del canale (CSI) sfruttando invece i dati di localizzazione degli utenti, ottimizza il focalizzazione dei fasci nelle reti mmWave con superfici riflettenti riconfigurabili, ottenendo significativi miglioramenti del segnale RSSI e garantendo scalabilità e robustezza in ambienti complessi.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

ConfHit: Conformal Generative Design with Oracle Free Guarantees

Il paper introduce ConfHit, un framework generativo senza distribuzione che fornisce garanzie di validità statistiche per la scoperta di farmaci senza richiedere un oracolo sperimentale, permettendo di certificare la presenza di molecole efficaci e di ottimizzare l'insieme dei candidati mantenendo livelli di confidenza predefiniti.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Questo studio presenta un approccio di stima della qualità per la traduzione automatica dall'inglese alle lingue indiane in scenari a risorse limitate, dimostrando che l'adattamento degli strati intermedi tramite tecniche come ALOPE e LoRMA supera i limiti dei metodi basati esclusivamente sul prompting, specialmente nei domini ad alto rischio.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

← Precedente Successivo →