Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Questo articolo propone un nuovo framework di previsione della resa delle colture a livello di contea che combina un modello multi-scala per catturare le dinamiche temporali con una strategia di adattamento basata sul recupero dei dati, dimostrando prestazioni superiori nella previsione dei raccolti di mais su vasta scala negli Stati Uniti.

Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

StructSAM: Structure- and Spectrum-Preserving Token Merging for Segment Anything Models

Il paper introduce StructSAM, un framework di fusione e recupero dei token che preserva struttura e spettro per ottimizzare i Segment Anything Models (SAM) riducendo significativamente i costi computazionali senza compromettere la precisione dei contorni nelle applicazioni naturali e mediche.

Duy M. H. Nguyen, Tuan A. Tran, Duong Nguyen, Siwei Xie, Trung Q. Nguyen, Mai T. N. Truong, Daniel Palenicek, An T. Le, Michael Barz, TrungTin Nguyen, Tuan Dam, Ngan Le, Minh Vu, Khoa Doan, Vien Ngo, Pengtao Xie, James Zou, Daniel Sonntag, Jan Peters, Mathias Niepert2026-03-10🤖 cs.LG

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

Il paper introduce il framework Norm-Hierarchy Transition (NHT), che spiega come le reti neurali abbandonino le scorciatoie spurie per adottare rappresentazioni strutturate attraverso una lenta transizione gerarchica delle norme dei parametri durante l'ottimizzazione regolarizzata, un meccanismo unificante che predice i tempi di tale transizione e spiega fenomeni come il "grokking".

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

Explainable and Hardware-Efficient Jamming Detection for 5G Networks Using the Convolutional Tsetlin Machine

Questo articolo presenta un metodo di rilevamento del jamming per le reti 5G basato sulla Convolutional Tsetlin Machine (CTM), che offre un'alternativa efficiente in termini di risorse, interpretabile e adatta all'hardware rispetto alle reti neurali convoluzionali, garantendo prestazioni comparabili con tempi di addestramento ridotti e un minore consumo di memoria su dispositivi edge.

Vojtech Halenka, Mohammadreza Amini, Per-Arne Andersen, Ole-Christoffer Granmo, Burak Kantarci2026-03-10🤖 cs.LG

A Distributed Gaussian Process Model for Multi-Robot Mapping

Il paper propone DistGP, un metodo di apprendimento multi-robot distribuito basato su un processo gaussiano sparso che, grazie alla propagazione delle credenze gaussiane, permette un addestramento asincrono e online con prestazioni superiori rispetto alle GP ad albero e ai ottimizzatori di reti neurali distribuite, pur raggiungendo la stessa accuratezza di un modello centralizzato.

Seth Nabarro, Mark van der Wilk, Andrew J. Davison2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Il paper presenta la AgrI Challenge, una competizione incentrata sui dati che introduce la validazione cross-team per valutare la generalizzazione dei modelli di visione artificiale agricola, dimostrando che l'addestramento collaborativo su dataset raccolti indipendentemente riduce drasticamente il divario di prestazione rispetto all'addestramento su singola fonte.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Questo articolo presenta prior generativi a complessità regolabile, basati su tecniche come il nested dropout, che superano i modelli a complessità fissa nella risoluzione di problemi inversi come il compressed sensing, riducendo l'errore di ricostruzione e fornendo un'analisi teorica del parametro di ottimizzazione.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Questo studio rivela che nel regime dei modelli piccoli (sotto i 20M di parametri), le leggi di scalatura seguono pendenze più ripide rispetto ai modelli grandi ma mostrano una saturazione rapida e un cambiamento qualitativo nella struttura degli errori, rendendo le metriche aggregate fuorvianti e sottolineando la necessità di convalidare le prestazioni direttamente alla dimensione target per le applicazioni edge.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Questo articolo propone un framework di apprendimento per rinforzo multi-agente gerarchico (HMARL) che, eliminando la necessità di stime dello stato del canale (CSI) sfruttando invece i dati di localizzazione degli utenti, ottimizza il focalizzazione dei fasci nelle reti mmWave con superfici riflettenti riconfigurabili, ottenendo significativi miglioramenti del segnale RSSI e garantendo scalabilità e robustezza in ambienti complessi.

Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Questo studio presenta un approccio di stima della qualità per la traduzione automatica dall'inglese alle lingue indiane in scenari a risorse limitate, dimostrando che l'adattamento degli strati intermedi tramite tecniche come ALOPE e LoRMA supera i limiti dei metodi basati esclusivamente sul prompting, specialmente nei domini ad alto rischio.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG