VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

Il paper introduce VisualScratchpad, un'interfaccia interattiva che utilizza autoencoder sparsi e mappe di attenzione per analizzare i concetti visivi nei modelli visione-linguaggio durante l'inferenza, rivelando modalità di fallimento precedentemente poco esplorate come l'allineamento cross-modale limitato e l'uso di concetti visivi fuorvianti.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

Il paper presenta "Agora", una piattaforma basata sull'intelligenza artificiale che utilizza voci umane autentiche per insegnare la capacità di trovare consenso su questioni politiche, dimostrando in uno studio preliminare che l'accesso a spiegazioni vocali migliora le abilità di problem solving e la qualità delle dichiarazioni di consenso rispetto alla sola visualizzazione di dati aggregati.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

Il paper presenta la AgrI Challenge, una competizione incentrata sui dati che introduce la validazione cross-team per valutare la generalizzazione dei modelli di visione artificiale agricola, dimostrando che l'addestramento collaborativo su dataset raccolti indipendentemente riduce drasticamente il divario di prestazione rispetto all'addestramento su singola fonte.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Questo articolo presenta prior generativi a complessità regolabile, basati su tecniche come il nested dropout, che superano i modelli a complessità fissa nella risoluzione di problemi inversi come il compressed sensing, riducendo l'errore di ricostruzione e fornendo un'analisi teorica del parametro di ottimizzazione.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Questo studio rivela che nel regime dei modelli piccoli (sotto i 20M di parametri), le leggi di scalatura seguono pendenze più ripide rispetto ai modelli grandi ma mostrano una saturazione rapida e un cambiamento qualitativo nella struttura degli errori, rendendo le metriche aggregate fuorvianti e sottolineando la necessità di convalidare le prestazioni direttamente alla dimensione target per le applicazioni edge.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

Questo documento di posizione sostiene che la mitigazione dei pregiudizi nei grandi modelli linguistici richieda un approccio duale che integri trasformazioni matematiche basate sulla teoria delle categorie (functor) per preservare l'integrità semantica e la generazione aumentata dal recupero (RAG) per iniettare conoscenze esterne diversificate, garantendo così risultati equi e privi di stereotipi.

Ravi Ranjan, Utkarsh Grover, Agorista Polyzou2026-03-10💬 cs.CL

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Questo studio presenta un approccio di stima della qualità per la traduzione automatica dall'inglese alle lingue indiane in scenari a risorse limitate, dimostrando che l'adattamento degli strati intermedi tramite tecniche come ALOPE e LoRMA supera i limiti dei metodi basati esclusivamente sul prompting, specialmente nei domini ad alto rischio.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Il paper presenta UnSCAR, un nuovo paradigma di ripristino delle immagini universale che, grazie a un'architettura a miscela di esperti multi-ramo, risolve i problemi di instabilità e dimenticanza delle conoscenze nell'apprendimento congiunto, consentendo un adattamento scalabile, controllabile e robusto a oltre sedici degradazioni e a domini non visti.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Questo articolo di revisione analizza come l'apprendimento automatico, supportato da un'analisi di 300 studi, superi le limitazioni delle comunicazioni sottomarine attraverso ottimizzazioni a tutti i livelli di rete, migliorando significativamente l'efficienza energetica, il throughput e l'accuratezza delle applicazioni nell'Internet delle Cose Sottomarine (IoUT).

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Questo articolo presenta un nuovo approccio computazionale per il problema di instradamento dinamico dei veicoli che integra una conferma immediata delle prenotazioni anticipate con un'ottimizzazione continua, utilizzando l'apprendimento per rinforzo per massimizzare il numero di richieste soddisfatte su dati reali di un'agenzia di trasporto pubblico statunitense.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs