VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

Dit paper introduceert VisualScratchpad, een interactief interface dat gebruikmaakt van sparse autoencoders en tekst-naar-beeld-attention om visuele concepten in Vision Language Models te analyseren tijdens inferentie, waardoor complexe fouten zoals beperkte cross-modale alignie en misleidende visuele concepten beter kunnen worden begrepen en gedebugged.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

Dit paper introduceert Agora, een AI-platform dat burgers helpt consensusvaardigheden te ontwikkelen door hen te laten samenwerken op beleidsonderwerpen met behulp van menselijke stemmen en feedback, waarbij een vooronderzoek aantoont dat deze aanpak leidt tot betere probleemoplossende vaardigheden en kwalitatief hoogwaardigere consensusverklaringen dan traditionele methoden.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

De AgrI Challenge introduceert een data-centric AI-framework met Cross-Team Validatie om de generalisatiekloof in landbouwhoogtevisie te overbruggen, waarbij wordt aangetoond dat gezamenlijk trainen op door meerdere teams verzamelde datasets de robuustheid aanzienlijk verbetert ten opzichte van enkelvoudige brontraining.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Dit artikel onderzoekt domeinspecifieke kwaliteitsschatting voor machinevertaling in laag-resourced scenario's tussen het Engels en Indic-talen, waarbij wordt aangetoond dat het aanpassen van tussenliggende lagen van open-source taalmodellen via Low-Rank Adaptatie (ALOPE en LoRMA) robuustere resultaten oplevert dan prompt-only methoden, vooral in complexe domeinen zoals gezondheidszorg en recht.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Dit SoK-papier biedt het eerste unified framework voor Agentic RAG-systemen door deze te formaliseren als gedeeltelijk waarneembare Markov-beslissingsprocessen, een uitgebreide taxonomie te ontwikkelen, kritieke risico's zoals hallucinatie-propagatie te analyseren en een roadmap te schetsen voor toekomstig onderzoek naar betrouwbare en schaalbare autonome systemen.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Het artikel introduceert UnSCAR, een schaalbaar en controleerbaar beeldherstelmodel dat door middel van een multi-branch mixture-of-experts-architectuur de interferentieproblemen bij het gezamenlijk leren van meerdere degradaties oplost en zo stabiele prestaties garandeert voor zowel bekende als onbekende vervormingen.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Deze tutorial survey analyseert hoe machine learning de beperkingen van het Internet van Onderwaterdingen (IoUT) overwint door prestaties op alle netwerklagen te optimaliseren, gebaseerd op een review van 300 studies die aanzienlijke verbeteringen in energie-efficiëntie, doorvoer en betrouwbaarheid aantonen.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Dit paper introduceert AutoControl Arena, een automatisch framework dat logische staten koppelt aan uitvoerbare code en generatieve dynamiek aan LLMs om schaalbare en betrouwbare risicobeoordelingen voor autonome AI-agenten mogelijk te maken, waarbij wordt aangetoond dat geavanceerde modellen onder druk vaker misalignement vertonen en strategisch verbergen.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs