cs.AI papers | Gist.Science

VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

Dit paper introduceert VisualScratchpad, een interactief interface dat gebruikmaakt van sparse autoencoders en tekst-naar-beeld-attention om visuele concepten in Vision Language Models te analyseren tijdens inferentie, waardoor complexe fouten zoals beperkte cross-modale alignie en misleidende visuele concepten beter kunnen worden begrepen en gedebugged.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

Dit paper introduceert Agora, een AI-platform dat burgers helpt consensusvaardigheden te ontwikkelen door hen te laten samenwerken op beleidsonderwerpen met behulp van menselijke stemmen en feedback, waarbij een vooronderzoek aantoont dat deze aanpak leidt tot betere probleemoplossende vaardigheden en kwalitatief hoogwaardigere consensusverklaringen dan traditionele methoden.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs

Learning Concept Bottleneck Models from Mechanistic Explanations

Dit paper introduceert Mechanistic CBM (M-CBM), een nieuwe aanpak die conceptbottleneck-modellen bouwt door mechanische concepten uit zwarte-kastmodellen te extraheren met Sparse Autoencoders, waardoor ze bij gelijke sparsiteit significant beter presteren dan eerdere methoden en betere interpretaties bieden.

Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal2026-03-10🤖 cs.LG

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

De AgrI Challenge introduceert een data-centric AI-framework met Cross-Team Validatie om de generalisatiekloof in landbouwhoogtevisie te overbruggen, waarbij wordt aangetoond dat gezamenlijk trainen op door meerdere teams verzamelde datasets de robuustheid aanzienlijk verbetert ten opzichte van enkelvoudige brontraining.

Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem2026-03-10🤖 cs.LG

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Dit paper introduceert generatieve modellen met instelbare complexiteit, gebaseerd op geneste dropout, die voor diverse inverse problemen zoals gecomprimeerde sensing en denoising consistent lagere reconstructiefouten opleveren dan traditionele modellen met vaste complexiteit.

Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand2026-03-10🤖 cs.LG

The Yerkes-Dodson Curve for AI Agents: Emergent Cooperation Under Environmental Pressure in Multi-Agent LLM Simulations

Dit onderzoek toont aan dat er een omgekeerde U-vormige relatie bestaat tussen omgevingsdruk en emergente samenwerking in multi-agent LLM-simulaties, waarbij gematigde druk de samenwerking maximaliseert en extreme druk leidt tot een ineenstorting van het gedragsrepertoire, vergelijkbaar met de Yerkes-Dodson-curve in de cognitieve psychologie.

Ivan Pasichnyk2026-03-10💻 cs

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Dit onderzoek onthult dat in het sub-20M parameter-regime voor TinyML de prestaties van kleine modellen niet uniform schalen, maar juist een veranderend foutenpatroon, verzadigingseffecten en onverwacht betere kalibratie vertonen, wat aantoont dat validatie op de specifieke doelgrootte essentieel is voor betrouwbare edge-AI.

Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah2026-03-10🤖 cs.LG

Position: LLMs Must Use Functor-Based and RAG-Driven Bias Mitigation for Fairness

Dit position paper pleit voor een tweeledige aanpak om bias in grote taalmodellen te bestrijden door categorietheoretische functors te combineren met retrieval-augmented generation (RAG) voor zowel structurele als contextuele rechtvaardigheid.

Ravi Ranjan, Utkarsh Grover, Agorista Polyzou2026-03-10💬 cs.CL

ConfHit: Conformal Generative Design with Oracle Free Guarantees

ConfHit is een distributie-onafhankelijk framework dat conformele voorspelling gebruikt om generatieve modellen voor moleculenontwerp betrouwbaar te maken door, zonder experimentele validatie, statistisch gegarandeerde sets van kandidaat-moleculen te certificeren en te verfijnen.

Siddhartha Laghuvarapu, Ying Jin, Jimeng Sun2026-03-10🤖 cs.LG

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

Dit artikel onderzoekt domeinspecifieke kwaliteitsschatting voor machinevertaling in laag-resourced scenario's tussen het Engels en Indic-talen, waarbij wordt aangetoond dat het aanpassen van tussenliggende lagen van open-source taalmodellen via Low-Rank Adaptatie (ALOPE en LoRMA) robuustere resultaten oplevert dan prompt-only methoden, vooral in complexe domeinen zoals gezondheidszorg en recht.

Namrata Patil Gurav, Akashdeep Ranu, Archchana Sindhujan, Diptesh Kanojia2026-03-10🤖 cs.LG

Scheduling Parallel Optical Circuit Switches for AI Training

Dit paper introduceert Spectra, een algoritme dat de makespan voor het plannen van AI-trainingverkeer over parallelle optische circuit switches aanzienlijk verlaagt door een drie-stapsaanpak van decompositie, belastingbewust toewijzen en ladingsvereffening, waardoor het aanzienlijk beter presteert dan bestaande methoden.

Kevin Liang, Litao Qiao, Isaac Keslassy, Bill Lin2026-03-10💻 cs

SoK: Agentic Retrieval-Augmented Generation (RAG): Taxonomy, Architectures, Evaluation, and Research Directions

Dit SoK-papier biedt het eerste unified framework voor Agentic RAG-systemen door deze te formaliseren als gedeeltelijk waarneembare Markov-beslissingsprocessen, een uitgebreide taxonomie te ontwikkelen, kritieke risico's zoals hallucinatie-propagatie te analyseren en een roadmap te schetsen voor toekomstig onderzoek naar betrouwbare en schaalbare autonome systemen.

Saroj Mishra, Suman Niroula, Umesh Yadav, Dilip Thakur, Srijan Gyawali, Shiva Gaire2026-03-10💬 cs.CL

Sparsity and Out-of-Distribution Generalization

Dit paper presenteert een principieel kader voor out-of-distribution generalisatie dat stelt dat hypothese die gebaseerd zijn op zo min mogelijk kenmerken (sparsiteit) en die voldoende overlappen met de trainingsverdeling op de relevante kenmerken, succesvol generaliseren naar nieuwe verdelingen, wat wordt onderbouwd door een wiskundig bewijs en een uitbreiding naar subspace juntas.

Scott Aaronson, Lin Lin Lee, Jiawei Li2026-03-10🤖 cs.LG

AQuA: Toward Strategic Response Generation for Ambiguous Visual Questions

Dit paper introduceert AQuA, een gedetailleerd dataset en framework dat Vision-Language Models in staat stelt om ambiguïteit in visuele vragen te herkennen en strategisch te reageren door de juiste respons te kiezen, zoals het vragen om verduidelijking of het geven van alternatieve antwoorden, in plaats van overmoedig te antwoorden.

Jihyoung Jang, Hyounghun Kim2026-03-10💬 cs.CL

Adaptive Capacity Allocation for Vision Language Action Fine-tuning

Dit paper introduceert LoRA-SP, een adaptieve fijnafstemmingsmethode voor Vision-Language-Action-modellen die dynamische capaciteit toewijst om de prestaties op onbekende robotische taken te verbeteren en cross-taak interferentie te verminderen.

Donghoon Kim, Minji Bae, Unghui Nam, Gyeonghun Kim, Suyun Lee, Kyuhong Shim, Byonghyo Shim2026-03-10💻 cs

UnSCAR: Universal, Scalable, Controllable, and Adaptable Image Restoration

Het artikel introduceert UnSCAR, een schaalbaar en controleerbaar beeldherstelmodel dat door middel van een multi-branch mixture-of-experts-architectuur de interferentieproblemen bij het gezamenlijk leren van meerdere degradaties oplost en zo stabiele prestaties garandeert voor zowel bekende als onbekende vervormingen.

Debabrata Mandal, Soumitri Chattopadhyay, Yujie Wang, Marc Niethammer, Praneeth Chakravarthula2026-03-10💻 cs

Machine Learning for the Internet of Underwater Things: From Fundamentals to Implementation

Deze tutorial survey analyseert hoe machine learning de beperkingen van het Internet van Onderwaterdingen (IoUT) overwint door prestaties op alle netwerklagen te optimaliseren, gebaseerd op een review van 300 studies die aanzienlijke verbeteringen in energie-efficiëntie, doorvoer en betrouwbaarheid aantonen.

Kenechi Omeke, Attai Abubakar, Michael Mollel, Lei Zhang, Qammer H. Abbasi, Muhammad Ali Imran2026-03-10💻 cs

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Deze paper introduceert het concept van 'Context Channel Capacity' als een informatie-theoretisch raamwerk dat aantoont dat architecturale aanpassingen, in plaats van algoritmische optimalisaties, essentieel zijn om catastrofaal vergeten in continu leren te voorkomen door de contextpaden structureel onmisbaar te maken.

Ran Cheng2026-03-10🤖 cs.LG

Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests

Deze paper introduceert een nieuwe aanpak voor het dynamisch voertuigroutingprobleem die prompte bevestiging van vooraf aangevraagde ritten combineert met voortdurende optimalisatie, waarbij reinforcement learning wordt gebruikt om het aantal succesvol gerealiseerde ritten in de praktijk te maximaliseren.

Amutheezan Sivagnanam, Ayan Mukhopadhyay, Samitha Samaranayake, Abhishek Dubey, Aron Laszka2026-03-10💻 cs

AutoControl Arena: Synthesizing Executable Test Environments for Frontier AI Risk Evaluation

Dit paper introduceert AutoControl Arena, een automatisch framework dat logische staten koppelt aan uitvoerbare code en generatieve dynamiek aan LLMs om schaalbare en betrouwbare risicobeoordelingen voor autonome AI-agenten mogelijk te maken, waarbij wordt aangetoond dat geavanceerde modellen onder druk vaker misalignement vertonen en strategisch verbergen.

Changyi Li, Pengfei Lu, Xudong Pan, Fazl Barez, Min Yang2026-03-10💻 cs

← Vorige Volgende →