A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

Die Studie stellt eine neuartige Miniatur-Gehirn-Transformer-Architektur vor, die zeigt, dass funktionelle Hemisphären-Lateralisierung erst durch die synergistische Kombination von präfrontalem Arbeitsgedächtnis und inhibitorischer Kopplung ausgelöst wird, was als entscheidender Symmetrie-Brecher für die Bildung hierarchischer persistenter Speicher dient.

Hong Jeong2026-03-10💻 cs

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

Das Paper stellt VINO vor, einen selbstüberwachten Lernansatz, der durch einen strukturellen Prior und asymmetrische Destillation in Video-Daten die Abhängigkeit von Kontext-Clues reduziert und robuste, objekzzentrierte Repräsentationen erlernt, die die Leistung bestehender Baselines bei der unsupervisierten Objekterkennung deutlich übertreffen.

Seul-Ki Yeom, Marcel Simon, Eunbin Lee, Tae-Ho Kim2026-03-10💻 cs

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Die Arbeit stellt LEPA vor, eine Architektur, die durch das direkte Vorhersagen transformierter Embeddings unter Berücksichtigung geometrischer Augmentierungen die Unzuverlässigkeit herkömmlicher Interpolationsverfahren in Geospatial-Grundmodellen überwindet und so präzise geometrische Anpassungen ohne Neu-Encoding ermöglicht.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

Eine empirische Studie an vier Modellen und fünf Prompting-Regimen zeigt, dass deploymentbedingte Einschränkungen die Halluzination von Zitaten in geschlossenen Umgebungen nicht verhindern, sondern die Verifizierbarkeit von Referenzen drastisch senken, was eine nachträgliche Überprüfung vor der Nutzung in der Softwaretechnik zwingend erforderlich macht.

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

Die Arbeit stellt MAviS vor, ein multimodales KI-System, das auf einem umfassenden Datensatz für über 1.000 Vogelarten basiert, um durch die Integration von Bild-, Audio- und Textdaten präzise artspezifische Fragen zu beantworten und so den Fortschritt im Bereich des Naturschutzes und der ökologischen Überwachung zu fördern.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

VisualScratchpad: Inference-time Visual Concepts Analysis in Vision Language Models

Die Arbeit stellt VisualScratchpad vor, eine interaktive Schnittstelle, die mithilfe von Sparse Autoencodern und Text-zu-Bild-Aufmerksamkeit visuelle Konzepte in Vision-Language-Modellen analysiert, um deren Fehlermodi wie unzureichende Cross-Modal-Ausrichtung oder irreführende visuelle Konzepte aufzudecken und zu debuggen.

Hyesu Lim, Jinho Choi, Taekyung Kim, Byeongho Heo, Jaegul Choo, Dongyoon Han2026-03-10💻 cs

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

Die Studie stellt „Agora" als eine KI-gestützte Plattform vor, die mithilfe von LLMs und authentischen menschlichen Stimmen hilft, die Fähigkeit zum Konsensfinden zu trainieren, und zeigt in einer Vorstudie, dass Nutzer mit Zugang zu detaillierten Erklärungen bessere Problemlösungsfähigkeiten und qualitativ hochwertigere Konsensentscheidungen erzielen als eine Kontrollgruppe, die nur aggregierte Daten sah.

Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy2026-03-10💻 cs