Grounding Machine Creativity in Game Design Knowledge Representations: Empirical Probing of LLM-Based Executable Synthesis of Goal Playable Patterns under Structural Constraints

Diese Studie untersucht, ob große Sprachmodelle in der Lage sind, unter Berücksichtigung von Strukturkonstrukten des Unity-Engines und auf Basis von Ziel-spielbaren Mustern (Goal Playable Patterns) spielbare Spiele zu synthetisieren, und identifiziert dabei insbesondere Probleme der semantischen Verankerung und Code-Hygiene als Hauptengpässe für den Erfolg.

Hugh Xuechen Liu, Kıvanç Tatar2026-03-10💻 cs

Enhancing Consistency of Werewolf AI through Dialogue Summarization and Persona Information

Diese Studie stellt einen auf großen Sprachmodellen basierenden Werwolf-AI-Agenten vor, der durch die Nutzung von Dialogzusammenfassungen und manuell gestalteten Persona-Informationen eine konsistente und charaktergetreue Kommunikation im Spiel gewährleistet.

Yoshiki Tanaka, Takumasa Kaneko, Hiroki Onozeki, Natsumi Ezure, Ryuichi Uehara, Zhiyang Qi, Tomoya Higuchi, Ryutaro Asahara, Michimasa Inaba2026-03-10💬 cs.CL

Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge

Die Arbeit stellt EyExIn vor, ein dateneffizientes Framework, das durch eine Deep Expert Injection-Mechanik und eine Expert-Aware Dual-Stream-Architektur die Lücken in der visuellen Wahrnehmung und dem logischen Schlussfolgern von großen multimodalen Modellen schließt, um durch die Verankerung von spezialisiertem ophthalmologischem Expertenwissen eine präzise und vertrauenswürdige Diagnose von Netzhauterkrankungen zu ermöglichen.

Shuai Lu, Meng Wang, Jia Guo, Jiawei Du, Bo Liu, Shengzhu Yang, Weihang Zhang, Huazhu Fu, Huiqi Li2026-03-10💻 cs

Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language

Die Arbeit stellt eine neue Aufgabe namens „Emotion Transcription in Conversation" (ETC) vor, die darauf abzielt, komplexe emotionale Zustände in Gesprächen durch natürliche Sprachbeschreibungen zu erfassen, und liefert hierfür ein japanisches Datenset mit selbstberichteten Emotionen sowie eine Benchmark-Analyse bestehender Modelle.

Yoshiki Tanaka, Ryuichi Uehara, Koji Inoue, Michimasa Inaba2026-03-10💬 cs.CL

Learning to Rank the Initial Branching Order of SAT Solvers

Diese Arbeit untersucht den Einsatz von Graph Neural Networks zur Vorhersage eines initialen Verzweigungsordnungs für SAT-Löser, wobei zwar signifikante Beschleunigungen bei zufälligen und pseudo-industriellen Instanzen erzielt werden, die Vorhersagen jedoch bei komplexen industriellen Problemen aufgrund der dynamischen Heuristiken der Solver und der Schwierigkeit der Instanzen versagen.

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Diese Arbeit stellt die Layered Governance Architecture (LGA) vor, einen vierstufigen Rahmen zur Abwehr von Ausführungsschicht-Schwachstellen autonomer Agenten, der durch ein umfassendes Benchmark-Testing und experimentelle Ergebnisse belegt wird, dass eine Kombination aus Sandboxing, Intent-Verifikation und Zero-Trust-Autorisierung sowohl hohe Abfangquoten bei bösartigen Tool-Aufrufen als auch geringe Latenzzeiten ermöglicht.

Yuxu Ge2026-03-10💻 cs

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

Die Studie stellt eine neuartige Miniatur-Gehirn-Transformer-Architektur vor, die zeigt, dass funktionelle Hemisphären-Lateralisierung erst durch die synergistische Kombination von präfrontalem Arbeitsgedächtnis und inhibitorischer Kopplung ausgelöst wird, was als entscheidender Symmetrie-Brecher für die Bildung hierarchischer persistenter Speicher dient.

Hong Jeong2026-03-10💻 cs

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

Das Paper stellt VINO vor, einen selbstüberwachten Lernansatz, der durch einen strukturellen Prior und asymmetrische Destillation in Video-Daten die Abhängigkeit von Kontext-Clues reduziert und robuste, objekzzentrierte Repräsentationen erlernt, die die Leistung bestehender Baselines bei der unsupervisierten Objekterkennung deutlich übertreffen.

Seul-Ki Yeom, Marcel Simon, Eunbin Lee, Tae-Ho Kim2026-03-10💻 cs

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Die Arbeit stellt LEPA vor, eine Architektur, die durch das direkte Vorhersagen transformierter Embeddings unter Berücksichtigung geometrischer Augmentierungen die Unzuverlässigkeit herkömmlicher Interpolationsverfahren in Geospatial-Grundmodellen überwindet und so präzise geometrische Anpassungen ohne Neu-Encoding ermöglicht.

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs