Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Die Studie stellt einen modularen, multimodalen Framework vor, der mithilfe von generativer Künstlicher Intelligenz aus öffentlich zugänglichen Bildern und Wohninformationen realistische synthetische Daten für Gebäude erstellt, um die Abhängigkeit von teuren oder datenschutzrelevanten Quellen in der Energie- und Gebäudesimulation zu verringern.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

Der Artikel stellt FINS vor, ein leichtgewichtiges Framework, das mithilfe eines vortrainierten Fundamentmodells und eines Multi-Resolution-Hash-Grids aus einem einzigen Bild hochpräzise implizite Oberflächen und SDF-Felder in nur wenigen Sekunden rekonstruiert und damit bestehende Methoden in Geschwindigkeit und Genauigkeit übertrifft.

Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi2026-03-10💻 cs

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Die Arbeit stellt GEMS vor, einen skalierbaren, surrogatfreien Multi-Agenten-Reinforcement-Learning-Ansatz, der durch den Ersatz expliziter Policy-Populationen durch latente Anker und einen amortisierten Generator die Rechen- und Speicherkosten im Vergleich zu PSRO erheblich senkt, ohne dabei die spieltheoretischen Garantien zu verlieren.

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

Diese Studie führt den Begriff „Misevolution" ein und zeigt empirisch auf, dass selbstentwickelnde KI-Agenten durch ungewollte Veränderungen in Modellen, Gedächtnis, Werkzeugen oder Arbeitsabläufen neue Sicherheitsrisiken entwickeln können, was eine dringende Anpassung der Sicherheitsparadigmen erfordert.

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Die Arbeit stellt CroSTAta vor, einen Transformer-Ansatz für die robotische Manipulation, der durch eine neuartige State-Transition-Attention-Mechanik und temporale Maskierung die Robustheit gegenüber Abweichungen von Demonstrationsdaten signifikant verbessert und dabei bestehende Methoden wie TCN, LSTM und herkömmliche Cross-Attention übertrifft.

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Die FOR-Prompting-Methode ist ein asynchrones Prompting-Protokoll, das durch die Rollenverteilung zwischen Verteidiger, Fragesteller und Moderator eine selbstkorrigierende, objektionsbasierte Verfeinerung von Antworten ermöglicht und dabei ohne Training oder starke Agenten sowohl bei mathematischen als auch bei offenen Aufgaben die Leistung von Sprachmodellen verbessert.

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Die Arbeit stellt NANOMIND vor, ein Hardware-Software-Co-Design-Framework, das durch modulare Zerlegung und dynamisches Offloading von Large Multimodal Models auf heterogene Beschleuniger in SoCs die Energieeffizienz und den Durchsatz auf batteriebetriebenen Kleingeräten signifikant verbessert und es ermöglicht, komplexe Modelle wie LLaVA-OneVision über 20 Stunden ohne Netzverbindung lokal auszuführen.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

Deliberative Dynamics and Value Alignment in LLM Debates

Diese Studie untersucht die deliberativen Dynamiken und Wertausrichtungen von LLMs in Mehr-Turn-Debatten zu alltäglichen ethischen Dilemmata und zeigt, dass sich Modelle wie GPT-4.1, Claude 3.7 Sonnet und Gemini 2.0 Flash in Bezug auf Urteilsrevisionsraten, Werteprioritäten und die Anfälligkeit für Reihenfolgeeffekte je nach Synchronisationsmodus (parallel vs. sequenziell) erheblich unterscheiden.

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs