TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers

Die Arbeit stellt TIDE vor, eine trainingsfreie Methode zur dynamischen Bildextrapolation für Diffusion-Transformer, die durch einen textbasierten Ankermechanismus und eine schrittweise temperaturgesteuerte Dynamik strukturelle Verzerrungen bei der Generierung höherer Auflösungen und beliebiger Seitenverhältnisse ohne zusätzliche Sampling-Kosten vermeidet.

Yihua Liu, Fanjiang Ye, Bowen Lin, Rongyu Fang, Chengming ZhangWed, 11 Ma💻 cs

FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid

Das Paper stellt FAME vor, ein force-adaptives Reinforcement-Learning-Framework, das die Stabilität eines vollskaligen Humanoiden unter externen Handkräften verbessert, indem es eine stehende Policy auf einen latenten Kontext konditioniert, der Gelenkkonfigurationen und Interaktionskräfte kodiert, was zu einer signifikant höheren Erfolgsrate bei der Manipulation führt und ohne Drehmoment-Sensoren am Handgelenk funktioniert.

Niraj Pudasaini, Yutong Zhang, Jensen Lavering, Alessandro Roncone, Nikolaus CorrellWed, 11 Ma💻 cs

Integrating Virtual and Augmented Reality into Public Education: Opportunities and Challenges in Language Learning

Diese Arbeit untersucht auf Basis zweier empirischer Studien die Chancen und Herausforderungen des Einsatzes von Virtual und Augmented Reality im öffentlichen Sprachunterricht, wobei sie trotz motivierender und kontextueller Vorteile technische Hürden sowie kognitive Überlastung identifiziert und Strategien für eine erfolgreiche Implementierung durch verbessertes Design, angepasste Infrastruktur und Lehrerausbildung empfiehlt.

Tanja Kojic, Maurizio Vergari, Giulia-Marielena Benta, Joy Krupinski, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

Influence of Interactivity in Shaping User Experience and Social Acceptance of Mobile XR

Diese Studie untersucht den Einfluss unterschiedlicher Interaktivitätsgrade in mobilen AR-Anwendungen auf das Nutzererlebnis und die soziale Akzeptanz und zeigt, dass ein ausgewogener Designansatz notwendig ist, um sowohl Usability als auch soziale Barrieren im öffentlichen Raum zu berücksichtigen.

Tanja Kojic, Maurizio Vergari, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

SVG-EAR: Parameter-Free Linear Compensation for Sparse Video Generation via Error-aware Routing

Die Arbeit stellt SVG-EAR vor, eine parametrenfreie Methode zur linearen Kompensation in Diffusion Transformern für die Videogenerierung, die durch semantische Clustering-basierte Approximation und ein fehlerbewusstes Routing-Verfahren die Effizienz signifikant steigert, ohne dabei die Generierungsqualität zu beeinträchtigen.

Xuanyi Zhou, Qiuyang Mang, Shuo Yang, Haocheng Xi, Jintao Zhang, Huanzhi Mao, Joseph E. Gonzalez, Kurt Keutzer, Ion Stoica, Alvin CheungWed, 11 Ma💻 cs

Diffusion-Based Authentication of Copy Detection Patterns: A Multimodal Framework with Printer Signature Conditioning

Diese Arbeit stellt ein multimodales Framework vor, das Diffusionsmodelle mit ControlNet nutzt, um Kopiererkennungsmuster durch die Kombination von Originalvorlage, gedrucktem Muster und Drucker-Signatur zu authentifizieren und dabei hochauflösende Fälschungen zuverlässiger als herkömmliche Methoden zu erkennen.

Bolutife Atoki, Iuliia Tkachenko, Bertrand Kerautret, Carlos Crispim-JuniorWed, 11 Ma💻 cs

"Who wants to be nagged by AI?": Investigating the Effects of Agreeableness on Older Adults' Perception of LLM-Based Voice Assistants' Explanations

Die Studie zeigt, dass bei älteren Erwachsenen die wahrgenommene Vertrauenswürdigkeit und Empathie von KI-Stimmassistenten mit hoher Freundlichkeit steigt, diese Vorteile jedoch in Notfallsituationen zugunsten von Klarheit zurücktreten und dass sowohl der Kontext als auch die Persönlichkeit des Nutzers maßgeblich die Akzeptanz von KI-Erklärungen beeinflussen.

Niharika Mathur, Hasibur Rahman, Smit DesaiWed, 11 Ma💻 cs

ImpedanceDiffusion: Diffusion-Based Global Path Planning for UAV Swarm Navigation with Generative Impedance Control

Der Artikel stellt ImpedanceDiffusion vor, ein hierarchisches Framework für die Schwarmnavigation von UAVs in überfüllten Innenräumen, das auf diffusionsbasierten globalen Pfadplanern, reaktiver APF-Verfolgung und semantisch angepasster Impedanzregelung basiert, um in Sim-to-Real-Experimenten eine hohe Erfolgsrate und kollisionsfreie Manövrierfähigkeit zu erreichen.

Faryal Batool, Yasheerah Yaqoot, Muhammad Ahsan Mustafa, Roohan Ahmed Khan, Aleksey Fedoseev, Dzmitry TsetserukouWed, 11 Ma💻 cs

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Diese Arbeit demonstriert erstmals die direkte Programmierung von FP64-Tensor-Cores auf NVIDIA-GPUs zur Beschleunigung hochauflösender Finite-Elemente-Simulationen in der MFEM-Bibliothek, wodurch auf Exascale-Systemen bis zu eine Verdopplung der Leistung und signifikante Energieeffizienzgewinne erzielt werden.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs