CARE Drive A Framework for Evaluating Reason-Responsiveness of Vision Language Models in Automated Driving

Die Studie stellt CARE Drive vor, ein modellunabhängiges Framework zur systematischen Evaluierung der Reaktionsfähigkeit von Vision-Language-Modellen auf menschliche Entscheidungsgründe im automatisierten Fahren, indem kontextuelle Variationen genutzt werden, um zu prüfen, ob Erklärungen echte kausale Einflussfaktoren oder nur nachträgliche Rationalisierungen darstellen.

Lucas Elbert Suryana, Farah Bierenga, Sanne van Buuren + 6 more2026-02-18🤖 cs.AI

Guided Diffusion by Optimized Loss Functions on Relaxed Parameters for Inverse Material Design

Die vorgestellte Arbeit entwickelt eine Methode zur inversen Materialgestaltung, die Diffusionsmodelle auf einem relaxierten, kontinuierlichen Parameterraum nutzt, um durch geführte Diffusion und differentiable Simulation vielfältige und präzise Designs für Verbundwerkstoffe mit vorgegebenen mechanischen Eigenschaften zu generieren.

Jens U. Kreber, Christian Weißenfels, Joerg Stueckler2026-02-18🤖 cs.LG

Concept-Enhanced Multimodal RAG: Towards Interpretable and Accurate Radiology Report Generation

Die vorgestellte Arbeit führt CEMRAG ein, ein einheitliches Framework, das visuelle klinische Konzepte mit multimodaler Retrieval-Augmented Generation (RAG) kombiniert, um sowohl die Interpretierbarkeit als auch die faktische Genauigkeit bei der automatisierten Generierung radiologischer Berichte zu verbessern und dabei das angenommene Zielkonflikt zwischen Transparenz und Leistung aufzulösen.

Marco Salmè, Federico Siciliano, Fabrizio Silvestri + 3 more2026-02-18💻 cs

Language and Geometry Grounded Sparse Voxel Representations for Holistic Scene Understanding

Diese Arbeit stellt eine neuartige Methode vor, die auf sprach- und geometrie-verankerten, spärlichen Voxel-Repräsentationen basiert, um Erscheinungsbild, Semantik und Geometrie in einem einheitlichen Rahmen synergistisch zu modellieren und so den aktuellen Stand der Technik bei der ganzheitlichen Szenenverständnis und -rekonstruktion zu übertreffen.

Guile Wu, David Huang, Bingbing Liu + 1 more2026-02-18💻 cs

Task-Agnostic Continual Learning for Chest Radiograph Classification

Die Studie stellt CARL-XRay vor, einen neuen Ansatz für das kontinuierliche Lernen bei der Klassifizierung von Thorax-Röntgenbildern, der durch den Einsatz von task-spezifischen Adaptern und einem latenten Task-Selektor eine stabile Anpassung an sequenziell eintreffende Datensätze ohne vollständiges Neulernen oder Speicherung roher Bilddaten ermöglicht.

Muthu Subash Kavitha, Anas Zafar, Amgad Muneer + 1 more2026-02-18🤖 cs.AI

VideoSketcher: Video Models Prior Enable Versatile Sequential Sketch Generation

Das Paper stellt VideoSketcher vor, eine dateneffiziente Methode, die vortrainierte Text-zu-Video-Diffusionsmodelle mit Sprachmodellen kombiniert, um hochwertige sequenzielle Skizzen zu generieren, die sowohl textbasierten Anweisungen zur Strichreihenfolge folgen als auch visuelle Details durch eine zweistufige Feinabstimmung mit nur wenigen manuellen Beispielen erlernen.

Hui Ren, Yuval Alaluf, Omer Bar Tal + 3 more2026-02-18💻 cs

A Survey on Generative Modeling with Limited Data, Few Shots, and Zero Shot

Diese Übersichtsarbeit bietet eine umfassende Analyse und eine neue Taxonomie für generative Modelle unter Datenbeschränkungen (GM-DC), indem sie über 230 Studien zu Herausforderungen wie Überanpassung und inkompatibler Wissensübertragung sowie zu Lösungsansätzen wie Transferlernen und Daten-Augmentierung zusammenfasst und einen praktischen Fahrplan für zukünftige Forschung in diesem Bereich liefert.

Milad Abdollahzadeh, Guimeng Liu, Touba Malekzadeh + 3 more2026-02-17🤖 cs.LG