Language and Geometry Grounded Sparse Voxel Representations for Holistic Scene Understanding

Diese Arbeit stellt eine neuartige Methode vor, die auf sprach- und geometrie-verankerten, spärlichen Voxel-Repräsentationen basiert, um Erscheinungsbild, Semantik und Geometrie in einem einheitlichen Rahmen synergistisch zu modellieren und so den aktuellen Stand der Technik bei der ganzheitlichen Szenenverständnis und -rekonstruktion zu übertreffen.

Guile Wu, David Huang, Bingbing Liu + 1 more2026-02-18💻 cs

Task-Agnostic Continual Learning for Chest Radiograph Classification

Die Studie stellt CARL-XRay vor, einen neuen Ansatz für das kontinuierliche Lernen bei der Klassifizierung von Thorax-Röntgenbildern, der durch den Einsatz von task-spezifischen Adaptern und einem latenten Task-Selektor eine stabile Anpassung an sequenziell eintreffende Datensätze ohne vollständiges Neulernen oder Speicherung roher Bilddaten ermöglicht.

Muthu Subash Kavitha, Anas Zafar, Amgad Muneer + 1 more2026-02-18🤖 cs.AI

VideoSketcher: Video Models Prior Enable Versatile Sequential Sketch Generation

Das Paper stellt VideoSketcher vor, eine dateneffiziente Methode, die vortrainierte Text-zu-Video-Diffusionsmodelle mit Sprachmodellen kombiniert, um hochwertige sequenzielle Skizzen zu generieren, die sowohl textbasierten Anweisungen zur Strichreihenfolge folgen als auch visuelle Details durch eine zweistufige Feinabstimmung mit nur wenigen manuellen Beispielen erlernen.

Hui Ren, Yuval Alaluf, Omer Bar Tal + 3 more2026-02-18💻 cs

A Survey on Generative Modeling with Limited Data, Few Shots, and Zero Shot

Diese Übersichtsarbeit bietet eine umfassende Analyse und eine neue Taxonomie für generative Modelle unter Datenbeschränkungen (GM-DC), indem sie über 230 Studien zu Herausforderungen wie Überanpassung und inkompatibler Wissensübertragung sowie zu Lösungsansätzen wie Transferlernen und Daten-Augmentierung zusammenfasst und einen praktischen Fahrplan für zukünftige Forschung in diesem Bereich liefert.

Milad Abdollahzadeh, Guimeng Liu, Touba Malekzadeh + 3 more2026-02-17🤖 cs.LG

Efficiently Assemble Normalization Layers and Regularization for Federated Domain Generalization

Die Studie stellt gPerXAN vor, eine neuartige Architektur für das federierte Domänengeneralisieren, die durch personalisierte explizit zusammengesetzte Normalisierungsschichten und einen Leitregularisierer datenschutzkonform und effizient domäneninvariante Repräsentationen erlernt, um die Generalisierungsfähigkeit auf unsichtbare Domänen zu verbessern.

Khiem Le, Long Ho, Cuong Do + 2 more2026-02-17🤖 cs.LG