Questions beyond Pixels: Integrating Commonsense Knowledge in Visual Question Generation for Remote Sensing

Die Autoren stellen das KRSVQG-Modell vor, das durch die Integration von externen Wissensquellen und Bildunterschriften automatisch generierte Fragen für Fernerkundungsbilder erweitert, um über rein pixelbasierte Beschreibungen hinauszugehen und menschenähnliches Common Sense-Wissen in die visuelle Fragegenerierung einzubringen.

Siran Li, Li Mi, Javiera Castillo-Navarro + 1 more2026-02-24💻 cs

Controlled Face Manipulation and Synthesis for Data Augmentation

Die Autoren stellen eine Methode zur kontrollierten Manipulation und Synthese von Gesichtern im semantischen latenten Raum vor, die durch entanglement-reduzierende Techniken wie abhängige Konditionierung und orthogonale Projektion hochwertige Daten für das Training von Gesichtsausdruckserkennungsmodellen generiert und so deren Genauigkeit sowie Disentanglement signifikant verbessert.

Joris Kirchner, Amogh Gudi, Marian Bittner + 1 more2026-02-24🤖 cs.LG

MultiDiffSense: Diffusion-Based Multi-Modal Visuo-Tactile Image Generation Conditioned on Object Shape and Contact Pose

Das Paper stellt MultiDiffSense vor, einen einheitlichen Diffusionsmodell-Ansatz, der auf CAD-basierten Tiefenkarten und strukturierten Prompts basiert, um physikalisch konsistente, multimodale visuo-taktile Bilder für verschiedene Sensoren zu synthetisieren und so die datenhungrige Erfassung realer Datensätze für robotische Anwendungen erheblich zu beschleunigen.

Sirine Bhouri, Lan Wei, Jian-Qing Zheng + 1 more2026-02-24🤖 cs.AI

PoseCraft: Tokenized 3D Body Landmark and Camera Conditioning for Photorealistic Human Image Synthesis

Das Paper stellt PoseCraft vor, ein Diffusionsframework, das diskretisierte 3D-Körperlandmarken und Kameraparameter als Conditioning-Tokens nutzt, um fotorealistische menschliche Avatare mit präziser Pose- und Kamerasteuerung zu synthetisieren und dabei die Grenzen bestehender rigging-basierter oder volumetrischer Methoden zu überwinden.

Zhilin Guo, Jing Yang, Kyle Fogarty + 9 more2026-02-24💻 cs