Do Large Language Models Understand Data Visualization Principles?

Diese Studie bewertet systematisch die Fähigkeit von Large Language Models und Vision-Language Models, Prinzipien der Datenvisualisierung zu erkennen und zu korrigieren, indem sie ein kontrolliertes Datenset mit Ground-Truth-Verifikationen nutzt und dabei sowohl ihr Potenzial als flexible Validatoren als auch ihre Grenzen im Vergleich zu symbolischen Systemen sowie eine Asymmetrie zwischen besserer Korrektur und schwächerer Detektion von Verstößen aufzeigt.

Martin Sinnona, Valentin Bonas, Viviana Siless + 1 more2026-02-24💻 cs

Improving Pixel Embedding Learning through Intermediate Distance Regression Supervision for Instance Segmentation

Diese Arbeit stellt eine effiziente Architektur für die Instanzsegmentierung vor, die durch die Integration eines Distanzregressionsmoduls zur Generierung von Clustering-Samen und zur Verbesserung der Objekt-Embeddings die mSBD-Werte im CVPPP-Blattsegmentierungswettbewerb um mehr als 8 % steigert und damit den ersten Platz auf der CodaLab-Rangliste erreicht.

Yuli Wu, Long Chen, Dorit Merhof2026-02-23💻 cs

HaDR: Applying Domain Randomization for Generating Synthetic Multimodal Dataset for Hand Instance Segmentation in Cluttered Industrial Environments

Diese Studie stellt einen synthetischen RGB-D-Datensatz und vortrainierte Modelle vor, die durch Domain Randomization erzeugt wurden, um robuste, farbunabhängige Hand-Instanzsegmentierung in unstrukturierten industriellen Umgebungen zu ermöglichen und dabei die Leistung bestehender Ansätze zu übertreffen.

Stefan Grushko, Aleš Vysocký, Jakub Chlebek + 1 more2026-02-23💻 cs

Retinal OCT Synthesis with Denoising Diffusion Probabilistic Models for Layer Segmentation

Diese Studie zeigt, dass Denoising Diffusion Probabilistic Models (DDPMs) realistische retinale OCT-Bilder aus groben Skizzen synthetisieren können und damit durch verbesserte Pseudo-Labels oder sogar ausschließlich synthetische Daten die Genauigkeit der Schichtsegmentierung steigern, wodurch der Bedarf an manuellen Annotationen erheblich reduziert wird.

Yuli Wu, Weidong He, Dennis Eschweiler + 5 more2026-02-23⚡ eess

A Pragmatic Note on Evaluating Generative Models with Fréchet Inception Distance for Retinal Image Synthesis

Diese Arbeit kritisiert die Verwendung des Fréchet Inception Distance (FID) als alleiniges Evaluierungskriterium für generative Modelle in der Retina-Bildgebung und plädiert stattdessen für eine pragmatische Bewertung durch den direkten Einsatz synthetischer Daten in nachgelagerten Aufgaben wie Klassifikation und Segmentierung.

Yuli Wu, Fucheng Liu, Rüveyda Yilmaz + 3 more2026-02-23🤖 cs.LG