Data-Centric Benchmark for Label Noise Estimation and Ranking in Remote Sensing Image Segmentation

Diese Arbeit stellt einen datenzentrischen Benchmark, einen neuen öffentlichen Datensatz sowie zwei innovative Methoden vor, die auf Modellunsicherheit, Vorhersagekonsistenz und Repräsentationsanalyse basieren, um Rauschen in den Labels von Fernerkundungsbildern für die semantische Segmentierung effektiv zu identifizieren, zu quantifizieren und zu bewerten.

Keiller Nogueira, Codrut-Andrei Diaconu, Dávid Kerekes + 9 more2026-03-03💻 cs

IdGlow: Dynamic Identity Modulation for Multi-Subject Generation

Die Arbeit stellt IdGlow vor, ein maskenfreies, zweistufiges Framework auf Basis von Flow-Matching-Modellen, das durch adaptive Zeitplanungsstrategien, VLM-gestützte Prompt-Synthese und Direct Preference Optimization die Stabilitäts-Plastizitäts-Dilemma bei der multi-subjektiven Bildgenerierung löst und gleichzeitig hohe Identitätstreue mit ästhetischer Kohärenz vereint.

Honghao Cai, Xiangyuan Wang, Yunhao Bai + 10 more2026-03-03🤖 cs.AI

Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark

Diese Arbeit stellt den ersten hochwertigen dynamischen Hyperspektral-Datensatz (DynaSpec) vor, entwickelt das effiziente Propagation-Guided Spectral Video Reconstruction Transformer (PG-SVRT) zur Verbesserung der räumlich-spektralen und zeitlichen Konsistenz bei der rekonstruktiven Videobearbeitung und etabliert ein umfassendes Benchmark für die komprimierte spektrale Bildgebung.

Lijing Cai, Zhan Shi, Chenglong Huang + 6 more2026-03-03💻 cs

Specializing Foundation Models via Mixture of Low-Rank Experts for Comprehensive Head CT Analysis

Die Studie stellt das Mixture-of-Low-Rank-Experts (MoLRE)-Framework vor, das durch spezialisierte Adapter und unsupervisiertes Routing die Leistung von medizinischen Foundation-Modellen bei der umfassenden Analyse von Kopf-CT-Scans für 75 verschiedene pathologische Befunde signifikant verbessert, ohne explizite Pathologie-Supervision zu benötigen.

Youngjin Yoo, Han Liu, Bogdan Georgescu + 14 more2026-03-03💻 cs

Towards Universal Khmer Text Recognition

Die Arbeit stellt ein universelles Framework zur Erkennung von Khmer-Texten vor, das mithilfe einer neuartigen modality-spezifischen adaptiven Merkmalsauswahl (MAFS) verschiedene Textmodalitäten wie gedruckten, handschriftlichen und Szenentext in einem einzigen Modell verarbeitet und dabei sowohl neue State-of-the-Art-Ergebnisse erzielt als auch den ersten umfassenden Benchmark für diese Aufgabe bereitstellt.

Marry Kong, Rina Buoy, Sovisal Chenda + 3 more2026-03-03💻 cs