UGround: Towards Unified Visual Grounding with Unrolled Transformers

Das Paper stellt UGround vor, ein einheitliches Paradigma für visuelles Grounding, das durch eine Reinforcement-Learning-gesteuerte, stochastische Auswahl von Zwischenschichten in unrollierten Transformern und die Nutzung von Masken als explizite räumliche Prompts die Fehlerakkumulation herkömmlicher Ansätze überwindet und eine Vielzahl von Aufgaben von der Referenzsegmentierung bis hin zur Reasoning-Segmentierung in einem einzigen Framework vereint.

Rui Qian, Xin Yin, Chuanhang Deng + 4 more2026-02-17💻 cs

Algorithms Trained on Normal Chest X-rays Can Predict Health Insurance Types

Diese Studie zeigt, dass KI-Modelle, die auf normalen Röntgenbildern des Thorax trainiert wurden, die Art der Krankenversicherung – und damit sozioökonomische Ungleichheiten – mit signifikanter Genauigkeit vorhersagen können, was darauf hindeutet, dass medizinische Bilddaten keine neutralen biologischen Informationen sind, sondern subtile soziale Signaturen enthalten.

Chi-Yu Chen, Rawan Abulibdeh, Arash Asgari + 8 more2026-02-17🤖 cs.AI

MPCM-Net: Multi-scale network integrates partial attention convolution with Mamba for ground-based cloud image segmentation

Die vorgestellte Arbeit stellt MPCM-Net vor, ein Multi-Scale-Netzwerk, das partielle Aufmerksamkeits-Convolutionen mit Mamba-Architekturen kombiniert, um die Segmentierung bodengestützter Wolkenbilder für die Photovoltaik-Prognose zu verbessern, und stellt zudem den neuen CSRC-Datensatz als Benchmark zur Verfügung.

Penghui Niu, Jiashuai She, Taotao Cai + 4 more2026-02-17🤖 cs.LG

Semantic-Guided Two-Stage GAN for Face Inpainting with Hybrid Perceptual Encoding

Die vorgestellte Arbeit stellt eine neuartige, semantisch geführte Zwei-Stage-GAN-Architektur mit hybrider perceptueller Kodierung vor, die durch die Kombination von CNNs und Vision Transformern sowie einen Multi-Modal-Texture-Generator hochqualitative Gesichtsrekonstruktionen auch bei großen, unregelmäßigen Masken ermöglicht und dabei die Identität sowie strukturelle Konsistenz verbessert.

Abhigyan Bhattacharya, Hiranmoy Roy, Debotosh Bhattacharjee2026-02-17💻 cs