Ecological mapping with geospatial foundation models

Diese Studie zeigt, dass feinabgestimmte geospatiale Grundmodelle wie Prithvi-EO-2.0 und TerraMind bei ökologischen Anwendungen wie der Erfassung von Waldeigenschaften, Landnutzungskartierung und Torfmoosdetektion konsequent besser abschneiden als ein herkömmlicher ResNet-101-Baseline-Ansatz, wobei ihre Leistung jedoch von der genauen Ausrichtung der Trainingsdaten und der Eingabeauflösung abhängt.

Craig Mahlasi, Gciniwe S. Baloyi, Zaheed Gaffoor + 6 more2026-02-25💻 cs

Sim2Radar: Toward Bridging the Radar Sim-to-Real Gap with VLM-Guided Scene Reconstruction

Das Paper stellt Sim2Radar vor, ein Framework, das mithilfe von Vision-Language-Modellen und physikbasierten Raytracing-Methoden aus einzelnen RGB-Bildern realistische mmWave-Radardaten synthetisiert, um das Sim2Real-Problem zu überwinden und die Leistung von 3D-Radar-Objektdetektoren durch Transfer-Learning signifikant zu verbessern.

Emily Bejerano, Federico Tondolo, Ayaan Qayyum + 2 more2026-02-25🤖 cs.AI

Learning Humanoid End-Effector Control for Open-Vocabulary Visual Loco-Manipulation

Das Paper stellt HERO vor, ein neues Paradigma für die humanoide Loko-Manipulation, das durch die Kombination von Open-Vocabulary-Vision-Modellen für die visuelle Generalisierung und einer präzisen, residualbewussten Endeffektor-Steuerung mit simuliertem Training eine zuverlässige Interaktion mit alltäglichen Objekten in verschiedenen realen Umgebungen ermöglicht.

Runpei Dong, Ziyan Li, Xialin He + 1 more2026-02-25💻 cs

Probability-Invariant Random Walk Learning on Gyral Folding-Based Cortical Similarity Networks for Alzheimer's and Lewy Body Dementia Diagnosis

Diese Arbeit stellt einen probabilistischen Random-Walk-Ansatz vor, der auf gyralen Faltungsmustern basierende, individuelle kortikale Ähnlichkeitsnetzwerke ohne explizite Knotenabstimmung analysiert, um Alzheimer und Lewy-Körper-Demenz robuster zu diagnostizieren als herkömmliche atlasbasierte oder faltungsbasierte Methoden.

Minheng Chen, Tong Chen, Chao Cao + 4 more2026-02-25🧬 q-bio

Keep it SymPL: Symbolic Projective Layout for Allocentric Spatial Reasoning in Vision-Language Models

Die Studie stellt SymPL vor, ein Framework, das allocentrisches räumliches Reasoning in Vision-Language-Modellen durch die Umformulierung in symbolische Layouts verbessert und dabei Projektion, Abstraktion, Bipartition und Lokalisierung nutzt, um die Leistung sowohl bei allocentrischen als auch egozentrischen Aufgaben signifikant zu steigern.

Jaeyun Jang, Seunghui Shin, Taeho Park + 1 more2026-02-25💻 cs