FermatSyn: SAM2-Enhanced Bidirectional Mamba with Isotropic Spiral Scanning for Multi-Modal Medical Image Synthesis

FermatSyn ist ein neuartiges Framework für die multimodale medizinische Bildsynthese, das durch die Kombination eines SAM2-basierten anatomischen Vorerkenners, einer hierarchischen Residual-Downsampling-Architektur und einer bidirektionalen Mamba mit isotroper Fermat-Spiral-Abtastung sowohl globale anatomische Konsistenz als auch hochauflösende lokale Details übertrifft und damit den klinischen Nutzen synthetischer Daten für nachgelagerte Segmentierungsaufgaben bestätigt.

Feng Yuan2026-03-02⚡ eess

On the use of Graphs for Satellite Image Time Series

Dieser Beitrag untersucht die Integration graphbasierter Methoden in die raumzeitliche Fernerkundungsanalyse, indem er einen vielseitigen Pipeline-Ansatz zur Verarbeitung von Satellitenbildzeitreihen vorstellt, der durch eine umfassende Übersicht und Fallstudien zu Landbedeckung und Wasserressourcen die Vorteile dieser Techniken für die Modellierung räumlicher und zeitlicher Interaktionen zwischen Objekten unterstreicht.

Corentin Dufourg, Charlotte Pelletier, Stéphane May + 1 more2026-03-02💻 cs

Efficient Degradation-agnostic Image Restoration via Channel-Wise Functional Decomposition and Manifold Regularization

Das Paper stellt MIRAGE vor, ein effizientes Framework für die degradation-unabhängige Bildwiederherstellung, das durch eine kanalspezifische funktionale Zerlegung und eine Mannigfaltigkeits-Regularisierung sowohl eine überlegene Leistung als auch hohe Recheneffizienz bei der Bewältigung verschiedener Bildkorruptionen in einem einzigen Modell erreicht.

Bin Ren, Yawei Li, Xu Zheng + 6 more2026-03-02💻 cs

OmniFall: From Staged Through Synthetic to Wild, A Unified Multi-Domain Dataset for Robust Fall Detection

Die Arbeit stellt OmniFall vor, ein einheitliches Benchmark-Dataset für die robuste Sturzdetektion, das durch die Kombination von standardisierten gestellten Aufnahmen, kontrolliert generierten synthetischen Daten und einem privaten Testset aus realen Unfällen eine generalisierbare und datenschutzkonforme Evaluierung über verschiedene Domänen hinweg ermöglicht.

David Schneider, Zdravko Marinov, Zeyun Zhong + 5 more2026-03-02💻 cs

LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation

Die Arbeit stellt LLM-EMF vor, ein neuartiges Modell für die cross-domain sequenzielle Empfehlung, das durch die Fusion von visuellen und textuellen Daten mittels eines eingefrorenen CLIP-Modells sowie die Integration von Large-Language-Model-Kenntnissen und einem Multi-Attention-Mechanismus die Vorhersagegenauigkeit von Benutzerpräferenzen über verschiedene Domänen hinweg signifikant verbessert.

Wangyu Wu, Zhenhong Chen, Wenqiao Zhang + 5 more2026-03-02💻 cs

SelvaBox: A high-resolution dataset for tropical tree crown detection

Die Studie stellt SelvaBox vor, das derzeit größte frei zugängliche Dataset mit über 83.000 manuell annotierten Baumkronen in hochauflösenden Drohnenaufnahmen aus drei tropischen Ländern, das durch umfassende Benchmarks die Überlegenheit höherer Bildauflösungen für die Detektion belegt und Modelle ermöglicht, die sowohl bei Zero-Shot-Anwendungen als auch in kombinierten Multi-Resolution-Pipelines neuartige Leistungsniveaus erreichen.

Hugo Baudchon, Arthur Ouaknine, Martin Weiss + 5 more2026-03-02💻 cs

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

Diese Arbeit demonstriert die Anwendung von erklärungsstarken Boosting-Maschinen (EBMs) in Kombination mit wissensgestützten Merkmalsextraktionsverfahren, um ein vollständig interpretierbares maschinelles Lernmodell zur Identifizierung von Overshooting Tops in Satellitenbildern zu entwickeln, das menschliche Expertenstrategien integriert und somit die Zuverlässigkeit in der Hochrisiko-Wettervorhersage erhöht.

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG