Iconographic Classification and Content-Based Recommendation for Digitized Artworks

Die Autoren stellen ein Proof-of-Concept-System vor, das durch die Kombination von YOLOv8-basierter Objekterkennung mit der symbolischen Iconclass-Vokabular-Hierarchie eine automatisierte ikonografische Klassifizierung und inhaltsbasierte Empfehlung für digitalisierte Kunstwerke ermöglicht, um die Katalogisierung und Navigation in großen Kulturerbebeständen zu beschleunigen.

Krzysztof Kutt, Maciej Baczyński2026-02-24🤖 cs.AI

Towards Personalized Multi-Modal MRI Synthesis across Heterogeneous Datasets

Die Arbeit stellt PMM-Synth vor, ein personalisiertes Framework zur Synthese fehlender MRT-Modalitäten, das durch innovative Komponenten wie eine personalisierte Feature-Modulation und einen modalkonsistenten Batch-Scheduler eine robuste Generalisierung über heterogene klinische Datensätze hinweg ermöglicht und dabei die diagnostische Zuverlässigkeit verbessert.

Yue Zhang, Zhizheng Zhuo, Siyao Xu + 6 more2026-02-24💻 cs

VGGT-MPR: VGGT-Enhanced Multimodal Place Recognition in Autonomous Driving Environments

Der Artikel stellt VGGT-MPR vor, ein multimodales Framework für die Ortswiedererkennung im autonomen Fahren, das den Visual Geometry Grounded Transformer (VGGT) als einheitliche geometrische Engine nutzt, um durch tiefenbewusste visuelle Einbettungen und ein training-freies Nachsortierungsverfahren robuste und präzise globale Lokalisierung zu erreichen.

Jingyi Xu, Zhangshuo Qi, Zhongmiao Yan + 5 more2026-02-24💻 cs

M3S-Net: Multimodal Feature Fusion Network Based on Multi-scale Data for Ultra-short-term PV Power Forecasting

Dieser Artikel stellt M3S-Net vor, ein neuartiges multimodales Feature-Fusionsnetzwerk, das durch die Kombination von Mehrskalen-Daten, partiellen Faltungen zur Erfassung feinkörniger Wolkenmerkmale und einem dynamischen C-Matrix-Austauschmechanismus im Mamba-Modul die ultra-kurzfristige Vorhersage von PV-Leistung gegenüber bestehenden Methoden signifikant verbessert.

Penghui Niu, Taotao Cai, Suqi Zhang + 4 more2026-02-24💻 cs

Contrastive meta-domain adaptation for robust skin lesion classification across clinical and acquisition conditions

Die Studie stellt eine kontrastive Meta-Domain-Adaptationsmethode vor, die durch die Übertragung visueller Repräsentationen aus großen Dermatoskopie-Datensätzen die Robustheit und Generalisierungsfähigkeit von Deep-Learning-Modellen für die Hautläsionsklassifikation unter variierenden klinischen und akquisitionsbedingten Bedingungen verbessert.

Rodrigo Mota, Kelvin Cunha, Emanoel dos Santos + 6 more2026-02-24💻 cs

BigMaQ: A Big Macaque Motion and Animation Dataset Bridging Image and 3D Pose Representations

Die Arbeit stellt BigMaQ vor, einen umfassenden Datensatz mit über 750 Szenen interagierender Rhesusmakaken, der erstmals detaillierte 3D-Pose- und Formdarstellungen in die automatische Verhaltenserkennung integriert und damit die Genauigkeit von Aktionsklassifizierungen sowie das Verständnis sozialer Interaktionen bei nicht-menschlichen Primaten signifikant verbessert.

Lucas Martini, Alexander Lappe, Anna Bognár + 2 more2026-02-24💻 cs