Characterization of Residual Morphological Substructure Using Supervised and Unsupervised Deep Learning

Diese Studie untersucht die Anwendung überwachter und unüberwachter Deep-Learning-Modelle zur Charakterisierung morphologischer Reststrukturen in Galaxien, wobei festgestellt wird, dass das überwachte CNN zwar starke und schwache Substrukturen unterscheiden kann, das unüberwachte CvAE jedoch keine klare Diskriminierungskraft aufweist.

Kameswara Bharadwaj Mantha, Daniel H. McIntosh, Cody Ciaschi + 9 more2026-02-24🔭 astro-ph

SCHEMA for Gemini 3 Pro Image: A Structured Methodology for Controlled AI Image Generation on Google's Native Multimodal Model

Die vorliegende Arbeit stellt SCHEMA vor, eine auf umfangreichen API-Tests basierende, dreistufige Prompt-Engineering-Methodik für Google Gemini 3 Pro Image, die durch modulare Komponenten und klare Entscheidungsregeln eine signifikant höhere Compliance und Konsistenz bei der generierten Bildinhalte in sechs professionellen Domänen gewährleistet.

Luca Cazzaniga2026-02-24💻 cs

DeepInterestGR: Mining Deep Multi-Interest Using Multi-Modal LLMs for Generative Recommendation

Der Artikel stellt DeepInterestGR vor, ein neuartiges generatives Empfehlungssystem, das durch den Einsatz multi-modaler LLMs tiefgreifende Benutzerinteressen extrahiert, diese mittels Belohnungs-Labels und RQ-VAE in semantische IDs kodiert und durch eine zweistufige Trainingspipeline mit Reinforcement Learning die Personalisierung und Interpretierbarkeit von Empfehlungen signifikant verbessert.

Yangchen Zeng2026-02-24🤖 cs.LG

MoBind: Motion Binding for Fine-Grained IMU-Video Pose Alignment

Die Arbeit stellt MoBind vor, ein hierarchisches kontrastives Lernframework, das IMU-Signale und Video-Pose-Sequenzen durch die Ausblendung visueller Hintergründe, die semantische Zuordnung von IMU-Sensoren zu Körperteilen und eine feingranulare zeitliche Ausrichtung auf Sub-Sekunden-Ebene präzise verbindet, um Aufgaben wie Cross-Modal-Retrieval, Synchronisation und Aktionserkennung zu verbessern.

Duc Duy Nguyen, Tat-Jun Chin, Minh Hoai2026-02-24💻 cs

GUIDE-US: Grade-Informed Unpaired Distillation of Encoder Knowledge from Histopathology to Micro-UltraSound

Die Studie stellt GUIDE-US vor, eine Methode zur unpaarigen Wissensdistillation von histopathologischen in Mikroultraschall-Encoder, die die Sensitivität für die nicht-invasive Erkennung klinisch signifikanter Prostatakrebsstadien verbessert, ohne dass Patientendaten gepaart oder Biopsien zur Inferenz benötigt werden.

Emma Willis, Tarek Elghareb, Paul F. R. Wilson + 6 more2026-02-24🤖 cs.LG

A Markovian View of Iterative-Feedback Loops in Image Generative Models: Neural Resonance and Model Collapse

Die Studie zeigt, dass iterative Feedback-Schleifen in generativen Modellen durch eine Markov-Kette beschrieben werden können, die unter den Bedingungen der Ergodizität und der gerichteten Kontraktion zu einer „neuronalen Resonanz" in einem niedrigdimensionalen invarianten Raum führt, was den Mechanismus des Modellkollapses erklärt und eine Taxonomie sowie Diagnosewerkzeuge für dessen Milderung bereitstellt.

Vibhas Kumar Vats, David J. Crandall, Samuel Goree2026-02-24🤖 cs.LG