Scaling Quantum Machine Learning without Tricks: High-Resolution and Diverse Image Generation

Die Autoren präsentieren einen neuen State-of-the-Art-Ansatz für Quantum Machine Learning, der es ermöglicht, hochauflösende und diverse Bilder auf den vollständigen MNIST- und Fashion-MNIST-Datensätzen ohne herkömmliche Vereinfachungstricks zu generieren, indem sie durch die Wahl spezifischer Variational-Circuit-Architekturen induktive Biases nutzen und so die Grenzen aktueller Quantengeneratoren überwinden.

Jonas Jäger, Florian J. Kiwit, Carlos A. Riofrío2026-03-03⚛️ quant-ph

Seeking Necessary and Sufficient Information from Multimodal Medical Data

Die vorgestellte Arbeit adressiert die Herausforderung, in multimodalen medizinischen Daten sowohl notwendige als auch hinreichende Merkmale zu lernen, indem sie die Wahrscheinlichkeit von Notwendigkeit und Hinlänglichkeit (PNS) durch eine Zerlegung in modality-invariante und modality-spezifische Komponenten erweitert, was zu robusteren und leistungsfähigeren Modellen führt.

Boyu Chen, Weiye Bao, Junjie Liu + 5 more2026-03-03💻 cs

Percept-Aware Surgical Planning for Visual Cortical Prostheses with Vascular Avoidance

Die Studie stellt einen wahrnehmungsbewussten Optimierungsrahmen für die chirurgische Planung kortikaler Sehprothesen vor, der die Elektrodenplatzierung unter Berücksichtigung von Gefäßsicherheit und grauer Substanz mittels eines differenzierbaren Vorwärtsmodells optimiert, um die Rekonstruktionsqualität bei simulierten Sehaufgaben im Vergleich zu herkömmlichen Strategien signifikant zu verbessern.

Galen Pogoncheff, Alvin Wang, Jacob Granley + 1 more2026-03-03💻 cs

Deep Learning-Based Meat Freshness Detection with Segmentation and OOD-Aware Classification

Diese Studie stellt ein Deep-Learning-Framework zur Erkennung von Fleischfrische vor, das eine U-Net-basierte Segmentierung mit einem OOD-bewussten Klassifizierungsansatz kombiniert, um auf RGB-Bildern vier Frischeklassen zu identifizieren und unsichere Vorhersagen auszuschließen, wobei EfficientNet-B0 mit 98,10 % Genauigkeit die beste Leistung erzielte und die praktische Einsetzbarkeit auf mobilen Geräten demonstriert wurde.

Hutama Arif Bramantyo, Mukarram Ali Faridi, Rui Chen + 2 more2026-03-03⚡ eess

Unsupervised Semantic Segmentation in Synchrotron Computed Tomography with Self-Correcting Pseudo Labels

Diese Arbeit stellt einen neuartigen, unüberwachten Framework vor, der durch die Generierung von Pseudo-Labels mittels Clustering und deren anschließende Selbstkorrektur über den „Unbiased Teacher"-Ansatz eine automatisierte semantische Segmentierung großer Synchrotron-CT-Datensätze ohne manuelle Annotation ermöglicht und dabei die Genauigkeit im Vergleich zu reinen Pseudo-Labels signifikant verbessert.

Austin Yunker, Peter Kenesei, Hemant Sharma + 3 more2026-03-03💻 cs

DiffSOS: Acoustic Conditional Diffusion Model for Speed-of-Sound Reconstruction in Ultrasound Computed Tomography

Die Arbeit stellt DiffSOS vor, einen akustisch konditionierten Diffusionsmodell-basierten Ansatz zur schnellen und hochpräzisen Rekonstruktion von Schallgeschwindigkeitskarten in der Ultraschall-Computertomographie, der durch die Integration physikalischer Constraints, einen hybriden Verlust und die Schätzung von Unsicherheiten die Grenzen bestehender deterministischer und iterativer Methoden überwindet.

Yujia Wu, Shuoqi Chen, Shiru Wang + 3 more2026-03-03💻 cs

PointAlign: Feature-Level Alignment Regularization for 3D Vision-Language Models

Die Arbeit stellt PointAlign vor, eine neue Regularisierungsmethode auf Feature-Ebene, die durch die explizite Ausrichtung von Zwischenrepräsentationen von Punktwolken mit visuellen Eingabetokens die geometrischen Informationen in 3D-Vision-Language-Modellen erhält und so die Leistung bei Klassifikations- und Beschreibungsaufgaben signifikant verbessert.

Yuanhao Su, Shaofeng Zhang, Xiaosong Jia + 1 more2026-03-03💻 cs

DiffTrans: Differentiable Geometry-Materials Decomposition for Reconstructing Transparent Objects

Die Arbeit stellt DiffTrans vor, ein differentielles Rendering-Framework, das durch die Kombination von FlexiCubes, einem Umgebungslicht-Radiance-Feld und einem rekursiven differentiellen Raytracer eine präzise, end-zu-end-Zerlegung und Rekonstruktion der Geometrie und Materialeigenschaften transparenter Objekte in komplexen Szenen ermöglicht.

Changpu Li, Shuang Wu, Songlin Tang + 3 more2026-03-03💻 cs

Station2Radar: query conditioned gaussian splatting for precipitation field

Das Paper stellt Station2Radar vor, ein neuartiges Framework namens Query-Conditioned Gaussian Splatting (QCGS), das automatisch Wetterstationen und Satellitenbilder fusioniert, um durch selektives Rendern von Niederschlagsbereichen effiziente, hochpräzise und echtzeitfähige Niederschlagsfelder zu erzeugen, die konventionelle Produkte in der Genauigkeit deutlich übertreffen.

Doyi Kim, Minseok Seo, Changick Kim2026-03-03💻 cs