A Boundary-Metric Evaluation Protocol for Whiteboard Stroke Segmentation Under Extreme Imbalance

Diese Arbeit stellt ein Evaluierungsprotokoll vor, das durch die Kombination von Randmetriken, einer Analyse der Gleichheit zwischen Kern- und dünnen Strich-Subsets sowie nicht-parametrischen Signifikanztests die extreme Klassenungleichgewicht bei der Weißbrett-Strichsegmentierung aufdeckt und zeigt, dass überlappungsbasierte Verlustfunktionen sowie eine höhere Trainingsauflösung die Leistung signifikant verbessern, wobei gelernte Modelle im Vergleich zu klassischen Baselines eine bessere Worst-Case-Zuverlässigkeit bieten.

Nicholas Korcynski2026-03-03🤖 cs.LG

ConFoThinking: Consolidated Focused Attention Driven Thinking for Visual Question Answering

Der Paper stellt ConFoThinking vor, einen neuen Rahmen für das visuelle Fragenbeantworten, der durch die Konsolidierung von Aufmerksamkeitsmustern in einer Zwischenschicht und die Extraktion mittels prägnanter semantischer Hinweise die Lokalisierung relevanter Bildregionen verbessert und so die Wahrnehmungsfähigkeit von multimodalen Sprachmodellen erheblich steigert.

Zhaodong Wu, Haochen Xue, Qi Cao + 5 more2026-03-03💻 cs

Optimisation of SOUP-GAN and CSR-GAN for High Resolution MR Images Reconstruction

Diese Forschung optimiert die GAN-Modelle SOUP-GAN und CSR-GAN durch architektonische Verbesserungen und Hyperparameter-Tuning, um hochauflösende MR-Bilder mit reduzierten Artefakten und verbessertem diagnostischem Potenzial zu rekonstruieren, wobei CSR-GAN bei Detailtreue und SOUP-GAN bei struktureller Klarheit jeweils die besten Ergebnisse erzielen.

Muneeba Rashid, Hina Shakir, Humaira Mehwish + 2 more2026-03-03⚡ eess

VisRef: Visual Refocusing while Thinking Improves Test-Time Scaling in Multi-Modal Large Reasoning Models

Die Arbeit stellt VisRef vor, ein rechenzeitskalierbares Framework für multimodale Reasoning-Modelle, das durch das gezielte Re-Injecten semantisch relevanter visueller Token während des Denkprozesses die Aufmerksamkeit auf das Bild bewahrt und so die Leistung bei festem Rechenbudget ohne zusätzliche RL-Feinabstimmung signifikant verbessert.

Soumya Suvra Ghosal, Youngeun Kim, Zhuowei Li + 6 more2026-03-03🤖 cs.AI

Physical Evaluation of Naturalistic Adversarial Patches for Camera-Based Traffic-Sign Detection

Diese Studie untersucht die Wirksamkeit natürlicher adversarieller Patches bei der physischen Störung von Verkehrsschilder-Erkennungssystemen in autonomen Fahrzeugen, indem sie einen maßgeschneiderten Datensatz (CompGTSRB) und ein YOLOv5-Modell nutzt, um zu zeigen, wie verschiedene Konfigurationen die Erkennungsgenauigkeit beeinträchtigen und damit die Notwendigkeit robusterer Verteidigungsmechanismen unterstreichen.

Brianna D'Urso, Tahmid Hasan Sakib, Syed Rafay Hasan + 1 more2026-03-03🤖 cs.AI

Pretty Good Measurement for Radiomics: A Quantum-Inspired Multi-Class Classifier for Lung Cancer Subtyping and Prostate Cancer Risk Stratification

Diese Studie stellt einen quanteninspirierten Multi-Klassen-Klassifikator auf Basis der „Pretty Good Measurement" vor, der sich in radiomischen Anwendungen zur Subtypisierung von Lungenkrebs und Risikobewertung von Prostatakrebs als wettbewerbsfähig und in einigen Szenarien überlegen gegenüber etablierten klassischen Methoden erweist.

Giuseppe Sergioli, Carlo Cuccu, Giovanni Pasini + 4 more2026-03-03⚛️ quant-ph

Scaling Quantum Machine Learning without Tricks: High-Resolution and Diverse Image Generation

Die Autoren präsentieren einen neuen State-of-the-Art-Ansatz für Quantum Machine Learning, der es ermöglicht, hochauflösende und diverse Bilder auf den vollständigen MNIST- und Fashion-MNIST-Datensätzen ohne herkömmliche Vereinfachungstricks zu generieren, indem sie durch die Wahl spezifischer Variational-Circuit-Architekturen induktive Biases nutzen und so die Grenzen aktueller Quantengeneratoren überwinden.

Jonas Jäger, Florian J. Kiwit, Carlos A. Riofrío2026-03-03⚛️ quant-ph