MMTA: Multi Membership Temporal Attention for Fine-Grained Stroke Rehabilitation Assessment

Die Arbeit stellt MMTA (Multi-Membership Temporal Attention) vor, einen hochauflösenden Temporal-Transformer, der durch die gleichzeitige Berücksichtigung mehrerer lokaler Zeitfenster pro Frame die präzise Erkennung feingranularer Bewegungsphasen in der Schlaganfall-Rehabilitation verbessert und dabei sowohl Video- als auch IMU-Daten in einer effizienten, einstufigen Architektur verarbeitet.

Halil Ismail Helvaci, Justin Huber, Jihye Bae + 1 more2026-03-03💻 cs

Solving a Nonlinear Blind Inverse Problem for Tagged MRI with Physics and Deep Generative Priors

Die Arbeit stellt einen neuartigen, blinden und nichtlinearen inversen Rahmen vor, der durch die Synergie von MR-Physik und generativen Priors erstmals die gleichzeitige Wiederherstellung anatomischer Bilder, die Synthese hochauflösender Cine-Bilder und die Schätzung von Bewegungen bei Tagged-MRI vereint, um die bisher getrennt behandelten Herausforderungen wie Tag-Verfälschung und Unschärfe zu überwinden.

Zhangxing Bian, Shuwen Wei, Samuel W. Remedios + 4 more2026-03-03⚡ eess

On the Exact Algorithmic Extraction of Finite Tesselations Through Prime Extraction of Minimal Representative Forms

Diese Arbeit stellt einen hierarchischen Algorithmus vor, der durch komposite Entdeckung, Normalisierung auf minimale repräsentative Formen und Primextraktion exakte, achsenausgerichtete rechteckige Tesselationen in endlichen diskreten Gittern deterministisch identifiziert, um eine Lücke in der symbolischen Gitteranalyse für Aufgaben wie das Lösen von Rätseln zu schließen.

Sushish Baral, Paulo Garcia, Warisa Sritriratanarak2026-03-03💻 cs

VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection

Die Arbeit stellt VGGT-Det vor, das als erstes Framework für die sensorgeometriefreie 3D-Objekterkennung in Innenräumen den VGGT-Encoder integriert und durch zwei neue Komponenten, die auf Aufmerksamkeitskarten und dynamischer Feature-Aggregation basieren, interne semantische und geometrische Priors nutzt, um die Leistung signifikant zu steigern.

Yang Cao, Feize Wu, Dave Zhenyu Chen + 3 more2026-03-03💻 cs

Seeing Beyond 8bits: Subjective and Objective Quality Assessment of HDR-UGC Videos

Die Autoren stellen den großen subjektiven Datensatz Beyond8Bits mit 44.000 HDR-UGC-Videos vor und entwickeln HDR-Q, das erste multimodale Large Language Model mit einem HDR-sensitiven Vision-Encoder und einem neuartigen RL-Finetuning-Verfahren (HAPO), um den State-of-the-Art bei der objektiven und subjektiven Qualitätsbewertung von HDR-Inhalten zu erreichen.

Shreshth Saini, Bowen Chen, Neil Birkbeck + 3 more2026-03-03🤖 cs.AI

When Does Margin Clamping Affect Training Variance? Dataset-Dependent Effects in Contrastive Forward-Forward Learning

Die Studie zeigt, dass das Klemmen des positiven Randes im Contrastive Forward-Forward-Lernen die Trainingsvarianz auf CIFAR-10 durch Sättigungseffekte in frühen Schichten signifikant erhöht, während dieser Effekt bei anderen Datensätzen von der positiven Paardichte und der Aufgabenschwierigkeit abhängt und durch eine gradientenneutrale Subtraktionsformel behoben werden kann.

Joshua Steier2026-03-03🤖 cs.LG

EraseAnything++: Enabling Concept Erasure in Rectified Flow Transformers Leveraging Multi-Object Optimization

EraseAnything++ ist ein einheitliches Framework, das durch die Formulierung als eingeschränktes Mehrziel-Optimierungsproblem, implizite Gradienten-Chirurgie sowie eine Anker- und Propagierungs-Mechanik eine effektive Konzept-Eliminierung in modernen Flow-Matching-basierten Diffusionsmodellen für Bilder und Videos ermöglicht, ohne dabei die generative Qualität oder zeitliche Konsistenz zu beeinträchtigen.

Zhaoxin Fan, Nanxiang Jiang, Daiheng Gao + 2 more2026-03-03🤖 cs.AI

Fake It Right: Injecting Anatomical Logic into Synthetic Supervised Pre-training for Medical Segmentation

Die Arbeit stellt einen anatomieinformierten synthetischen Überwachungs-Vorabtrainingsrahmen vor, der durch den Einsatz einer deidentifizierten Formbank und einer strukturorientierten Platzierungsstrategie die semantische Lücke zwischen generischen mathematischen Primitive und realer Anatomie schließt, um die Leistung von medizinischen Segmentierungsmodellen ohne Datenschutzbarrieren signifikant zu steigern.

Jiaqi Tang, Mengyan Zheng, Shu Zhang + 2 more2026-03-03💻 cs