LoLep: Single-View View Synthesis with Locally-Learned Planes and Self-Attention Occlusion Inference

Das Paper stellt LoLep vor, eine Methode zur Single-View-View-Synthese, die mittels lokal gelernter Ebenen, eines Diskrepanzsamplers mit zwei Optimierungsstrategien und eines Block-Sampling-Self-Attention-Mechanismus für präzise Okklusionsinferenz neuartige Ansichten aus einem einzigen RGB-Bild erzeugt und dabei state-of-the-art Ergebnisse liefert.

Cong Wang, Yu-Ping Wang, Dinesh Manocha2026-02-20💻 cs

Unlocking [CLS] Features for Continual Post-Training

Die vorgestellte Arbeit stellt TOSCA vor, eine parameter-effiziente Methode zur kontinuierlichen Nachschulung von Grundmodellen, die durch den Einsatz eines spärlichen Adapter-Kalibrator-Moduls (LuCA) am [CLS]-Token ein optimales Gleichgewicht zwischen Stabilität und Plastizität erreicht und dabei die Anzahl der Parameter im Vergleich zu bestehenden Ansätzen um das Achtfache reduziert.

Murat Onur Yildirim, Elif Ceren Gok Yildirim, Joaquin Vanschoren2026-02-20🤖 cs.LG

Demographic-aware fine-grained visual recognition of pediatric wrist pathologies

Diese Studie stellt ein demografiefähiges hybrides Convolution-Transformer-Modell vor, das durch die Integration von Alter und Geschlecht sowie progressive Metadaten-Maskierung die feingranulare Erkennung pädiatrischer Handgelenkspathologien in Röntgenbildern verbessert und dabei normale Entwicklungsvariationen von echten Pathologien zuverlässig unterscheidet.

Ammar Ahmed, Ali Shariq Imran, Zenun Kastrati + 1 more2026-02-20🤖 cs.AI

PP-Motion: Physical-Perceptual Fidelity Evaluation for Human Motion Generation

Die Arbeit stellt PP-Motion vor, ein neuartiges datengesteuertes Metrik-Verfahren zur Bewertung der physikalischen und wahrnehmungsbasierten Qualität von generierter menschlicher Bewegung, das durch eine physikalische Labelierungsmethode mit feinkörnigen, kontinuierlichen Annotationen die Lücke zwischen physikalischer Machbarkeit und menschlicher Wahrnehmung schließt.

Sihan Zhao, Zixuan Wang, Tianyu Luan + 5 more2026-02-20💻 cs

Bongard-RWR+: Real-World Representations of Fine-Grained Concepts in Bongard Problems

Die Arbeit stellt Bongard-RWR+ vor, einen um 5.400 Instanzen erweiterten Datensatz für Bongard-Probleme, der mithilfe eines Vision-Language-Model-Pipelines realistische Bilder generiert, um die Fähigkeit von Modellen zum Erkennen feingranularer Konzepte zu testen und dabei deren aktuelle Grenzen in der abstrakten visuellen Reasoning aufzuzeigen.

Szymon Pawlonka, Mikołaj Małkiński, Jacek Mańdziuk2026-02-20🤖 cs.AI

PyRadiomics-cuda: 3D features extraction from medical images for HPC using GPU acceleration

PyRadiomics-cuda ist eine GPU-beschleunigte Erweiterung der PyRadiomics-Bibliothek, die durch die Verlagerung geometrischer Berechnungen auf Grafikkarten die Extraktion dreidimensionaler Merkmale aus medizinischen Bildern für Hochleistungsrechner und Alltagsgeräte erheblich beschleunigt, dabei die volle API-Kompatibilität bewahrt und somit nahtlos in bestehende KI-Workflows integriert werden kann.

Jakub Lisowski, Piotr Tyrakowski, Szymon Zyguła + 1 more2026-02-20💻 cs