Suppression or Deletion: A Restoration-Based Representation-Level Analysis of Machine Unlearning

Diese Arbeit stellt fest, dass die meisten bestehenden Methoden zum maschinellen Vergessen sensitive Informationen nur auf Entscheidungsebene unterdrücken, aber auf Repräsentationsebene erhalten bleiben, was durch ein neuartiges, auf Sparse Autoencodern basierendes Analyseframework nachgewiesen wird und die Notwendigkeit neuer Evaluierungsrichtlinien unterstreicht.

Yurim Jang, Jaeung Lee, Dohyun Kim + 2 more2026-02-24💻 cs

Sketch2Feedback: Grammar-in-the-Loop Framework for Rubric-Aligned Feedback on Student STEM Diagrams

Die Arbeit stellt Sketch2Feedback vor, ein Grammar-in-the-Loop-Framework für STEM-Diagramme, das durch die Kombination von symbolischer Regelprüfung und multimodalen Modellen hallucinationsarmes, rubrikkonformes Feedback liefert, wobei die Evaluation auf synthetischen Daten zeigt, dass dieser Ansatz zwar die Halluzinationsraten senkt und die Handlungsfähigkeit des Feedbacks verbessert, jedoch eine komplexe Abwägung zwischen Genauigkeit und Robustheit bei verschiedenen Diagrammtypen erfordert.

Aayam Bansal2026-02-24🤖 cs.AI

JAEGER: Joint 3D Audio-Visual Grounding and Reasoning in Simulated Physical Environments

Die Arbeit stellt JAEGER vor, ein Framework, das Audio-Visual-Large-Language-Modelle durch die Integration von RGB-D-Daten und mehrkanaliger Ambisonics-Audio sowie einer neuartigen neuronalen Intensitätsvektor-Darstellung auf den 3D-Raum erweitert, um eine robuste räumliche Verankerung und Schlussfolgerung in physikalischen Umgebungen zu ermöglichen.

Zhan Liu, Changli Tang, Yuxin Wang + 7 more2026-02-24🤖 cs.AI

Image-Based Classification of Olive Varieties Native to Turkiye Using Multiple Deep Learning Architectures: Analysis of Performance, Complexity, and Generalization

Diese Studie vergleicht zehn Deep-Learning-Architekturen zur Bildklassifizierung von fünf türkischen Olivensorten und zeigt, dass unter begrenzten Datenbedingungen parametrische Effizienz entscheidender ist als reine Modelltiefe, wobei EfficientNetV2-S die höchste Genauigkeit und EfficientNetB0 den besten Kompromiss zwischen Leistung und Rechenaufwand bietet.

Hatice Karatas, Irfan Atabas2026-02-24💻 cs

BloomNet: Exploring Single vs. Multiple Object Annotation for Flower Recognition Using YOLO Variants

Diese Studie stellt den neuen FloralSix-Datensatz vor und zeigt, dass YOLOv8m und YOLOv12n unter Verwendung des SGD-Optimierers je nach Annotierungsdichte (einzelne vs. mehrere Bounding-Boxen) und Umgebungsbedingungen (isoliert vs. dicht) unterschiedlich optimiert sind, um die präzise Blumenerkennung für landwirtschaftliche Anwendungen zu verbessern.

Safwat Nusrat, Prithwiraj Bhattacharjee2026-02-24🤖 cs.AI

Narrating For You: Prompt-guided Audio-visual Narrating Face Generation Employing Multi-entangled Latent Space

Die Arbeit stellt einen neuartigen Ansatz vor, der aus einem statischen Bild, einer Sprachprofil- und einem Zieltext realistische sprechende Gesichter und Stimmen erzeugt, indem ein multi-verflochtener latenter Raum genutzt wird, um die räumlich-zeitlichen, personenbezogenen Merkmale zwischen den Audio- und Videomodaliäten zu verknüpfen.

Aashish Chandra, Aashutosh A, Abhijit Das2026-02-24💻 cs