SHIELD8-UAV: Sequential 8-bit Hardware Implementation of a Precision-Aware 1D-F-CNN for Low-Energy UAV Acoustic Detection and Temporal Tracking

Die Arbeit stellt SHIELD8-UAV vor, einen energieeffizienten, sequentiellen 8-Bit-Hardware-Beschleuniger für eine 1D-F-CNN, der durch schichtsensitives Quantisieren und strukturiertes Beschneiden eine präzise UAV-Akustikdetektion und -verfolgung mit geringem Leistungsbedarf und geringer Latenz auf FPGA- und ASIC-Ebene ermöglicht.

Susmita Ghanta, Karan Nathwani, Rohit Chaurasiya2026-03-03⚡ eess

Differential privacy representation geometry for medical image analysis

Die Arbeit stellt DP-RGMI vor, ein Framework zur Analyse des Einflusses von Differential Privacy auf medizinische Bilddaten, das Leistungseinbußen durch die Zerlegung in geometrische Verschiebungen des Repräsentationsraums und eine Nutzungslücke zwischen linearer und end-to-end-Verarbeitung erklärt, anstatt nur die Endleistung zu bewerten.

Soroosh Tayebi Arasteh, Marziyeh Mohammadi, Sven Nebelung + 1 more2026-03-03🤖 cs.LG

Egocentric Co-Pilot: Web-Native Smart-Glasses Agents for Assistive Egocentric AI

Die Arbeit stellt „Egocentric Co-Pilot" vor, ein web-natives, neuro-symbolisches Framework für Smart-Glasses, das mittels eines LLM-gesteuerten Agenten mit multimodaler Eingabe und effizientem Kontextmanagement eine assistive, kontextbewusste KI für den Alltag bietet und dabei durch Cloud-Integration sowie lokale Baselines optimierte Latenz und Mobilität demonstriert.

Sicheng Yang, Yukai Huang, Weitong Cai + 8 more2026-03-03🤖 cs.AI

GroundedSurg: A Multi-Procedure Benchmark for Language-Conditioned Surgical Tool Segmentation

Das Paper stellt GroundedSurg vor, den ersten Benchmark für sprachbasierte Instanzsegmentierung chirurgischer Instrumente, der durch die Verknüpfung von Bildern mit natürlichen Sprachbeschreibungen und präzisen räumlichen Annotationen über verschiedene Eingriffstypen hinweg eine realistischere Evaluierung von KI-Systemen für die klinische intraoperative Assistenz ermöglicht.

Tajamul Ashraf, Abrar Ul Riyaz, Wasif Tak + 4 more2026-03-03💻 cs

ClinCoT: Clinical-Aware Visual Chain-of-Thought for Medical Vision Language Models

Das Paper stellt ClinCoT vor, einen klinisch bewussten visuellen Chain-of-Thought-Ansatz, der durch eine automatisierte Datengenerierung und eine margin-basierte Optimierung von Präferenzpaaren medizinische Vision-Language-Modelle trainiert, um Halluzinationen zu reduzieren und die faktenbasierte Begründung auf visuelle pathologische Befunde zu stärken.

Xiwei Liu, Yulong Li, Xinlin Zhuang + 5 more2026-03-03🤖 cs.AI

Predictive Reasoning with Augmented Anomaly Contrastive Learning for Compositional Visual Relations

Die Arbeit stellt PR-A2^2CL vor, ein neues Framework, das durch augmentiertes Anomalie-Kontrastives Lernen und einen vorhersagebasierten Verifizierungsansatz mit iterativen PARB-Modulen die komplexe Aufgabe der Zusammensetzung visueller Relationen (CVR) durch die Identifizierung von Ausreißern löst und dabei den aktuellen Stand der Technik auf mehreren Datensätzen deutlich übertrifft.

Chengtai Li, Yuting He, Jianfeng Ren + 4 more2026-03-03🤖 cs.AI

Teacher-Guided Causal Interventions for Image Denoising: Orthogonal Content-Noise Disentanglement in Vision Transformers

Die vorgestellte Arbeit stellt TCD-Net vor, ein auf Vision-Transformern basierendes Bildentstörungsnetzwerk, das durch kausale Interventionen, eine Umgebungsverzerrungsanpassung und eine orthogonale Trennung von Inhalt und Rauschen – unterstützt durch das KI-Modell Nano Banana Pro – eine überlegene Leistung bei gleichzeitiger Echtzeitverarbeitung erreicht.

Kuai Jiang, Zhaoyan Ding, Guijuan Zhang + 2 more2026-03-03💻 cs

TC-SSA: Token Compression via Semantic Slot Aggregation for Gigapixel Pathology Reasoning

Die Arbeit stellt TC-SSA vor, einen lernbaren Token-Kompressionsansatz mittels semantischer Slot-Aggregation, der die rechenintensive Verarbeitung gigapixelgroßer Pathologiebilder effizient löst, indem diagnostisch relevante Informationen in einer stark reduzierten Token-Anzahl zusammengefasst werden, ohne dabei die diagnostische Genauigkeit zu beeinträchtigen.

Zhuo Chen, Shawn Young, Lijian Xu2026-03-03🤖 cs.AI