SUREON: A Benchmark and Vision-Language-Model for Surgical Reasoning

Dit paper introduceert SUREON, een groot schaalbaar dataset en twee gespecialiseerde vision-language-modellen die chirurgische redeneervaardigheden verbeteren door gebruik te maken van narraties uit academische video's om vragen over veiligheidsbeoordeling, beslissingsrationalisatie en voorspelling te beantwoorden.

Alejandra Perez, Anita Rau, Lee White, Busisiwe Mlambo, Chinedu Nwoye, Muhammad Abdullah Jamal, Omid Mohareri2026-03-09🤖 cs.AI

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

SCOPE introduceert een plug-and-play framework dat bestaande 3D-segmentatiemethoden verbetert door ongelabelde achtergrondinformatie te benutten voor het verrijken van prototypes, waardoor nieuwe categorieën effectief kunnen worden geleerd met weinig annotaties en zonder vergeten van eerder geleerde kennis.

Vishal Thengane, Zhaochong An, Tianjin Huang, Son Lam Phung, Abdesselam Bouzerdoum, Lu Yin, Na Zhao, Xiatian Zhu2026-03-09🤖 cs.LG

Seeing Through Uncertainty: A Free-Energy Approach for Real-Time Perceptual Adaptation in Robust Visual Navigation

Dit paper introduceert FEP-Nav, een biologisch geïnspireerd raamwerk dat robots in staat stelt om real-time perceptuele adaptatie te realiseren voor robuuste visuele navigatie onder onzekere omstandigheden door het minimaliseren van variationale vrije energie via een dual-mechanisme van top-down decoding en adaptieve normalisatie.

Maytus Piriyajitakonkij, Rishabh Dev Yadav, Mingfei Sun + 2 more2026-03-06💻 cs

Noise2Ghost: Self-supervised deep convolutional reconstruction for ghost imaging

Dit artikel introduceert Noise2Ghost, een zelftoezichtende diepe leer-methode voor ghost imaging die ongeëvenaarde reconstructiekwaliteit biedt bij ruisige data zonder behoefte aan schone referentiebeelden, waardoor het ideaal is voor toepassingen in lage-lichtscenario's zoals röntgenfluorescentie-imaging van gevoelige biologische en batterijmonsters.

Mathieu Manni, Dmitry Karpov, K. Joost Batenburg + 2 more2026-03-06🔬 physics

PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing

Dit paper introduceert PhysLLM, een innovatief raamwerk dat Large Language Models combineert met domeinspecifieke rPPG-componenten via strategieën zoals Text Prototype Guidance en Dual-Domain Stationary, om nauwkeurige en robuuste niet-contact fysiologische metingen te realiseren ondanks uitdagingen zoals veranderingen in verlichting en bewegingsartefacten.

Yiping Xie, Bo Zhao, Mingtong Dai + 6 more2026-03-06💻 cs