Fuse4Seg: Image Fusion for Multi-Modal Medical Segmentation via Bi-level Optimization

Dit paper introduceert Fuse4Seg, een nieuw raamwerk dat multi-modale medische beeldfusie herformuleert als een bi-niveau optimalisatieprobleem dat wordt geleid door semantische gradiënten van downstream segmentatie, waardoor kritieke tumorgrenzen behouden blijven en de prestaties van bestaande methoden worden overtroffen terwijl de klinische interpreteerbaarheid wordt gewaarborgd.

Yuchen Guo, Junli Gong, Hongmin Cai, Yiu-ming Cheung, Weifeng Su2026-03-09💻 cs

AuthFace: Towards Authentic Blind Face Restoration with Face-oriented Generative Diffusion Prior

AuthFace is een nieuw raamwerk dat authentieke blind gezichtsherstel bereikt door een op gezichten gerichte generatieve diffusielaag te ontwikkelen via een met fotografen begeleid fijnstelfase op een dataset van 8K-beelden, waardoor onjuiste generaties worden voorkomen en de details van gezichten aanzienlijk worden verbeterd.

Guoqiang Liang, Qingnan Fan, Bingtao Fu, Jinwei Chen, Hong Gu, Lin Wang2026-03-09💻 cs

FeatureGS: Eigenvalue-Feature Optimization in 3D Gaussian Splatting for Geometrically Accurate and Artifact-Reduced Reconstruction

FeatureGS introduceert een nieuwe geometrische verliesfunctie op basis van eigenwaarde-afgeleide 3D-vormkenmerken in 3D Gaussian Splatting, wat leidt tot een aanzienlijke verbetering in geometrische nauwkeurigheid, een drastische reductie van het aantal Gaussians en onderdrukking van artefacten, terwijl de fotometrische renderkwaliteit behouden blijft.

Miriam Jäger, Markus Hillemann, Boris Jutzi2026-03-09💻 cs

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Deze survey biedt een gestructureerd overzicht van hoe grote multimodale taalmodellen het wetenschappelijke proces transformeren door onderzoekers te ondersteunen bij literatuuronderzoek, het genereren van ideeën, experimenten, contentcreatie en evaluatie, terwijl het ook de methoden, beperkingen en ethische risico's van deze AI-gestuurde ontdekkingen belicht.

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Dit artikel introduceert een reeks tests op basis van psychofysische metingen van laag-niveau visie om bestaande beeld- en videokwaliteitsmetrieken te evalueren op hun vermogen om aspecten zoals contrastgevoeligheid en contrastmaskering te modelleren, en toont aan dat deze tests eigenschappen blootleggen die met standaardprotocollen vaak onopgemerkt blijven.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. Mantiuk2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

In dit paper presenteren de auteurs FindAnything, een efficiënt open-wereld mapping-framework dat visueel-taalinformatie op objectniveau integreert in volumetrische submaps, waardoor robots real-time semantische en geometrische kaarten kunnen bouwen van grote, onbekende omgevingen met beperkte rekenkracht.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI