Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Dit artikel introduceert een reeks tests op basis van psychofysische metingen van laag-niveau visie om bestaande beeld- en videokwaliteitsmetrieken te evalueren op hun vermogen om aspecten zoals contrastgevoeligheid en contrastmaskering te modelleren, en toont aan dat deze tests eigenschappen blootleggen die met standaardprotocollen vaak onopgemerkt blijven.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. Mantiuk2026-03-09💻 cs

FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment

In dit paper presenteren de auteurs FindAnything, een efficiënt open-wereld mapping-framework dat visueel-taalinformatie op objectniveau integreert in volumetrische submaps, waardoor robots real-time semantische en geometrische kaarten kunnen bouwen van grote, onbekende omgevingen met beperkte rekenkracht.

Sebastián Barbas Laina, Simon Boche, Sotiris Papatheodorou, Simon Schaefer, Jaehyung Jung, Helen Oleynikova, Stefan Leutenegger2026-03-09🤖 cs.AI

Instance Data Condensation for Image Super-Resolution

Dit artikel introduceert een nieuw kaders voor instantiegegevenscondensatie (IDC) dat specifiek is ontworpen voor beeldsuperresolutie en dat, door gebruik te maken van willekeurige lokale Fourier-kenmerkextractie en multi-niveau kenmerkverdelingmatching, een synthetische dataset van slechts 10% van de oorspronkelijke DIV2K-dataset genereert die vergelijkbare prestaties en trainingsstabiliteit bereikt als het volledige dataset.

Tianhao Peng, Ho Man Kwan, Yuxuan Jiang, Ge Gao, Fan Zhang, Xiaozhong Xu, Shan Liu, David Bull2026-03-09💻 cs

SPARC: Concept-Aligned Sparse Autoencoders for Cross-Model and Cross-Modal Interpretability

Dit paper introduceert SPARC, een raamwerk dat met behulp van een globale TopK-sparsiteitsmechanisme en een kruisreconstructieverlies een gedeelde, semantisch consistente latente ruimte creëert voor concepten over verschillende AI-modellen en -modaliteiten heen, waardoor directe vergelijking en nieuwe toepassingen zoals tekst-gestuurde lokalisatie mogelijk worden.

Ali Nasiri-Sarvi, Hassan Rivaz, Mahdi S. Hosseini2026-03-09🤖 cs.AI

ExDD: Explicit Dual Distribution Learning for Surface Defect Detection via Diffusion Synthesis

ExDD is een nieuw kader voor de detectie van oppervlakdefecten dat de beperkingen van traditionele one-class methoden overwint door expliciete modellering van dubbele verdelingen, het genereren van synthetische defecten via latent diffusion en een geavanceerde scoremechanisme, wat resulteert in verbeterde prestaties op industriële datasets.

Muhammad Aqeel, Federico Leonardi, Francesco Setti2026-03-09🤖 cs.AI

MAP: Mitigating Hallucinations in Large Vision-Language Models with Map-Level Attention Processing

Deze paper introduceert MAP, een trainingsvrije decoderingsmethode die hallucinaties in grote visueel-taalmodellen vermindert door de verborgen toestanden te interpreteren als een 2D-semantische kaart en deze te verwerken via kruisgewijze attentie en logit-fusie om de feitelijke consistentie te verbeteren.

Chenxi Li, Yichen Guo, Benfang Qian, Jinhao You, Kai Tang, Yaosong Du, Zonghao Zhang, Xiande Huang2026-03-09🤖 cs.AI