ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging

Deze paper introduceert ASMIL, een nieuw raamwerk voor multiple instance learning dat door het gebruik van een ankermodel, een genormaliseerde sigmoid-functie en willekeurige token-dropping de instabiele attentiedynamiek, overfitting en te geconcentreerde verdelingen in de diagnose van hele slide-afbeeldingen effectief aanpakt en aanzienlijk betere prestaties levert dan bestaande methoden.

Linfeng Ye, Shayan Mohajer Hamidi, Zhixiang Chi, Guang Li, Mert Pilanci, Takahiro Ogawa, Miki Haseyama, Konstantinos N. Plataniotis2026-03-10💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

Dit hoofdstuk onderzoekt hoe generatieve kunstmatige intelligentie kan fungeren als een katalysator voor coherentie in het onderwijs, de leerprocessen en de beoordeling van wetenschappelijke geletterdheid op K-16+ niveau, terwijl het ook de conceptuele en praktische uitdagingen en de noodzakelijke architectuur voor implementatie belicht.

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam Biswas2026-03-10💻 cs

SJD-PV: Speculative Jacobi Decoding with Phrase Verification for Autoregressive Image Generation

Dit paper introduceert SJD-PV, een trainingsvrij versnellingsframework voor autoregressieve beeldgeneratie dat de inferentielatentie met tot 30% verlaagt door het gebruik van semantisch coherente visuele zinsdelen voor gezamenlijke verificatie in plaats van onafhankelijke token-verificatie.

Zhehao Yu, Baoquan Zhang, Bingqi Shan, Xinhao Liu, Dongliang Zhou, Guotao Liang, Guangming Ye, Yunming Ye2026-03-10💻 cs

Hybrid Orchestration of Edge AI and Microservices via Graph-based Self-Imitation Learning

Dit artikel introduceert SIL-GPO, een op versterkingslering gebaseerd framework dat graph attention networks en zelf-imitatielering combineert om de hybride orkestratie van edge AI en microservices te optimaliseren, waardoor de eind-tot-eind latentie aanzienlijk wordt verlaagd en de resourcebenutting in resource-beperkte randomgevingen wordt verbeterd.

Chen Yang, Jin Zheng, Yang Zhuolin, Lai Pan, Zhang Xiao, Hu Menglan, Yin Haiyan2026-03-10💻 cs

RADAR: A Multimodal Benchmark for 3D Image-Based Radiology Report Review

Dit paper introduceert RADAR, een multimodaal benchmark voor het analyseren van discrepanties in radiologierapporten door 3D-CT-beelden te koppelen aan voorlopige rapporten en voorgestelde wijzigingen, waarmee modellen worden getoetst op hun vermogen tot klinisch redeneren en beeld-taalafstemming tijdens het reviewproces.

Zhaoyi Sun, Minal Jagtiani, Wen-wai Yim, Fei Xia, Martin Gunn, Meliha Yetisgen, Asma Ben Abacha2026-03-10💻 cs

ECHO: Event-Centric Hypergraph Operations via Multi-Agent Collaboration for Multimedia Event Extraction

Het artikel introduceert ECHO, een multi-agent framework dat multimedia-evenementen extrahert door iteratief een gedeelde hypergraaf te verfijnen en een 'Link-then-Bind'-strategie toe te passen om foutpropagatie te verminderen en de prestaties aanzienlijk te verbeteren ten opzichte van de huidige stand van de techniek.

Hailong Chu, Shuo Zhang, Yunlong Chu, Shutai Huang, Xingyue Zhang, Tinghe Yan, Jinsong Zhang, Lei Li2026-03-10💻 cs

Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning

Dit paper introduceert "Narrative Weaver", een nieuw raamwerk dat door middel van een multimodaal taalmodel, een dynamisch geheugen en een progressieve trainingsstrategie langdurige visuele consistentie en narratieve coherentie in gegenereerde content mogelijk maakt, ondersteund door de introductie van het EAVSD-dataset voor e-commerce reclame.

Zhengjian Yao, Yongzhi Li, Xinyuan Gao, Quan Chen, Peng Jiang, Yanye Lu2026-03-10💻 cs