cs papers | Gist.Science

Decomposing Physician Disagreement in HealthBench

Deze studie onthult dat de meeste discrepanties tussen artsen in de HealthBench-evaluatie structureel zijn en niet door bestaande metadata verklaard kunnen worden, maar wel dat het onderscheid tussen herleidbare en onherleidbare onzekerheid inzicht biedt in hoe evaluatieontwerp kan worden verbeterd.

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval

WISER is een trainingsvrij framework voor Zero-Shot Composed Image Retrieval dat door middel van een adaptieve "retrieve-verify-refine"-pijplijn de complementaire sterkten van tekst- en beeldgebaseerde zoekopdrachten combineert om de prestaties aanzienlijk te verbeteren zonder extra training.

Tianyue Wang, Leigang Qu, Tianyu Yang, Xiangzhao Hao, Yifan Xu, Haiyun Guo, Jinqiao Wang2026-03-10💻 cs

PackUV: Packed Gaussian UV Maps for 4D Volumetric Video

Het paper introduceert PackUV, een nieuwe 4D-volumetrische videorepresentatie die Gaussische attributen omzet in gestructureerde UV-atlassen voor compatibiliteit met bestaande video-codecs, ondersteund door de PackUV-GS-fittingmethode en het grote PackUV-2B-dataset om hoge kwaliteit en temporale consistentie te garanderen bij langdurige opnames.

Aashish Rai, Angela Xing, Anushka Agarwal, Xiaoyan Cong, Zekun Li, Tao Lu, Aayush Prakash, Srinath Sridhar2026-03-10💻 cs

On Sample-Efficient Generalized Planning via Learned Transition Models

Deze paper toont aan dat het formuleren van gegeneraliseerd plannen als het leren van een expliciet transitiemodel, in plaats van directe actie-voorspelling, leidt tot betere generalisatie en hogere sample-efficiëntie met kleinere modellen.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Annotation-Free Visual Reasoning for High-Resolution Large Multimodal Models via Reinforcement Learning

Dit paper introduceert HART, een annotatievrij framework dat Large Multimodal Models via versterkingsleer in staat stelt om zonder menselijke labels effectief te redeneren over hoge-resolutie beelden door zelfkritische focus op relevante beeldregio's.

Jiacheng Yang, Anqi Chen, Yunkai Dang, Qi Fan, Cong Wang, Wenbin Li, Feng Miao, Yang Gao2026-03-10💻 cs

PEPA: a Persistently Autonomous Embodied Agent with Personalities

Dit artikel introduceert PEPA, een cognitieve architectuur voor een fysieke agent die door middel van persoonlijkheidstrekken en een driedelig systeem autonoom doelen genereert en gedrag aanpast, waardoor het zonder externe instructies langdurig en zelfstandig kan opereren in dynamische omgevingen.

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

Self-Attention And Beyond the Infinite: Towards Linear Transformers with Infinite Self-Attention

Dit paper introduceert Infinite Self-Attention (InfSA) en zijn lineaire variant Linear-InfSA, die de kwadratische complexiteit van traditionele attention-mechanismen doorbreken door attention te modelleren als een diffusieproces op een token-graf, waardoor schaalbare en energie-efficiënte Vision Transformers mogelijk worden die zelfs bij zeer hoge resoluties (tot 9216x9216) stabiel presteren en betere ImageNet-resultaten behalen dan bestaande softmax-baselines.

Giorgio Roffo, Luke Palmer2026-03-10💻 cs

WildActor: Unconstrained Identity-Preserving Video Generation

Dit paper introduceert WildActor, een framework voor het genereren van video's met menselijke acteurs die hun volledige lichaamidentiteit behouden onder onbeperkte bewegingen en camerahoeken, ondersteund door de nieuwe grote dataset Actor-18M.

Qin Guo, Tianyu Yang, Xuanhua He, Fei Shen, Yong Zhang, Zhuoliang Kang, Xiaoming Wei, Dan Xu2026-03-10💻 cs

Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

Dit standpuntspaper pleit ervoor dat de evaluatie van moderne visuele verwerkingssystemen minder gericht moet zijn op enkele objectieve beeldkwaliteitsmetrieken en meer op menselijke perceptie en context om innovatie te stimuleren en onderzoek te sturen.

Jinfan Hu, Fanghua Yu, Zhiyuan You, Xiang Yin, Hongyu An, Xinqi Lin, Chao Dong, Jinjin Gu2026-03-10💻 cs

Sustainable Care: Designing Technologies That Support Children's Long-Term Engagement with Social Issues

Deze workshop introduceert 'duurzame zorg' als een ontwerplens om technologieën te creëren die kinderen ondersteunen in een langdurige, betekenisvolle betrokkenheid bij sociale vraagstukken, zonder dat dit leidt tot empathische distress of uitputting.

JaeWon Kim, Aayushi Dangol, Rotem Landesman, Alexis Hiniker, McKenna F. Parnes2026-03-10💻 cs

DeAR: Fine-Grained VLM Adaptation by Decomposing Attention Head Roles

Het artikel introduceert DeAR, een raamwerk dat VLM-adaptatie verbetert door de rollen van individuele attention heads te ontleden en te isoleren, waardoor een betere balans wordt bereikt tussen taakspecifieke aanpassing en het behoud van de oorspronkelijke generalisatie.

Yiming Ma, Hongkun Yang, Lionel Z. Wang, Bin Chen, Weizhi Xian, Jianzhi Teng2026-03-10💻 cs

Digital Twin-Based Cooling System Optimization for Data Center

Dit artikel presenteert een gevalideerde digitale tweeling van het koelsysteem van de Frontier-supercomputer die aantoont dat een gelaagd optimalisatiekader, dat zowel het debiet als de aanvoertemperatuur co-optimaliseert binnen de beperkingen van de actuatoren, de totale energieverbruik met 27,8% kan reduceren.

Shrenik Jadhav, Zheng Liu2026-03-10💻 cs

Extended Empirical Validation of the Explainability Solution Space

Dit technische rapport bevestigt de generaliseerbaarheid van het Explainability Solution Space (ESS)-kader door middel van een uitgebreide cross-domein validatie die de oorspronkelijke toepassing op personeelsverloop uitbreidt naar een heterogeen intelligent stedelijk hulpbronnensysteem, waarbij wordt aangetoond dat ESS-rangschikkingen systematisch aanpassen aan governance-rollen en stakeholderconfiguraties in plaats van domeinspecifiek te zijn.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Energy Efficient Traffic Scheduling For Optical LEO Satellite Downlinks

Dit artikel presenteert statische en adaptieve schema's voor energie-efficiënte verkeersplanning in optische LEO-satellietdownlinks, waarbij wordt vastgesteld dat adaptieve technieken, ondanks hun hogere complexiteit, een betere leveringsratio bieden onder dynamische weersomstandigheden dan statische methoden.

Ethan Fettes, Pablo G. Madoery, Halim Yanikomeroglu, Gunes Karabulut Kurt, Abhishek Naik, Stéphane Martel2026-03-10💻 cs

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

HarmonyCell is een end-to-end agentframework dat single-cell perturbatiestudies automatiseert door semantische heterogeniteit op te lossen met een door LLM-aangedreven semantic unifier en statistische heterogeniteit aan te pakken met een adaptieve Monte Carlo Tree Search-engine, waardoor schaalbaar virtueel celmodelleren mogelijk wordt zonder dataset-specifieke engineering.

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

Dit paper introduceert een nieuw LLM-gedreven raamwerk dat semantische opties ontdekt om de data-efficiëntie, interpreteerbaarheid en overdraagbaarheid van Deep Reinforcement Learning te verbeteren door natuurlijke taal instructies om te zetten in uitvoerbare regels.

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

MSP-ReID: Hairstyle-Robust Cloth-Changing Person Re-Identification

Dit paper introduceert het MSP-framework, dat de prestaties van kledingwisselende persoonhervindingsystemen verbetert door de afhankelijkheid van veranderlijke haarkleuren te verminderen via hairstyle-georiënteerde augmentatie en structuurbehoudende verbergingstechnieken.

Xiangyang He, Lin Wan2026-03-10💻 cs

DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting

Dit onderzoek evalueert DINOv3 als een bevroren visuele ruggengraat voor blauwe bessen-oogsttaken en concludeert dat het model, hoewel zeer effectief voor segmentatie, beperkingen vertoont bij detectie en clusterherkenning vanwege schaalvariatie en ruimtelijke aggregatie, waardoor het vooral waardevol is als semantische basis die moet worden aangevuld met specifieke ruimtelijke modellering.

Rui-Feng Wang, Daniel Petti, Yue Chen, Changying Li2026-03-10💻 cs

Event-Driven Safe and Resilient Control of Automated and Human-Driven Vehicles under EU-FDI Attacks

Dit artikel presenteert een event-gedreven, veilig en veerkrachtig besturingskader dat Control Barrier Functions en Control Lyapunov Functions integreert met adaptieve aanvalsbestendigheid en datagedreven schattingen om Connected and Automated Vehicles veilig te laten opereren in gemengd verkeer onder blootstelling aan exponentieel onbegrensde valse-data-injectie-aanvallen.

Yi Zhang, Yichao Wang, Wei Xiao, Mohamadamin Rajabinezhad, Shan Zuo2026-03-10💻 cs

Generalized Per-Agent Advantage Estimation for Multi-Agent Policy Optimization

Dit artikel presenteert een nieuw framework voor multi-agent versterkingsleren genaamd GPAE, dat de steekproefefficiëntie en coördinatie verbetert door nauwkeurige per-agent voordeelsschattingen te berekenen via een per-agent waarde-iteratieoperator en een dubbel-getruncateerde importance sampling-ratio, waardoor directe Q-functieschatting overbodig wordt en stabiel off-policy leren mogelijk is.

Seongmin Kim, Giseung Park, Woojun Kim, Jiwon Jeon, Seungyul Han, Youngchul Sung2026-03-10💻 cs

← Vorige Volgende →