cs papers | Gist.Science

Multi-Order Matching Network for Alignment-Free Depth Super-Resolution

Deze paper introduceert MOMNet, een nieuw raamwerk voor dieptedetailverbetering dat zonder strikte ruimtelijke uitlijning tussen RGB- en dieptedata presteert door middel van een multi-orde matching- en aggregatiemechanisme, waardoor het robuust is tegen misalignement in real-world scenario's.

Zhengxue Wang, Zhiqiang Yan, Yuan Wu, Guangwei Gao, Xiang Li, Jian Yang2026-03-10💻 cs

Learning to Think Fast and Slow for Visual Language Models

Dit paper introduceert DualMindVLM, een visueel taalmodel dat een efficiënt dual-systeem denkmechanisme implementeert door automatisch te kiezen tussen snelle en langzame redenering op basis van probleemcomplexiteit, wat leidt tot state-of-the-art prestaties met minder tokenverspilling.

Chenyu Lin, Cheng Chi, Jinlin Wu, Sharon Li, Kaiyang Zhou2026-03-10💻 cs

Radiative-Structured Neural Operator for Continuous and Extrapolative Spectral Super-Resolution

Dit artikel introduceert de Radiative-Structured Neural Operator (RSNO), een nieuwe diepe leer-methode die fysisch consistente, continue spectrale super-resolutie bereikt door multispectrale beelden om te zetten in hyperspectrale beelden via een driestapsproces met hoek-consistente projectie.

Ziye Zhang, Bin Pan, Zhenwei Shi2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

Deze paper introduceert UnfoldLDM, een diep-ontvouwing-gebaseerd raamwerk dat latent diffusion-priors integreert om blind beeldherstel te verbeteren door degradatie-afhankelijkheid en oververvaging aan te pakken via een multi-granulariteitsmodule en een degradatie-resistente transformer.

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Privacy Concerns and ChatGPT: Exploring Online Discourse through the Lens of Information Practice on Reddit

Deze studie analyseert hoe Reddit-gebruikers tussen november 2022 en mei 2025 collectief omgaan met privacybezorgdheid rondom ChatGPT door middel van risicosignaleren, het stellen van normen en het delen van strategieën voor privacybehoud.

S M Mehedi Zaman, Saubhagya Joshi, Yiyi Wu2026-03-10💻 cs

Stable Multi-Drone GNSS Tracking System for Marine Robots

Deze paper presenteert een stabiel multi-drone GNSS-tracking-systeem voor maritieme robots dat, door middel van visuele detectie, multi-object tracking, triangulatie en een confidence-gewogen Extended Kalman Filter, nauwkeurige positiebepaling mogelijk maakt op het wateroppervlak en net daaronder.

Shuo Wen, Edwin Meriaux, Mariana Sosa Guzmán, Zhizun Wang, Junming Shi, Gregory Dudek2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Dit paper introduceert Yo'City, een nieuw agentisch kader dat gebruikmaakt van grote modellen voor top-down planning en een iteratief verfijningsproces om gepersonaliseerde, onbeperkt uitbreidbare en realistische 3D-stadsscènes te genereren die de huidige state-of-the-art-methoden overtreffen.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

DOPD is een dynamisch systeem voor het uitvoeren van LLM-inferentie dat de verhouding tussen voorafvul- en decoderingsinstanties aanpast op basis van real-time belasting om onbalans in heterogene werklasten op te lossen en zo de goodput en SLO-ervaring aanzienlijk verbetert ten opzichte van bestaande oplossingen.

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

Sublinear Edge Fault Tolerant Spanners for Hypergraphs

Deze paper introduceert het onderzoek naar fouttolerante spanners in hypergrafieken en presenteert een snellend, op clustering gebaseerd algoritme dat sublineaire rand-fouttolerante hyperspanners construeert, terwijl het ook een ondergrens voor de grootte ervan vaststelt.

Jialin He, Nicholas Popescu, Chunjiang Zhu2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

Dit artikel presenteert een LLM-ondersteund multi-agent framework dat de ontwerp- en aanpassingsprocessen van roll-to-roll productiesystemen automatiseert door middel van vijf fasen, waaronder systeemidentificatie en veiligheidsverificatie, wat leidt tot efficiëntere spanningsregeling en minder handmatig instelwerk.

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs

RadDiff: Retrieval-Augmented Denoising Diffusion for Protein Inverse Folding

Het paper introduceert RadDiff, een nieuwe methode voor eiwit-inverse vouwing die door middel van een op retrievals gebaseerd mechanisme en een kennisbewust diffusion-model de prestaties van bestaande methoden verbetert door tot 19% hogere sequentierecovery-rates te bereiken.

Jin Han, Tianfan Fu, Wu-Jun Li2026-03-10💻 cs

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

Dit artikel introduceert een raamwerk voor voorschrijvend onderhoud dat een causaal fundamenteel model integreert om als 'wat-als'-simulator te fungeren, waardoor de oorzaken van productiefouten niet alleen worden voorspeld maar ook begrepen en geoptimaliseerd kunnen worden via gerichte interventies om de algehele apparaateffectiviteit te verhogen.

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

S2AM3D: Scale-controllable Part Segmentation of 3D Point Cloud

Deze paper introduceert S2AM3D, een schaalcontroleerbaar model voor part-segmentatie van 3D-puntenwolken dat 2D-segmentatiepriors combineert met 3D-consistente supervisie en een nieuw groot dataset om robuuste en aanpasbare segmentatie van complexe structuren te bereiken.

Han Su, Tianyu Huang, Zichen Wan, Xiaohe Wu, Wangmeng Zuo2026-03-10💻 cs

Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA

Dit paper introduceert CAEC, een systeem dat op Arm CCA is gebaseerd en beveiligd geheugendelen tussen Confidential Virtual Machines (CVMs) mogelijk maakt zonder de hypervisor, waardoor de prestaties van inter-CVM-communicatie aanzienlijk worden verbeterd ten opzichte van traditionele encryptiemethoden.

Sina Abdollahi, Amir Al Sadi, Marios Kogias, David Kotz, Hamed Haddadi2026-03-10💻 cs

HiconAgent: History Context-aware Policy Optimization for GUI Agents

HiconAgent is een nieuwe GUI-agent die met de History Context-aware Policy Optimization (HCPO) methode, bestaande uit Dynamische Context Sampling en Anker-gestuurde Historiecompressie, historische context efficiënter gebruikt dan bestaande modellen, wat leidt tot betere prestaties en aanzienlijke reducties in rekenkosten.

Xurui Zhou, Gongwei Chen, Yuquan Xie, Zaijing Li, Kaiwen Zhou, Shuai Wang, Shuo Yang, Zhuotao Tian, Rui Shao2026-03-10💻 cs

MAViD: A Multimodal Framework for Audio-Visual Dialogue Understanding and Generation

In dit paper wordt MAViD voorgesteld, een innovatief multimodaal raamwerk met een Conductor-Creator-architectuur dat geïntegreerde audio-visual dialogue-understanding en -generatie mogelijk maakt door autoregressieve en diffusiemodellen te combineren voor het creëren van levendige, contextueel samenhangende en langdurige interacties.

Youxin Pang, Jiajun Liu, Lingfeng Tan, Yong Zhang, Feng Gao, Xiang Deng, Zhuoliang Kang, Xiaoming Wei, Yebin Liu2026-03-10💻 cs

When Token Pruning is Worse than Random: Understanding Visual Token Information in VLLMs

Deze paper introduceert het concept van een "informatiehorizon" in Vision Large Language Models, waarbij visuele tokens in diepere lagen hun relevantie verliezen en willekeurige pruning in deze lagen de inferentie-efficiëntie aanzienlijk verbetert zonder de prestaties te schaden.

Yahong Wang, Juncheng Wu, Zhangkai Ni, Longzhen Yang, Yihang Liu, Chengmei Yang, Ying Wen, Lianghua He, Xianfeng Tang, Hui Liu, Yuyin Zhou2026-03-10💻 cs

IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams

Deze studie toont aan dat een standaard IPPO-basismodel in heterogene multi-agentomgevingen net zo goed generaliseert naar nieuwe teamgenoten als een complexere Rotating Policy Training-methode, wat suggereert dat de agents de onderliggende spelmechanismen en niet de specifieke teamgenootgedragingen hebben geleerd.

Ryan LeRoy, Jack Kolb2026-03-10💻 cs

Beyond Endpoints: Path-Centric Reasoning for Vectorized Off-Road Network Extraction

Deze paper introduceert MaGRoad, een padgerichte methode voor robuuste extractie van wegnetwerken in off-road omgevingen, en presenteert tegelijkertijd het WildRoad-dataset om de bestaande beperkingen van bestaande modellen op te lossen.

Wenfei Guan, Jilin Mei, Tong Shen, Xumin Wu, Shuo Wang, Chen Min, Yu Hu2026-03-10💻 cs

ReMeDI: Refined Memory for Disambiguation of Identities with SAM3 in Surgical Segmentation

Het paper introduceert ReMeDI-SAM3, een trainingsvrije uitbreiding van SAM3 die door middel van relevante geheugenfiltering, interpolatie en tijdsgebonden re-identificatie de nauwkeurigheid van chirurgische instrumentsegmentatie in endoscopie significant verbetert, zelfs bij frequente occlusies.

Valay Bundele, Mehran Hosseinzadeh, Hendrik P. A. Lensch2026-03-10💻 cs

← Vorige Volgende →