cs papers | Gist.Science

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

Deze studie introduceert de nieuwe metriek CVDLoss om de beperkte respons van diffusion-modellen op prompts voor kleurtoegankelijkheid bij kleurenblindheid systematisch te evalueren en te kwantificeren.

Xinyao Zhuang, Jose Echevarria, Kaan Aksit2026-03-11💻 cs

Gap-ETH-Tight Algorithms for Hyperbolic TSP and Steiner Tree

Deze paper presenteert Gap-ETH-tighte randomiseerde algoritmen voor het TSP en het Steiner-boomprobleem in hyperbolische ruimte, die een $(1+\varepsilon)$ -benadering bieden in tijd $2^{O(1/\varepsilon^{d-1})}n^{1+o(1)}$ door middel van een nieuwe 'hybrid hyperbolic quadtree'-decompositie en een niet-uniforme portal-plaatsing.

Sándor Kisfaludi-Bak, Saeed Odak, Satyam Singh, Geert van Wordragen2026-03-11💻 cs

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

Het paper introduceert RecThinker, een agentisch framework dat de aanbeveling transformeert van een passief proces naar een autonome verkenning door dynamische redeneringspaden te plannen en essentiële informatie actief op te halen via tools, wat resulteert in superieure aanbevelingen vergeleken met bestaande methoden.

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng Dou2026-03-11💻 cs

Almost-Optimal Upper and Lower Bounds for Clustering in Low Dimensional Euclidean Spaces

Dit paper verbetert de looptijd voor $(1+\varepsilon)$ -benaderingsalgoritmen voor $k$ -median en $k$ -means clustering in laagdimensionale Euclidische ruimtes en bewijst een bij benadering overeenkomende ondergrens onder de Gap Exponentiële Tijd Hypothese.

Vincent Cohen-Addad, Karthik C. S., David Saulpic, Chris Schwiegelshohn2026-03-11💻 cs

MissBench: Benchmarking Multimodal Affective Analysis under Imbalanced Missing Modalities

Dit paper introduceert MissBench, een benchmark en raamwerk voor multimodale affectieve analyse dat standaardiseert hoe onbalans in ontbrekende modaliteiten wordt getest, en twee nieuwe diagnostische metrieken (MEI en MLI) definieert om ongelijkheid in modale bijdrage en optimalisatie te kwantificeren.

Tien Anh Pham, Phuong-Anh Nguyen, Duc-Trong Le, Cam-Van Thi Nguyen2026-03-11💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

Dit paper introduceert een Capability Coherence System dat de structurele equivalentie tussen geheugenconsistentiemodellen en autorisatie-intrekking benut om via een Release Consistency-strategie de schaal van onbevoegde API-aanroepen tijdens revocatie onafhankelijk van agent-snelheid te beperken, wat resulteert in een tot 184-voudige reductie ten opzichte van traditionele TTL-gebaseerde methoden.

Vladyslav Parakhin2026-03-11💻 cs

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

Dit paper introduceert InternVL-U, een lichtgewicht 4B-parameter unificerend multimodaal model dat door middel van een decoupled architectuur en een op redenering gebaseerde data-pipeline superieure prestaties bereikt in begrijpen, redeneren, genereren en bewerken, terwijl het tegelijkertijd de efficiëntie en schaalbaarheid van grotere modellen overtreft.

Changyao Tian, Danni Yang, Guanzhou Chen, Erfei Cui, Zhaokai Wang, Yuchen Duan, Penghao Yin, Sitao Chen, Ganlin Yang, Mingxin Liu, Zirun Zhu, Ziqian Fan, Leyao Gu, Haomin Wang, Qi Wei, Jinhui Yin, Xue Yang, Zhihang Zhong, Qi Qin, Yi Xin, Bin Fu, Yihao Liu, Jiaye Ge, Qipeng Guo, Gen Luo, Hongsheng Li, Yu Qiao, Kai Chen, Hongjie Zhang2026-03-11💻 cs

DISPLAY: Directable Human-Object Interaction Video Generation via Sparse Motion Guidance and Multi-Task Auxiliary

Het paper introduceert DISPLAY, een raamwerk voor het genereren van controleerbare en fysiek consistente video's van mens-objectinteracties dat gebruikmaakt van een lichtgewicht, spaarzame bewegingsgids (alleen polskoordinaten en een object-boundingbox), een object-gerichte attentiemechanisme en een multi-task trainingsstrategie om de beperkingen van bestaande methoden te overwinnen.

Jiazhi Guan, Quanwei Yang, Luying Huang, Junhao Liang, Borong Liang, Haocheng Feng, Wei He, Kaisiyuan Wang, Hang Zhou, Jingdong Wang2026-03-11💻 cs

Robust Cooperative Localization in Featureless Environments: A Comparative Study of DCL, StCL, CCL, CI, and Standard-CL

Deze studie vergelijkt vijf methoden voor cooperatieve lokalisatie in GPS-ontzegde omgevingen en concludeert dat Covariance Intersection (CI) de meest evenwichtige aanpak biedt, terwijl StCL en Standard-CL ondanks hoge nauwkeurigheid ongeschikt zijn voor veiligheidskritieke toepassingen vanwege filterinconsistentie.

Nivand Khosravi, Meysam Basiri, Rodrigo Ventura2026-03-11💻 cs

Overview of the TREC 2025 Retrieval Augmented Generation (RAG) Track

Het TREC 2025 RAG-track bouwt voort op de editie van 2024 door complexe, meerzinnige zoekopdrachten en een uitgebreide evaluatieframework te introduceren om betrouwbare en feitelijke systemen voor retrieval-augmented generation te bevorderen.

Shivani Upadhyay, Nandan Thakur, Ronak Pradeep, Nick Craswell, Daniel Campos, Jimmy Lin2026-03-11💻 cs

Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports

Deze paper introduceert CourtSI, het eerste grote dataset en benchmark voor ruimtelijke intelligentie in sporten, waarmee de beperkingen van bestaande vision-language modellen worden blootgelegd en een aanzienlijke prestatieverbetering wordt bereikt door fine-tuning.

Yuchen Yang, Yuqing Shao, Duxiu Huang, Linfeng Dong, Yifei Liu, Suixin Tang, Xiang Zhou, Yuanyuan Gao, Wei Wang, Yue Zhou, Xue Yang, Yanfeng Wang, Xiao Sun, Zhihang Zhong2026-03-11💻 cs

The 802.11 MAC protocol leads to inefficient equilibria

Dit artikel toont aan dat het bestaande 802.11 MAC-protocol in niet-coöperatieve omgevingen leidt tot inefficiënte Nash-evenwichten, en stelt voor dat een idealer protocol dat de kanaalallocatie onafhankelijk maakt van de transmissiestrategieën van individuele knopen, kan resulteren in evenwichten met een hogere totale doorvoer.

Godfrey Tan, John Guttag2026-03-11💻 cs

Role Classification of Hosts within Enterprise Networks Based on Connection Patterns

Dit artikel introduceert twee praktische algoritmen die hosts in enterprise-netwerken groeperen op basis van connectiepatronen om de logische structuur bloot te leggen en netwerkbeheer te vereenvoudigen, waarbij de resultaten aantonen dat de gegenereerde groepen aanzienlijk kleiner zijn dan het aantal hosts en de netwerklogica nauwkeurig weerspiegelen.

Godfrey Tan, Massimiliano Poletto, John Guttag, Frans Kaashoek2026-03-11💻 cs

WikiCLIP: An Efficient Contrastive Baseline for Open-domain Visual Entity Recognition

Dit paper introduceert WikiCLIP, een efficiënt contrastief raamwerk dat open-domein visuele entiteitsherkenning aanzienlijk verbetert door grote taalmodel-embeddings te combineren met een visueel geleide kennisadapter en een mechanisme voor het synthetiseren van harde negatieven, waardoor het prestaties op benchmarks zoals OVEN significant verhoogt en de inferentielatentie in vergelijking met generatieve modellen met bijna 100 keer verlaagt.

Shan Ning, Longtian Qiu, Jiaxuan Sun, Xuming He2026-03-11💻 cs

On the Structural Failure of Chamfer Distance in 3D Shape Optimization

Dit paper onthult dat de Chamfer-afstand faalt bij 3D-vormoptimalisatie door een structurele gradiëntproblematiek die leidt tot ineenstorting, en toont aan dat alleen niet-lokale koppeling deze kan voorkomen, wat resulteert in aanzienlijke verbeteringen in 3D-vormherstel.

Chang-Yong Song, David Hyde2026-03-11💻 cs

How to Write to SSDs

Dit artikel toont aan dat het overgaan op 'out-of-place' schrijven in database-systemen essentieel is om SSD-prestaties te maximaliseren en de levensduur te verlengen, wat leidt tot aanzienlijke verbeteringen in doorvoersnelheid en een drastische reductie van schrijfgrootte.

Bohyun Lee, Tobias Ziegler, Viktor Leis2026-03-11💻 cs

Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction

Deze paper introduceert een interpreteerbare methode voor tekst-motieretrieval die fijnmazige corresponderende kenmerken vastlegt door bewegingen om te zetten in gezamenlijke-hoekafbeeldingen en deze te combineren met een late token-patch-interactie, wat leidt tot betere prestaties dan bestaande methoden op HumanML3D en KIT-ML.

Yao Zhang, Zhuchenyang Liu, Yanlan He, Thomas Ploetz, Yu Xiao2026-03-11💻 cs

Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy

Dit paper introduceert een nieuw onbewaakt domeinadaptatiekader op basis van Margin Disparity Discrepancy om de leversegmentatie op interventionele CBCT-beelden te verbeteren door gebruik te maken van geannoteerde CT-data, wat resulteert in state-of-the-art prestaties.

Gauthier Miralles, Loïc Le Folgoc, Vincent Jugnon, Pietro Gori2026-03-11💻 cs

A Voronoi Cell Formulation for Principled Token Pruning in Late-Interaction Retrieval Models

Dit artikel introduceert een op Voronoi-cellen gebaseerd raamwerk voor principieel token-pruning in late-interaction retrieval-modellen, wat de opslagkosten aanzienlijk verlaagt zonder in te leveren op de zoekkwaliteit.

Yash Kankanampati, Yuxuan Zong, Nadi Tomeh, Benjamin Piwowarksi, Joseph Le Roux2026-03-11💻 cs

Leveraging whole slide difficulty in Multiple Instance Learning to improve prostate cancer grading

Dit paper introduceert het concept van 'Whole Slide Difficulty' op basis van meningsverschillen tussen experts en niet-experts, en toont aan dat het integreren van deze moeilijkheidsgraad in Multiple Instance Learning de prestaties van prostaatkankergradering, vooral bij hogere Gleason-graden, consistent verbetert.

Marie Arrivat, Rémy Peyret, Elsa Angelini, Pietro Gori2026-03-11💻 cs

← Vorige Volgende →