cs papers | Gist.Science

Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors

Dit paper toont aan dat bestaande verdedigingen tegen backdoors ontoereikend zijn omdat ze zich uitsluitend op de invoer-trigger richten, terwijl alternatieve triggers dezelfde kwetsbaarheid in de feature-ruimte kunnen activeren, wat een verschuiving vereist naar verdedigingen die zich richten op de backdoor-richting in de representatieruimte.

Gorka Abad, Ermes Franch, Stefanos Koffas, Stjepan Picek2026-03-11💻 cs

Deblurring structural edges in variable thickness topology optimization via density-gradient-informed projection

Dit artikel introduceert een robuuste aanpak voor variabele-dikte topologieoptimalisatie die ongewenste dunne gebieden onderdrukt en een nieuwe, door dichtheidsgradiënten geïnformeerde projectie methode presenteert om structurele randen scherp te maken zonder de stijfheid van het ontwerp significant te beïnvloeden.

Gabriel Stankiewicz, Chaitanya Dev, Paul Steinmann2026-03-11💻 cs

CLIOPATRA: Extracting Private Information from LLM Insights

Het paper introduceert CLIOPATRA, een privacyaanval die aantoont dat de huidige gelaagde heuristische beschermingsmaatregelen van privacybewuste LLM-platforms zoals Anthropic's Clio onvoldoende zijn om gevoelige gebruikersgegevens, zoals medische geschiedenis, te beschermen tegen een slimme tegenstander.

Meenatchi Sundaram Muthu Selva Annamalai, Emiliano De Cristofaro, Peter Kairouz2026-03-11💻 cs

TIMID: Time-Dependent Mistake Detection in Videos of Robot Executions

Dit paper introduceert TIMID, een nieuw architectuur voor video-anomaliedetectie die zwak toezicht en simulatiegebaseerde data gebruikt om tijdsafhankelijke fouten in robotuitvoeringen van complexe taken te identificeren.

Nerea Gallego (University of Zaragoza), Fernando Salanova (University of Zaragoza), Claudio Mannarano (University of Zaragoza, University of Torino), Cristian Mahulea (University of Zaragoza), Eduardo Montijano (University of Zaragoza)2026-03-11💻 cs

Test-time Ego-Exo-centric Adaptation for Action Anticipation via Multi-Label Prototype Growing and Dual-Clue Consistency

Deze paper introduceert DCPGN, een nieuwe methode voor testtijd-adaptatie die via multi-label prototypen en dual-clue consistentie (visueel en tekstueel) modellen getraind op egocentrische beelden aanpast aan exocentrische beelden voor actie-anticipatie zonder extra trainingsdata.

Zhaofeng Shi, Heqian Qiu, Lanxiao Wang, Qingbo Wu, Fanman Meng, Lili Pan, Hongliang Li2026-03-11💻 cs

Expressive Power of Property Graph Constraint Languages

Dit artikel presenteert het eerste systematische onderzoek naar de expressiviteit van PG-Keys, een nieuwe constrainttaal voor eigenschapsgrafieken die de GQL-standaard zal informeren, door deze via een unificerend kader te vergelijken met bestaande formalismen zoals GFD en GGD en zo een strikte hiërarchie van expressieve kracht vast te stellen.

Stefania Dumbrava, Nadime Francis, Victor Marsault, Steven Sailly2026-03-11💻 cs

RA-SSU: Towards Fine-Grained Audio-Visual Learning with Region-Aware Sound Source Understanding

Deze paper introduceert de fine-grained Audio-Visual Learning-taak RA-SSU, ondersteund door twee nieuwe datasets (f-Music en f-Lifescene) en het SSUFormer-model, om gebiedsgerichte, frame-per-frame geluidsbronsegmentatie en -beschrijving te bereiken.

Muyi Sun, Yixuan Wang, Hong Wang, Chen Su, Man Zhang, Xingqun Qi, Qi Li, Zhenan Sun2026-03-11💻 cs

ConfCtrl: Enabling Precise Camera Control in Video Diffusion via Confidence-Aware Interpolation

ConfCtrl is een vertrouwenbewust video-interpolatiekader dat diffusiemodellen in staat stelt om bij grote perspectiefveranderingen nieuwe weergaven te genereren met behulp van een Kalman-geïnspireerd mechanisme dat betrouwbare projecties combineert met residucorrecties voor geometrisch consistente resultaten.

Liudi Yang, George Eskandar, Fengyi Shen, Mohammad Altillawi, Yang Bai, Chi Zhang, Ziyuan Liu, Abhinav Valada2026-03-11💻 cs

EmoSURA: Towards Accurate Evaluation of Detailed and Long-Context Emotional Speech Captions

In dit paper wordt EmoSURA voorgesteld, een nieuw evaluatiekader dat complexe emotionele spraakbeschrijvingen opdeelt in atomaire eenheden die direct met het audiosignaal worden geverifieerd, waardoor het een betrouwbaardere maatstaf biedt dan traditionele methoden voor langere en gedetailleerde captions.

Xin Jing, Andreas Triantafyllopoulos, Jiadong Wang, Shahin Amiriparian, Jun Luo, Björn Schuller2026-03-11💻 cs

BrainSTR: Spatio-Temporal Contrastive Learning for Interpretable Dynamic Brain Network Modeling

Dit paper introduceert BrainSTR, een raamwerk voor spatio-temporeel contrastief leren dat dynamische hersennetwerken interpreteerbaar modelleert door data-gedreven fase-indeling, aandacht voor diagnostisch kritieke momenten en een gestructureerde semantische ruimte te combineren voor een betere neuropsychiatrische diagnose.

Guiliang Guo, Guangqi Wen, Lingwen Liu, Ruoxian Song, Peng Cao, Jinzhu Yang, Fei Wang, Xiaoli Liu, Osmar R. Zaiane2026-03-11💻 cs

VLM-Loc: Localization in Point Cloud Maps via Vision-Language Models

Deze paper introduceert VLM-Loc, een raamwerk dat grote visueel-taalmodellen gebruikt voor nauwkeurige tekst-naar-puntwolk-locatiebepaling door puntwolken om te zetten in vogelvluchtafbeeldingen en sceneschema's, en presenteert het CityLoc-benchmark voor uitgebreide evaluatie.

Shuhao Kang, Youqi Liao, Peijie Wang, Wenlong Liao, Qilin Zhang, Benjamin Busam, Xieyuanli Chen, Yun Liu2026-03-11💻 cs

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

Deze studie introduceert de nieuwe metriek CVDLoss om de beperkte respons van diffusion-modellen op prompts voor kleurtoegankelijkheid bij kleurenblindheid systematisch te evalueren en te kwantificeren.

Xinyao Zhuang, Jose Echevarria, Kaan Aksit2026-03-11💻 cs

Gap-ETH-Tight Algorithms for Hyperbolic TSP and Steiner Tree

Deze paper presenteert Gap-ETH-tighte randomiseerde algoritmen voor het TSP en het Steiner-boomprobleem in hyperbolische ruimte, die een $(1+\varepsilon)$ -benadering bieden in tijd $2^{O(1/\varepsilon^{d-1})}n^{1+o(1)}$ door middel van een nieuwe 'hybrid hyperbolic quadtree'-decompositie en een niet-uniforme portal-plaatsing.

Sándor Kisfaludi-Bak, Saeed Odak, Satyam Singh, Geert van Wordragen2026-03-11💻 cs

RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation

Het paper introduceert RecThinker, een agentisch framework dat de aanbeveling transformeert van een passief proces naar een autonome verkenning door dynamische redeneringspaden te plannen en essentiële informatie actief op te halen via tools, wat resulteert in superieure aanbevelingen vergeleken met bestaande methoden.

Haobo Zhang, Yutao Zhu, Kelong Mao, Tianhao Li, Zhicheng Dou2026-03-11💻 cs

Almost-Optimal Upper and Lower Bounds for Clustering in Low Dimensional Euclidean Spaces

Dit paper verbetert de looptijd voor $(1+\varepsilon)$ -benaderingsalgoritmen voor $k$ -median en $k$ -means clustering in laagdimensionale Euclidische ruimtes en bewijst een bij benadering overeenkomende ondergrens onder de Gap Exponentiële Tijd Hypothese.

Vincent Cohen-Addad, Karthik C. S., David Saulpic, Chris Schwiegelshohn2026-03-11💻 cs

MissBench: Benchmarking Multimodal Affective Analysis under Imbalanced Missing Modalities

Dit paper introduceert MissBench, een benchmark en raamwerk voor multimodale affectieve analyse dat standaardiseert hoe onbalans in ontbrekende modaliteiten wordt getest, en twee nieuwe diagnostische metrieken (MEI en MLI) definieert om ongelijkheid in modale bijdrage en optimalisatie te kwantificeren.

Tien Anh Pham, Phuong-Anh Nguyen, Duc-Trong Le, Cam-Van Thi Nguyen2026-03-11💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

Dit paper introduceert een Capability Coherence System dat de structurele equivalentie tussen geheugenconsistentiemodellen en autorisatie-intrekking benut om via een Release Consistency-strategie de schaal van onbevoegde API-aanroepen tijdens revocatie onafhankelijk van agent-snelheid te beperken, wat resulteert in een tot 184-voudige reductie ten opzichte van traditionele TTL-gebaseerde methoden.

Vladyslav Parakhin2026-03-11💻 cs

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

Dit paper introduceert InternVL-U, een lichtgewicht 4B-parameter unificerend multimodaal model dat door middel van een decoupled architectuur en een op redenering gebaseerde data-pipeline superieure prestaties bereikt in begrijpen, redeneren, genereren en bewerken, terwijl het tegelijkertijd de efficiëntie en schaalbaarheid van grotere modellen overtreft.

Changyao Tian, Danni Yang, Guanzhou Chen, Erfei Cui, Zhaokai Wang, Yuchen Duan, Penghao Yin, Sitao Chen, Ganlin Yang, Mingxin Liu, Zirun Zhu, Ziqian Fan, Leyao Gu, Haomin Wang, Qi Wei, Jinhui Yin, Xue Yang, Zhihang Zhong, Qi Qin, Yi Xin, Bin Fu, Yihao Liu, Jiaye Ge, Qipeng Guo, Gen Luo, Hongsheng Li, Yu Qiao, Kai Chen, Hongjie Zhang2026-03-11💻 cs

DISPLAY: Directable Human-Object Interaction Video Generation via Sparse Motion Guidance and Multi-Task Auxiliary

Het paper introduceert DISPLAY, een raamwerk voor het genereren van controleerbare en fysiek consistente video's van mens-objectinteracties dat gebruikmaakt van een lichtgewicht, spaarzame bewegingsgids (alleen polskoordinaten en een object-boundingbox), een object-gerichte attentiemechanisme en een multi-task trainingsstrategie om de beperkingen van bestaande methoden te overwinnen.

Jiazhi Guan, Quanwei Yang, Luying Huang, Junhao Liang, Borong Liang, Haocheng Feng, Wei He, Kaisiyuan Wang, Hang Zhou, Jingdong Wang2026-03-11💻 cs

Robust Cooperative Localization in Featureless Environments: A Comparative Study of DCL, StCL, CCL, CI, and Standard-CL

Deze studie vergelijkt vijf methoden voor cooperatieve lokalisatie in GPS-ontzegde omgevingen en concludeert dat Covariance Intersection (CI) de meest evenwichtige aanpak biedt, terwijl StCL en Standard-CL ondanks hoge nauwkeurigheid ongeschikt zijn voor veiligheidskritieke toepassingen vanwege filterinconsistentie.

Nivand Khosravi, Meysam Basiri, Rodrigo Ventura2026-03-11💻 cs

← Vorige Volgende →