cs papers | Gist.Science

Configurable Runtime Orchestration for Dynamic Data Retrieval in Distributed Systems

Dit artikel introduceert een configuratiegestuurd runtime-orchestratiekader dat dynamische uitvoeringsgrafieken genereert voor efficiënte, lage-latentie dataverzameling in gedistribueerde systemen, waardoor workflows flexibel kunnen evolueren zonder opnieuw te hoeven deployen.

Abhiram Kandiraju2026-03-10💻 cs

Optimizing Multi-Modal Models for Image-Based Shape Retrieval: The Role of Pre-Alignment and Hard Contrastive Learning

Dit artikel presenteert een methode voor beeldgebaseerde vormretrieval die gebruikmaakt van vooraf uitgelijnde multi-modale encoders en een hard contrastief verlies om state-of-the-art prestaties te bereiken zonder dat view-synthese of hertraining op de doel-database nodig is.

Paul Julius Kühn, Cedric Spengler, Michael Weinmann, Arjan Kuijper, Saptarshi Neil Sinha2026-03-10💻 cs

Perception-Aware Multimodal Spatial Reasoning from Monocular Images

Dit paper introduceert een perceptiebewust multimodaal redeneringsframework dat Vision-Language Models versterkt met object-gerichte grounding via visuele referentietokens en een Multimodal Chain-of-Thought-dataset, waardoor aanzienlijke verbeteringen worden behaald in ruimtelijk redeneren uit monoculaire beelden voor autonoom rijden.

Yanchun Cheng, Rundong Wang, Xulei Yang, Alok Prakash, Daniela Rus, Marcelo H Ang Jr, ShiJie Li2026-03-10💻 cs

ADAS-TO: A Large-Scale Multimodal Naturalistic Dataset and Empirical Characterization of Human Takeovers during ADAS Engagement

Dit paper introduceert ADAS-TO, het eerste grote, openbare multimodale dataset dat zich richt op natuurlijke overnames van ADAS naar handmatige besturing, en biedt empirische inzichten in de dynamiek van kritieke situaties die aantonen dat visuele waarschuwingen vaak eerder mogelijk zijn dan kinematische triggers.

Yuhang Wang, Yiyao Xu, Jingran Sun, Hao Zhou2026-03-10💻 cs

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Deze paper introduceert een efficiënte runtime-monitor die een probabilistisch wereldmodel in de latente ruimte van een visuele fundamentele model gebruikt om onzekerheidsschattingen te genereren voor het nauwkeurig detecteren van anomalieën en storingen bij bimanuele robots, wat aanzienlijk beter presteert dan bestaande methoden met veel minder trainbare parameters.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

MipSLAM: Alias-Free Gaussian Splatting SLAM

Dit paper introduceert MipSLAM, een frequentiebewust 3D-Gaussian-Splatting-SLAM-kader dat aliasing-artefacten en trajectdrift effectief aanpakt door een elliptisch adaptief anti-aliasing-algoritme en spectrale pose-grafoptimalisatie, wat resulteert in state-of-the-art weergavekwaliteit en lokaliseringsnauwkeurigheid.

Yingzhao Li, Yan Li, Shixiong Tian, Yanjie Liu, Lijun Zhao, Gim Hee Lee2026-03-10💻 cs

AdaGen: Learning Adaptive Policy for Image Synthesis

AdaGen introduceert een leerbaar, adaptief framework dat het iteratieve proces van beeldsynthese optimaliseert door een beleidsnetwerk te trainen via versterkingsleer met een adversariële beloning, waardoor de prestaties van diverse generatieve modellen aanzienlijk worden verbeterd en de inferentiekosten worden verlaagd.

Zanlin Ni, Yulin Wang, Yeguo Hua, Renping Zhou, Jiayi Guo, Jun Song, Bo Zheng, Gao Huang2026-03-10💻 cs

Large Language Model-Driven Full-Component Evolution of Adaptive Large Neighborhood Search

Deze paper introduceert een gesloten-lus, door grote taalmodellen aangedreven evolutionair kader dat alle componenten van Adaptive Large Neighborhood Search (ALNS) automatisch herbouwt en zo, met name op grote schaal, aanzienlijk betere oplossingskwaliteit en strategische diversiteit bereikt dan handmatig ontworpen ALNS-baselines.

Shaohua Yu, Tianyu Chen, Linyan Liu2026-03-10💻 cs

TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models

Dit paper introduceert TrajPred, een framework dat instrumenttrajectoires en visueel-taalmodellen combineert om de nauwkeurigheid van de herkenning van interacties tussen chirurgische instrumenten en weefsels te verbeteren door tijdsafhankelijke bewegingsinformatie en fijne actie-details beter te benutten.

Jiajun Cheng, Xiaofan Yu, Subarna, Sainan Liu, Shan Lin2026-03-10💻 cs

Privacy-Preserving Patient Identity Management Framework for Secure Healthcare Access

Dit paper presenteert een privacy-bewust, patiëntgericht raamwerk voor identiteitsbeheer in de gezondheidszorg dat operationele betrouwbaarheid combineert met sterke bescherming tegen linkbaarheid en traceerbaarheid, waarbij de beveiliging en haalbaarheid formeel zijn geverifieerd en gesimuleerd.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Two-Stage Path Following for Mobile Manipulators via Dimensionality-Reduced Graph Search and Numerical Optimization

Dit artikel presenteert een robuust tweestapskader voor het volgen van paden door mobiele manipulatoren, dat een 8-DoF-planningsprobleem ontkoppelt in een efficiënte grafische zoektocht en een numerieke optimalisatie om zowel computationele snelheid als sub-millimeter nauwkeurigheid te garanderen.

Fuyu Guo, Yuting Mei, Yuyao Zhang, Qian Tang2026-03-10💻 cs

An Extended Consent-Based Access Control Framework: Pre-Commit Validation and Emergency Access

Dit paper introduceert een uitgebreid op toestemming gebaseerd toegangscontrolekader voor de gezondheidszorg dat semantische correctie garandeert door conflicten proactief bij het aanmaken van toestemming te detecteren, onveranderlijke basisrechten formaliseert en contextbewuste noodtoegang mogelijk maakt, wat resulteert in lagere latentie en betere schaalbaarheid dan traditionele XACML-baselines.

Nasif Muslim, Jean-Charles Grégoire2026-03-10💻 cs

Mozart: Modularized and Efficient MoE Training on 3.5D Wafer-Scale Chiplet Architectures

Dit paper introduceert Mozart, een co-ontwerp van algoritme en hardware dat de training van MoE-gedreven taalmodellen op 3.5D wafer-scale chiplet-architecturen optimaliseert door middel van een slimme experttoewijzing, fijnmazige planning en een hiërarchisch geheugenontwerp om communicatie- en geheugenproblemen op te lossen.

Shuqing Luo (Katie), Ye Han (Katie), Pingzhi Li (Katie), Jiayin Qin (Katie), Jie Peng (Katie), Yang (Katie), Zhao (Kevin), Yu (Kevin), Cao, Tianlong Chen2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Deze studie toont aan dat generatieve AI in het ontwerponderwijs vooral fungeert als cognitieve versneller die door studenten wordt ingezet in de vroege fasen van het proces, terwijl menselijke competenties zoals vakinhoudelijke kennis, smaak en oordeelsvermogen essentieel blijven voor het interpreteren, valideren en verfijnen van AI-generaties.

Qian Huang, King Wang Poon2026-03-10💻 cs

OV-DEIM: Real-time DETR-Style Open-Vocabulary Object Detection with GridSynthetic Augmentation

Dit paper introduceert OV-DEIM, een real-time open-vocabulary objectdetector op basis van het DEIMv2-architectuur die, door middel van een query-aanvullingsstrategie en de nieuwe GridSynthetic-dataaugmentatietechniek, state-of-the-art prestaties bereikt met verbeterde efficiëntie en detectie van zeldzame categorieën.

Leilei Wang, Longfei Liu, Xi Shen, Xuanlong Yu, Ying Tiffany He, Fei Richard Yu, Yingyi Chen2026-03-10💻 cs

Enhancing Web Agents with a Hierarchical Memory Tree

Dit paper introduceert de Hiërarchische Geheugenboom (HMT), een gestructureerd raamwerk dat logische planning en actie-uitvoering ontkoppelt door een drie-niveau hiërarchie te gebruiken, waardoor webagenten gebaseerd op grote taalmodellen aanzienlijk beter generaliseren naar onbekende websites dan bestaande methoden met plat geheugen.

Yunteng Tan, Zhi Gao, Xinxiao Wu2026-03-10💻 cs

Two Frames Matter: A Temporal Attack for Text-to-Video Model Jailbreaking

Dit paper introduceert TFM, een aanvalsmethode die gebruikmaakt van een kwetsbaarheid in tekst-naar-video-modellen waarbij het specificeren van slechts begin- en eindframes leidt tot het genereren van schadelijke tussentijdse beelden, waardoor bestaande inhoudsfilters worden omzeild.

Moyang Chen, Zonghao Ying, Wenzhuo Xu, Quancheng Zou, Deyue Zhang, Dongdong Yang, Xiangzheng Zhang2026-03-10💻 cs

Improved Leakage Abuse Attacks in Searchable Symmetric Encryption with eBPF Monitoring

Dit paper toont aan dat eBPF-monitoring op systeemniveau nieuwe lekken in Zoekbare Symmetrische Encryptie (SSE) blootlegt die aanvallen versterken en benadrukt dat deze praktische bedreigingen moeten worden opgenomen in toekomstige verdedigingsontwerpen.

Chinecherem Dimobi2026-03-10💻 cs

SSP: Safety-guaranteed Surgical Policy via Joint Optimization of Behavioral and Spatial Constraints

Dit paper introduceert SSP, een raamwerk dat neurale differentiaalvergelijkingen en veiligheidscontrolefuncties combineert om data-gedreven chirurgische beleidslijnen van formele veiligheidswaarborgen te voorzien, waardoor de overtreding van gedrags- en ruimtelijke beperkingen in robotchirurgie tot bijna nul wordt teruggebracht zonder de taaksucces te compromitteren.

Jianshu Hu, ZhiYuan Guan, Lei Song, Kantaphat Leelakunwet, Hesheng Wang, Wei Xiao, Qi Dou, Yutong Ban2026-03-10💻 cs

Monetizing Generative AI: YouTubers' Collective Knowledge on Earning from Generative AI Content

Deze studie analyseert 377 YouTube-video's om te onderzoeken hoe creators collectief kennis opbouwen over het monetiseren van generatieve AI-inhoud, waarbij ze zowel nieuwe inkomstenstromen verkennen als structurele spanningen rondom inkomensclaims, auteursrechten en platformbeheer blootleggen.

Shuo Niu, Yao Lyu, He Zhang, Na Li, Bumjin Kim, Jie Cai2026-03-10💻 cs

← Vorige Volgende →