cs papers | Gist.Science

HERO: Hierarchical Embedding-Refinement for Open-Vocabulary Temporal Sentence Grounding in Videos

Dit paper introduceert HERO, een nieuw kader voor open-vocabulaire tijdsgebonden zinsgrondering in video's, en presenteert de eerste benchmarks en methoden om modellen beter te laten generaliseren naar onbekende taaluitdrukkingen.

Tingting Han, Xinsong Tao, Yufei Yin, Min Tan, Sicheng Zhao, Zhou Yu2026-03-10💻 cs

Vessel-Aware Deep Learning for OCTA-Based Detection of AMD

Deze studie introduceert een interpreteerbaar diep leermodel voor de detectie van AMD op basis van OCTA-beelden, dat specifieke vaatbiomarkers zoals tortuositeit en perfusiedeficiëntie integreert om de diagnose te verbeteren en in lijn te brengen met de pathofysiologie van de ziekte.

Margalit G. Mitzner, Moinak Bhattacharya, Zhilin Zou, Chao Chen, Prateek Prasanna2026-03-10💻 cs

Agent Hunt: Bounty Based Collaborative Autoformalization With LLM Agents

Dit paper beschrijft een experiment waarbij meerdere LLM-agenten in een interactief bewijssysteem samenwerken via een dynamisch bounty-marktmechanisme om algebraïsche topologie te formaliseren en te bewijzen.

Chad E. Brown, Cezary Kaliszyk, Josef Urban2026-03-10💻 cs

ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution

Deze paper introduceert ResearchEnvBench, een benchmark die de aanzienlijke beperkingen van huidige autonome agents blootlegt bij het synthetiseren van uitvoeringsomgevingen voor onderzoekscodes, een cruciale stap voor reproduceerbaar wetenschappelijk werk.

Yubang Wang, Chenxi Zhang, Bowen Chen, Zezheng Huai, Zihao Dai, Xinchi Chen, Yuxin Wang, Yining Zheng, Jingjing Gong, Xipeng Qiu2026-03-10💻 cs

ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins

Dit paper introduceert ViroGym, een uitgebreid benchmarkkader dat 79 diepe mutatiescanningsassays en diverse virale taken combineert om de prestaties van eiwit-taalmodellen bij het voorspellen van varianteffecten te evalueren en zo de selectie van rationele antigeenkandidaten voor vaccins te ondersteunen.

Yichen Zhou, Jonathan Golob, Amir Karimi, Stefan Bauer, Patrick Schwab2026-03-10💻 cs

ButterflyViT: 354 $\times$ Expert Compression for Edge Vision Transformers

ButterflyViT is een nieuwe methode die Vision Transformers voor randapparatuur mogelijk maakt door experts te behandelen als geometrische herschikkingen van een gedeelde quantized substraat, wat resulteert in een 354-voudige vermindering van het geheugengebruik bij 64 experts met verwaarloosbaar verlies aan nauwkeurigheid.

Aryan Karmore2026-03-10💻 cs

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

Deze studie biedt een uitgebreid overzicht van robotische foundation-modellen voor industriële toepassingen en introduceert een beoordelingsframework dat aantoont dat de huidige modellen nog onvoldoende zijn voor industriële inzet, omdat ze vooral beperkte pieken vertonen in plaats van een geïntegreerde dekking van veiligheids-, real-time en integratie-eisen.

David Kube, Simon Hadwiger, Tobias Meisen2026-03-10💻 cs

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

Deze paper introduceert XMACNet, een lichtgewicht en verklaarbaar CNN-model dat zichtbare beelden en vegetatie-indexen combineert via zelf-attention en multi-modale fusie om chili-ziekten nauwkeurig te detecteren en te visualiseren voor toepassing in de precisielandbouw.

Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P2026-03-10💻 cs

EarthBridge: A Solution for 4th Multi-modal Aerial View Image Challenge Translation Track

Dit paper introduceert EarthBridge, een hoogwaardig framework voor cross-modale beeldvertaling tussen EO-, IR- en SAR-sensoren dat gebruikmaakt van Diffusion Bridge Implicit Models en Contrastive Unpaired Translation om de tweede plaats te behalen in de 4th Multi-modal Aerial View Image Challenge.

Zhenyuan Chen, Guanyuan Shen, Feng Zhang2026-03-10💻 cs

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

Dit artikel introduceert een algemeen, op gradiënten gebaseerd, genesterd co-designkader dat aerodynamische vormgeving en besturing voor vleugelrobots gelijktijdig optimaliseert door gebruik te maken van een neuronaal surrogaatmodel voor complexe stroming, wat leidt tot superieure prestaties bij taken als perchen en kort landen in vergelijking met bestaande methoden.

Daniele Affinita, Mingda Xu, Benoît Valentin Gherardi, Pascal Fua2026-03-10💻 cs

HiDE: Hierarchical Dictionary-Based Entropy Modeling for Learned Image Compression

Het artikel introduceert HiDE, een hiërarchisch model voor geleerde afbeeldingscompressie dat externe priors via een gestructureerde tweelaagse woordenboekretrieval en een contextbewuste schatter efficiënter benut dan bestaande methoden, wat leidt tot aanzienlijke bitrate-reducties.

Haoxuan Xiong, Yuanyuan Xu, Kun Zhu, Yiming Wang, Baoliu Ye2026-03-10💻 cs

Efficient Neighbourhood Search in 3D Point Clouds Through Space-Filling Curves and Linear Octrees

Dit paper introduceert een efficiënte methode voor het zoeken naar buren in 3D-puntenwolken door ruimtevullende krommen en lineaire octrees te combineren, wat leidt tot een tot 10 keer snellere zoektijd en een aanzienlijke reductie in cache-misses vergeleken met bestaande oplossingen.

Pablo D. Viñambres, Miguel Yermo, Silvia R. Alcaraz, Oscar G. Lorenzo, Francisco F. Rivera, José C. Cabaleiro2026-03-10💻 cs

Stability-Guided Exploration for Diverse Motion Generation

Deze paper introduceert een nieuwe methode die RRT-achtige zoekalgoritmen combineert met sampling-based MPC en een stabiele manifeest-samplingstrategie om via zwarte-bak-simulatie diverse en langdurige robotmanipulatiestrategieën te genereren zonder menselijke demonstraties of taakspecifieke begeleiding.

Eckart Cobo-Briesewitz, Tilman Burghoff, Denis Shcherba, Armand Jordana, Marc Toussaint2026-03-10💻 cs

HybridMimic: Hybrid RL-Centroidal Control for Humanoid Motion Mimicking

Dit paper introduceert HybridMimic, een hybride RL-centroïdale besturingsframework dat een geleerd beleid gebruikt om dynamisch contacttoestanden en gewenste snelheden te voorspellen, waardoor robuustere en fysiek haalbare bewegingsnabootsing voor humanoïde robots wordt bereikt, zoals aangetoond door een 13% lagere trackingfout op de Booster T1.

Ludwig Chee-Ying Tay, I-Chia Chang, Yan Gu2026-03-10💻 cs

A Multi-Layer Sim-to-Real Framework for Gaze-Driven Assistive Neck Exoskeletons

Dit artikel presenteert een multi-layer Sim-to-Real-raamwerk dat virtuele realiteit gebruikt om gazedriven modellen te trainen en te evalueren voor een assistieve nekexoskelet, waarmee gepersonaliseerde besturingsstrategieën voor patiënten met een 'dropped head syndrome' effectief kunnen worden geïdentificeerd.

Colin Rubow, Eric Brewer, Ian Bales, Haohan Zhang, Daniel S. Brown2026-03-10💻 cs

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

Dit paper introduceert AceMAD, een multi-agent debatframework dat de 'Martingale-vloek' doorbreekt door asymmetrische cognitieve potentiële energie te benutten, waardoor waarheidsgetrouwe agenten hun meerderheidsfouten kunnen corrigeren en de collectieve convergentie naar het juiste antwoord wordt versneld.

Yuhan Liu, Juntian Zhang, Yichen Wu, Martin Takac, Salem Lahlou, Xiuying Chen, Nils Lukas2026-03-10💻 cs

A Hybrid Machine Learning Model for Cerebral Palsy Detection

Dit artikel presenteert een hybride machine learning-model dat MRI-beelden verwerkt via een combinatie van CNN-architecturen (VGG19, EfficientNet en ResNet50) en een Bi-LSTM-classificatie, waardoor een nauwkeurigheid van 98,83% wordt bereikt voor de vroege detectie van cerebrale parese bij pasgeborenen.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Making AI Evaluation Deployment Relevant Through Context Specification

Dit paper introduceert 'context specificatie' als een proces om diffuse belanghebbendenperspectieven om te zetten in duidelijke, meetbare constructen, waardoor AI-evaluaties beter aansluiten bij de operationele realiteit en duurzame meerwaarde voor organisaties kunnen leveren.

Matthew Holmes, Thiago Lacerda, Reva Schwartz2026-03-10💻 cs

Reinforcing the World's Edge: A Continual Learning Problem in the Multi-Agent-World Boundary

Dit artikel onderzoekt hoe de onstabiele grens tussen agent en wereld in decentrale multi-agent-versterkingslearning leidt tot een continu-leerprobleem waarbij de invariante kern van succesvolle beslissingsstructuren kan verdwijnen door beleidsgestuurde niet-stationariteit.

Dane Malenfant2026-03-10💻 cs

AI-Assisted Curation of Conference Scholarship: Compiling, Structuring, and Analyzing Two Decades of Presentations at the Society for Social Work and Research

Deze studie presenteert een door AI ondersteunde database van bijna 24.000 presentaties van de Society for Social Work and Research (SSWR) over twee decennia, waarin een aanzienlijke groei in samenwerking, internationale deelname en een aanhoudende dominantie van kwantitatieve methoden wordt vastgesteld.

Brian Perron, Bryan Victor, Zia Qi2026-03-10💻 cs

← Vorige Volgende →

cs