cs papers | Gist.Science

HEXGEN-FLOW: Optimizing LLM Inference Request Scheduling for Agentic Text-to-SQL

Dit paper introduceert HEXGEN-FLOW, een kader voor het optimaliseren van de planning en uitvoering van multi-stap agentic Text-to-SQL-workflows op heterogene GPU-clusters, wat aanzienlijke verbeteringen oplevert in doorvoersnelheid en vermindering van latentie ten opzichte van bestaande frameworks.

You Peng, Youhe Jiang, Wenqi Jiang, Chen Wang, Binhang Yuan2026-03-10💻 cs

M3CAD: Towards Generic Cooperative Autonomous Driving Benchmark

Dit paper introduceert M³CAD, een uitgebreid benchmark met multimodale data van meerdere voertuigen om onderzoek naar generieke, coöperatieve autonoom rijden te bevorderen, inclusief een nieuwe adaptieve fusiemethode die communicatie-efficiëntie en waarnemingsnauwkeurigheid in evenwicht brengt.

Morui Zhu, Yongqi Zhu, Yihao Zhu, Qi Chen, Deyuan Qu, Song Fu, Qing Yang2026-03-10💻 cs

FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis

Dit paper introduceert FoldNet, een framework dat een synthetische dataset en de KG-DAgger-techniek gebruikt om een robuuste, gesloten-lus beleidsstrategie te leren voor het automatisch vouwen van kledingstukken door robots, wat resulteert in een succespercentage van 75% in de echte wereld.

Yuxing Chen, Bowen Xiao, He Wang2026-03-10💻 cs

Diffusion-SAFE: Diffusion-Native Human-to-Robot Driving Handover for Shared Autonomy

Dit artikel introduceert Diffusion-SAFE, een gesloten-lusframework dat twee diffusiemodellen gebruikt om menselijke intenties te voorspellen en veiligheidsbewuste besturingsaanpassingen te genereren, waardoor soepele en veilige overdrachten tussen mens en machine tijdens gedeelde autonomie mogelijk worden.

Yunxin Fan, Monroe Kennedy III2026-03-10💻 cs

MTVCraft: Tokenizing 4D Motion for Arbitrary Character Animation

MTVCraft introduceert het eerste framework dat ruwe 3D-motiesequenties (4D-beweging) direct modelleert via een nieuwe tokenisatie-methode en een bewegingsbewust Video DiT, waardoor er robuustere, flexibele en schaalbare karakteranimatie mogelijk is met ongeëvenaarde zero-shot generalisatie voor willekeurige personages en objecten.

Yanbo Ding, Xirui Hu, Zhizhi Guo, Yan Zhang, Xinrui Wang, Zhixiang He, Chi Zhang, Yali Wang, Xuelong Li2026-03-10💻 cs

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

Deze studie onderzocht bij 34 financiële professionals hoe cognitieve belasting prestaties beïnvloedt bij AI-ondersteund werk en concludeerde dat extrane belasting, vooral veroorzaakt door door het model geïnitieerde taakwisselingen, de grootste negatieve impact heeft, terwijl AI-gegenereerde inhoud de kwaliteit wel verbetert maar deze voordelen niet volledig compenseert voor de cognitieve kosten.

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew Beane2026-03-10💻 cs

Power flow and optimal power flow using quantum and digital annealers: a computational scalability analysis

Dit onderzoek presenteert en analyseert de schaalbaarheid van de Adiabatic Quantum Power Flow (AQPF) en Adiabatic Quantum Optimal Power Flow (AQOPF) algoritmen, die stroomvraag- en optimalisatieproblemen vertalen naar QUBO-modellen voor uitvoering op quantum- en digitale annealers, en toont aan dat deze methoden op schaalbare hardware haalbare oplossingen kunnen genereren voor systemen tot 1354 bussen.

Zeynab Kaseb, Matthias Moller, Pedro P. Vergara, Peter Palensky2026-03-10💻 cs

Representing local protein environments with machine learning force fields

In dit artikel wordt een nieuwe representatie voor lokale eiwitomgevingen voorgesteld, afgeleid van atomaire foundation-modellen, die niet alleen structurele en chemische kenmerken effectief vastlegt maar ook leidt tot een baanbrekende, fysisch geïnformeerde voorspeller voor chemische verschuivingen in biomoleculaire NMR-spectroscopie.

Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Anar Rzayev, Federico Napoli, Paul Schanda, Alex M. Bronstein2026-03-10💻 cs

Unsupervised Discovery of Failure Taxonomies from Deployment Logs

Deze paper introduceert een methode voor het onbewaakt ontdekken van semantisch coherente taxonomieën van robotische fouten uit ruwe logbestanden door middel van visueel-taalredenering en clustering, wat leidt tot interpreteerbare en bruikbare inzichten voor het verbeteren van systeemrobuustheid.

Aryaman Gupta, Yusuf Umut Ciftci, Somil Bansal2026-03-10💻 cs

Assigning Multi-Robot Tasks to Multitasking Robots

Dit artikel presenteert een nieuw raamwerk voor het toewijzen van taken aan multitaskende robots dat fysieke beperkingen in overweging neemt, wat leidt tot een efficiëntere oplossing vergeleken met traditionele single-tasking methoden.

Winston Smith, Yu Zhang2026-03-10💻 cs

Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning

Het paper introduceert ContextMatters, een raamwerk dat Large Language Models en klassieke planning combineert om via hiërarchische doelrelaxatie haalbare 3D-scèneplannen te genereren, wat resulteert in een aanzienlijke verbetering van het slagingspercentage en succesvolle implementatie op een echte TIAGo-robot.

Emanuele Musumeci, Michele Brienza, Francesco Argenziano, Abdel Hakim Drid, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi2026-03-10💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

Deze studie introduceert een door variatie-straf geoptimaliseerd GAN-model dat H&E-geschilderde weefselafbeeldingen met hoge precisie omzet in IHC-afbeeldingen voor een kosteneffectieve en betrouwbare HER2-diagnostiek bij borstkanker.

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung Nam2026-03-10💻 cs

Light of Normals: Unified Feature Representation for Universal Photometric Stereo

Dit paper introduceert LINO UniPS, een nieuwe methode voor universele fotometrische stereo die licht en oppervlaktnormals effectief ontkoppelt via Light Register Tokens en Interleaved Attention, en hoogfrequente geometrische details behoudt met een wavelet-gebaseerde architectuur, ondersteund door het grote synthetische PS-Verse-dataset.

Houyuan Chen, Hong Li, Chongjie Ye + 11 more2026-03-10💻 cs

Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models

Deze paper introduceert een nieuw VLM-geleid cascadekader voor Open-Vocabulary Camouflaged Object Segmentation dat de Segment Anything Model (SAM) stuurt met VLM-features voor nauwkeurigere segmentatie en een zachte ruimtelijke prior gebruikt om het domeinverschil bij classificatie te overbruggen, waardoor zowel de lokalisatie als de classificatie van gecamoufleerde objecten aanzienlijk verbetert.

Kai Zhao, Wubang Yuan, Zheng Wang, Guanyi Li, Xiaoqiang Zhu, Deng-ping Fan, Dan Zeng2026-03-10💻 cs

WaLi: Can Pressure Sensors in HVAC Systems Capture Human Speech?

Dit paper introduceert WaLi, een aanval die intelligibele spraak reconstrueert uit ruisende druksensor-data van HVAC-systemen door gebruik te maken van een complex-waardige conformer en een Complex Global Attention Block, waarmee een tot nu toe onbekend privacyrisico voor deze sensoren wordt blootgelegd.

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi Barua2026-03-10💻 cs

SUBARU: A Practical Approach to Power Saving in Hearables Using SUB-Nyquist Audio Resolution Upsampling

Dit paper introduceert SUBARU, een energiezuinige aanpak voor hearables die door het bewust toepassen van sub-Nyquist sampling en lage bit-resolutie in combinatie met een breedband-reconstructiemethode, de stroomverbruik met een factor 3,31 verlaagt terwijl het spraakverbetering in realistische omstandigheden behoudt.

Tarikul Islam Tamiti, Sajid Fardin Dipto, Luke Benjamin Baja-Ricketts, David C Vergano, Anomadarshi Barua2026-03-10💻 cs

Autonomous Vision-Aided UAV Positioning for Obstacle-Aware Wireless Connectivity

Dit paper introduceert VTOPA, een visie-gestuurd algoritme dat UAV's autonoom positioneert op basis van computerzicht voor obstakelbewuste draadloze connectiviteit, wat in simulaties leidt tot een tot 50% hogere doorvoer en een 50% lagere vertraging in stedelijke omgevingen.

Kamran Shafafi, Manuel Ricardo, Rui Campos2026-03-10💻 cs

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

LD-RPS is een nieuwe, datasetvrije methode voor universele beeldherstel die een vooraf getraind latent diffusion-model combineert met recurrente posterior sampling en semantische priors om diverse degradaties zonder gespecialiseerde training te verhelpen.

Huaqiu Li, Yong Wang, Tongwen Huang, Hailang Huang, Haoqian Wang, Xiangxiang Chu2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

Dit artikel introduceert Query-based Adaptive Aggregation (QAA), een innovatieve techniek voor het gezamenlijk trainen van modellen op meerdere datasets om universele visuele plaatsherkenning te bereiken met verbeterde generalisatie en robuustheid.

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs

Hybrid Diffusion Policies with Projective Geometric Algebra for Efficient Robot Manipulation Learning

Deze paper introduceert hPGA-DP, een hybride diffusiebeleid dat Projective Geometric Algebra (PGA) integreert in de netwerkarchitectuur om de trainingsefficiëntie en prestaties van robotmanipulatie te verbeteren door fundamentele ruimtelijke concepten niet opnieuw te hoeven leren.

Xiatao Sun, Yuxuan Wang, Shuo Yang, Yinxing Chen, Daniel Rakita2026-03-10💻 cs

← Vorige Volgende →