cs papers | Gist.Science

PanoDP: Learning Collision-Free Navigation with Panoramic Depth and Differentiable Physics

PanoDP is een communicatievrij leerframework dat panoramische dieptewaarneming en differentieerbare fysica combineert om autonome agents te trainen voor veilige, botsingsvrije navigatie in complexe en dynamische omgevingen.

Hao Zhong, Pei Chi, Jiang Zhao, Shenghai Yuan, Xuyang Gao, Thien-Minh Nguyen, Lihua Xie2026-03-10💻 cs

Registered Attribute-Based Encryption with Publicly Verifiable Certified Deletion, Everlasting Security, and More

Deze paper introduceert de eerste Registered Attribute-Based Encryption-schemata die zowel gecertificeerde verwijdering als eeuwige beveiliging bieden, met zowel privé- als publiek verifieerbare opties die escrow-risico's elimineren en informatie-theoretische privacy garanderen.

Shayeef Murshid, Ramprasad Sarkar, Mriganka Mandal2026-03-10💻 cs

TempoFit: Plug-and-Play Layer-Wise Temporal KV Memory for Long-Horizon Vision-Language-Action Manipulation

TempoFit is een trainingsvrije, plug-and-play methode die bestaande Vision-Language-Action-modellen verbetert voor langdurige robotmanipulatie door het hergebruiken van bestaande temporale geheugensporen (KV-memorie) om context te behouden zonder de inferentie-latentie of het model zelf aan te passen.

Jun Sun, Boyu Yang, Jiahao Zhang, Ning Ma, Chencheng Wu, Siqing Zhang, Yiou Huang, Qiufeng Wang, Shan Liang, Yaran Chen2026-03-10💻 cs

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Deze paper introduceert AtomicVLA, een unificerend kader voor robotplanning en -executie dat via een Skill-Guided Mixture-of-Experts (SG-MoE) schaalbare atomaire vaardigheden leert en dynamisch combineert, waardoor robuustere prestaties worden bereikt bij langdurige taken en voortdurend leren in vergelijking met bestaande VLA-modellen.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

Multi-Agent Off-World Exploration for Sparse Evidence Discovery via Gaussian Belief Mapping and Dual-Domain Coverage

Dit artikel presenteert een raamwerk voor multi-agent off-world exploratie dat gebruikmaakt van Gaussische-bewijsmapping en dubbel-domein dekking om efficiënt en veilig zeldzame bewijsstukken te vinden in gevaarlijke omgevingen met beperkte communicatie, waarbij het beter presteert dan bestaande methoden door AOI-bias te verminderen en risico's actief te beheren.

Zhuoran Qiao, Tianxin Hu, Thien-Minh Nguyen, Shenghai Yuan2026-03-10💻 cs

GLASS: Graph and Vision-Language Assisted Semantic Shape Correspondence

Het paper introduceert GLASS, een nieuw raamwerk dat graftheorie en visueel-taalmodellen combineert om zonder handmatige supervisie nauwkeurige, semantisch consistente 3D-vormcorrespondenties te leren, zelfs onder complexe niet-isometrische vervormingen en tussen verschillende klassen.

Qinfeng Xiao, Guofeng Mei, Qilong Liu, Chenyuan Yi, Fabio Poiesi, Jian Zhang, Bo Yang, Yick Kit-lun2026-03-10💻 cs

Scaling Test-Time Robustness of Vision-Language Models via Self-Critical Inference Framework

Dit paper introduceert het Self-Critical Inference-framework en de Dynamic Robustness Benchmark om de taalbias en -gevoeligheid van Vision-Language-modellen te verminderen door middel van meervoudige counterfactuele redenering en model-specifieke evaluatie.

Kaihua Tang, Jiaxin Qi, Jinli Ou, Yuhua Zheng, Jianqiang Huang2026-03-10💻 cs

Holi-Spatial: Evolving Video Streams into Holistic 3D Spatial Intelligence

Dit paper introduceert Holi-Spatial, het eerste volledig geautomatiseerde, grootschalige multimodale datasetkader dat ruwe video-inputs omzet in holistische 3D-ruimtelijke intelligentie met behulp van een geoptimaliseerde pipeline voor 3D-Gaussian Splatting-reconstructies en ruimtelijke vraag-antwoordparen, waardoor de schaalbaarheid en prestaties van ruimtelijk redenerende modellen aanzienlijk worden verbeterd.

Yuanyuan Gao, Hao Li, Yifei Liu, Xinhao Ji, Yuning Gong, Yuanjun Liao, Fangfu Liu, Manyuan Zhang, Yuchen Yang, Dan Xu, Xue Yang, Huaxi Huang, Hongjie Zhang, Ziwei Liu, Xiao Sun, Dingwen Zhang, Zhihang Zhong2026-03-10💻 cs

DAISS: Phase-Aware Imitation Learning for Dual-Arm Robotic Ultrasound-Guided Interventions

Dit artikel introduceert DAISS, een geteleoperateerd dual-arm platform dat via fase-bewust imitatieleer complexe, asymmetrische taken voor ultrasone-geleide medische ingrepen automatiseert door expertstrategieën te leren uit beperkte demonstraties en real-time echografiefeedback te integreren.

Feng Li, Pei Liu, Shiting Wang, Ning Wang, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-10💻 cs

Ref-DGS: Reflective Dual Gaussian Splatting

Ref-DGS is een nieuw framework dat reflecterende oppervlakken efficiënt reconstrueert en nieuwe weergaven synthetiseert door geometrie en lokale reflecties te scheiden in een dubbele Gaussische representatie, waardoor het de snelheid van Rasterisatie combineert met de nauwkeurigheid van straalvolgende methoden zonder de hoge rekentkosten.

Ningjing Fan, Yiqun Wang, Dongming Yan, Peter Wonka2026-03-10💻 cs

FusionRegister: Every Infrared and Visible Image Fusion Deserves Registration

Het artikel introduceert FusionRegister, een efficiënte en robuuste methode die visuele priors gebruikt om misregistratie direct in het fusieproces van infrarood- en zichtbare beelden op te lossen, waardoor uitgebreide voorafgaande registratie overbodig wordt en de kwaliteit van bestaande fusietechnieken wordt behouden.

Congcong Bian, Haolong Ma, Hui Li, Zhongwei Shen, Xiaoqing Luo, Xiaoning Song, Xiao-Jun Wu2026-03-10💻 cs

The Effect of Code Obfuscation on Human Program Comprehension

Deze studie toont aan dat codeobfuscatie de menselijke programmeercomprehensie over het algemeen vertraagt en de nauwkeurigheid verlaagt, waarbij de impact echter niet strikt monotoon is en sterk varieert afhankelijk van de programmeertaal en de specifieke transformatietechnieken.

Anh H. N. Nguyen, Jack Le, Ilse Lahnstein Coronado, Tien N. Nguyen2026-03-10💻 cs

Memory for Autonomous LLM Agents:Mechanisms, Evaluation, and Emerging Frontiers

Dit survey biedt een gestructureerd overzicht van de mechanismen, evaluatie en opkomende frontiers voor geheugen in autonome LLM-agenten, waarbij het geheugen wordt geformaliseerd als een schrijf-beheer-lees-lus en wordt onderzocht via een drie-dimensionale taxonomie, vijf mechanismefamilies, evaluatiemethoden en praktische toepassingen tot in 2026.

Pengfei Du2026-03-10💻 cs

Low-Cost Teleoperation Extension for Mobile Manipulators

Dit artikel introduceert een open-source, low-cost teleoperatieramenwerk voor mobiele bimanuele manipulatoren dat gebruikmaakt van standaard hardware zoals smartphones en voetschakelaars om intuïtieve, volledige lichaamscontrole mogelijk te maken zonder dure VR-uitrusting.

Danil Belov, Artem Erkhov, Yaroslav Savotin, Tatiana Podladchikova, Pavel Osinenko2026-03-10💻 cs

A Primer on Evolutionary Frameworks for Near-Field Multi-Source Localization

Dit paper introduceert twee nieuwe modelgedreven evolutionaire frameworks, NEMO-DE en NEEF-DE, die directe en datalabel-vrije near-field multi-source lokalisatie mogelijk maken op continue sferische-golfmodellen voor willekeurige array-geometrieën, waarmee de beperkingen van bestaande grid-gebaseerde en diepe-leerbenaderingen worden overwonnen.

Seyed Jalaleddin Mousavirad, Parisa Ramezani, Mattias O'Nils, Emil Björnson2026-03-10💻 cs

UniUncer: Unified Dynamic Static Uncertainty for End to End Driving

Dit paper introduceert UniUncer, een lichtgewicht, unificerend framework dat onzekerheid voor zowel statische als dynamische scene-elementen integreert in een end-to-end rijplanner, waardoor de betrouwbaarheid en prestaties aanzienlijk worden verbeterd met minimaal rekenkundig overhead.

Yu Gao, Jijun Wang, Zongzheng Zhang, Anqing Jiang, Yiru Wang, Yuwen Heng, Shuo Wang, Hao Sun, Zhangfeng Hu, Hao Zhao2026-03-10💻 cs

FrameVGGT: Frame Evidence Rolling Memory for streaming VGGT

Het paper introduceert FrameVGGT, een frame-gedreven architectuur die de groei van het geheugen in streaming 3D-perceptie beperkt door frames te behandelen als samenhangende bewijsblokken, waardoor een betere afweging tussen nauwkeurigheid en geheugengebruik wordt bereikt voor langdurige videostreams.

Zhisong Xu, Takeshi Oishi2026-03-10💻 cs

RoboPCA: Pose-centered Affordance Learning from Human Demonstrations for Robot Manipulation

Dit artikel introduceert RoboPCA, een raamwerk dat menselijke demonstraties gebruikt om robots gelijktijdig de juiste contactgebieden en houdingen te leren voorspellen voor effectieve objectmanipulatie, waardoor inconsistenties in bestaande methoden worden opgelost.

Zhanqi Xiao, Ruiping Wang, Xilin Chen2026-03-10💻 cs

Compressed-Domain-Aware Online Video Super-Resolution

Dit paper introduceert CDA-VSR, een efficiënt online video super-resolutie-netwerk dat gecomprimeerde domein-informatie zoals bewegingsvectoren en residukaarten benut om de kwaliteit te verbeteren en de inferentiesnelheid te verdubbelen ten opzichte van bestaande methoden.

Yuhang Wang, Hai Li, Shujuan Hou, Zhetao Dong, Xiaoyao Yang2026-03-10💻 cs

Learning Context-Adaptive Motion Priors for Masked Motion Diffusion Models with Efficient Kinematic Attention Aggregation

Dit paper introduceert het Masked Motion Diffusion Model (MMDM), een generatief raamwerk dat onvolledige of ruisbeïnvloede bewegingsdata reconstrueert door contextadaptieve bewegingspriors te leren via een Kinematic Attention Aggregation-mechanisme, waardoor robuuste 3D-bewegingherstel mogelijk wordt bij occlusies of onnauwkeurige draagbare sensoren.

Junkun Jiang, Jie Chen, Ho Yin Au, Jingyu Xiang2026-03-10💻 cs

← Vorige Volgende →