WeldAR: Augmenting Live Hands-On Training with In-Situ Guidance for Novice Learners

Dit paper introduceert WeldAR, een augmented reality-systeem dat novice lasers in real-time begeleidt tijdens live training, en toont aan dat deze aanpak de prestaties en het zelfstandig uitvoeren van lasvaardigheden verbetert ten opzichte van traditionele video-instructie.

Chuhan (Franklin), Xu (Carnegie Mellon University), Lia Sparingga Purnamasari (Carnegie Mellon University), Zhenfang Chen (Carnegie Mellon University), Daragh Byrne (Carnegie Mellon University), Dina El-Zanfaly (Carnegie Mellon University)2026-03-10✓ Author reviewed 💻 cs

SGG-R3^{\rm 3}: From Next-Token Prediction to End-to-End Unbiased Scene Graph Generation

Dit paper introduceert SGG-R³, een gestructureerd redeneringskader dat chain-of-thought-gestuurde supervisie en versterkende leer met een groepssequenti-beleid optimalisatie combineert om onbevooroordeelde en complete scene graph generation te realiseren door de uitdagingen van relationele sparsiteit en lange-staartverdelingen aan te pakken.

Jiaye Feng, Qixiang Yin, Yuankun Liu, Tong Mo, Weiping Li2026-03-10💻 cs

GOMA: Geometrically Optimal Mapping via Analytical Modeling for Spatial Accelerators

GOMA is een op analytische modellering gebaseerd framework dat via een geometrische abstractie binnen een acceptabele tijd een globaal optimale mapping voor GEMM-werklasten op ruimtelijke acceleratoren berekent, wat resulteert in aanzienlijke verbeteringen in energie-efficiëntie en doorlooptijd ten opzichte van de huidige stand van de techniek.

Wulve Yang, Hailong Zou, Rui Zhou, Jionghao Zhang, Qiang Li, Gang Li, Yi Zhan, Shushan Qiao2026-03-10💻 cs

Designing a Generative AI-Assisted Music Psychotherapy Tool for Deaf and Hard-of-Hearing Individuals

Dit onderzoek presenteert een door generatieve AI en conversatieagenten ondersteund muziekpsychotherapie-instrument dat, ontwikkeld in samenwerking met therapeuten en getest bij 23 dove en slechthorende personen, effectief emotionele ontlading en zelfinzicht bevordert via visuele metaforen en empathische interactie.

Youjin Choi, Jaeyoung Moon, Jinyoung Yoo, Jennifer G. Kim, Jin-Hyuk Hong2026-03-10💻 cs

Listening with the Eyes: Benchmarking Egocentric Co-Speech Grounding across Space and Time

Dit paper introduceert EcoG-Bench, een diagnostisch benchmark voor egocentrische co-spraakgrounding dat aantoont dat er een groot prestatiekloof bestaat tussen menselijke en modelprestaties, voornamelijk veroorzaakt door beperkingen in multimodale interfaces die de waarneming van temporale uitlijning tussen spraak en gebaren belemmeren.

Weijie Zhou, Xuantang Xiong, Zhenlin Hu, Xiaomeng Zhu, Chaoyang Zhao, Honghui Dong, Zhengyou Zhang, Ming Tang, Jinqiao Wang2026-03-10💻 cs

Advancing Automated Algorithm Design via Evolutionary Stagewise Design with LLMs

Dit paper introduceert EvoStage, een evolutionair raamwerk dat Large Language Models (LLMs) gebruikt om door middel van gefaseerde ontwerpstappen en real-time feedback geautomatiseerde algoritmen te creëren die menselijke expertontwerpen en bestaande methoden overtreffen in complexe industriële toepassingen zoals chipplaatsing.

Chen Lu, Ke Xue, Chengrui Gao, Yunqi Shi, Siyuan Xu, Mingxuan Yuan, Chao Qian, Zhi-Hua Zhou2026-03-10💻 cs

Adaptive Collaboration with Humans: Metacognitive Policy Optimization for Multi-Agent LLMs with Continual Learning

Dit artikel introduceert HILA, een framework voor mens-agent samenwerking dat via een tweeledige policy-optimatie met meta-cognitieve agenten leert wanneer ze zelfstandig moeten handelen en wanneer ze menselijke expertise moeten inschakelen, waardoor systemen continu kunnen leren en robuuster worden in complexe taken.

Wei Yang, Defu Cao, Jiacheng Pang, Muyan Weng, Yan Liu2026-03-10💻 cs

VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments

Het artikel introduceert VORL-EXPLORE, een hybride leer- en planningsframework dat de robuustheid van multi-robot verkenning in dynamische omgevingen verbetert door taaktoewijzing te koppelen aan uitvoeringsbetrouwbaarheid via een gemeenschappelijke navigatie-inschatting, wat leidt tot minder botsingen, kortere paden en minder overlap.

Ning Liu, Sen Shen, Zheng Li, Sheng Liu, Dongkun Han, Shangke Lyu, Thomas Braunl2026-03-10💻 cs

OSExpert: Computer-Use Agents Learning Professional Skills via Exploration

Het artikel introduceert OSExpert, een computer-agent die door middel van een GUI-gebaseerde diepte-zoekalgoritme en het zelfbouwen van een vaardigheidscurriculum complexe taken efficiënter en nauwkeuriger uitvoert, waardoor de prestaties met ongeveer 20% stijgen en het efficiëntieverschil met mensen met 80% wordt verkleind.

Jiateng Liu, Zhenhailong Wang, Rushi Wang, Bingxuan Li, Jeonghwan Kim, Aditi Tiwari, Pengfei Yu, Denghui Zhang, Heng Ji2026-03-10💻 cs

Extend Your Horizon: A Device-Agnostic Surgical Tool Tracking Framework with Multi-View Optimization for Augmented Reality

Dit artikel introduceert een apparaat-onafhankelijk raamwerk voor het volgen van chirurgische instrumenten in augmented reality, dat door het fuseren van meerdere sensormodi binnen een dynamische scènegrafiek de robuustheid van de navigatie verbetert ondanks frequente obstructies in de operatiekamer.

Jiaming Zhang, Mingxu Liu, Hongchao Shu, Ruixing Liang, Yihao Liu, Ojas Taskar, Amir Kheradmand, Mehran Armand, Alejandro Martin-Gomez2026-03-10💻 cs

Energy-Efficient Online Scheduling for Wireless Powered Mobile Edge Computing Networks

Dit artikel presenteert een energie-efficiënt online planningsframework voor draadloze aangedreven mobiele randcomputernetwerken, dat gebaseerd is op Lyapunov-optimalisatie en een relax-then-adjust-aanpak om de wisselwerking tussen energietransfer en computerafhandeling te optimaliseren en een fundamentele afweging tussen latentie en energieverbruik te realiseren.

Xingqiu He, Chaoqun You, Yuzhi Yang, Zihan Chen, Yuhang Shen, Tony Q. S. Quek, Yue Gao2026-03-10💻 cs

On the Feasibility and Opportunity of Autoregressive 3D Object Detection

Dit paper introduceert AutoReg3D, een autoregressieve 3D-objectdetector die LiDAR-detectie omzet in een sequentiële generatietaak zonder ankers of NMS, waardoor training wordt vereenvoudigd en de integratie van geavanceerde taalmodeltechnieken voor 3D-perceptie mogelijk wordt.

Zanming Huang, Jinsu Yoo, Sooyoung Jeon, Zhenzhen Liu, Mark Campbell, Kilian Q Weinberger, Bharath Hariharan, Wei-Lun Chao, Katie Z Luo2026-03-10💻 cs