Towards Human-Like Manipulation through RL-Augmented Teleoperation and Mixture-of-Dexterous-Experts VLA

Deze paper introduceert een geïntegreerd framework dat RL-getrainde teleoperatiehulp (IMCopilot) en een Mixture-of-Dexterous-Experts VLA-architectuur (MoDE-VLA) combineert om mensachtige, contactrijke bimanuele manipulatie mogelijk te maken door kracht- en tactiele sensoren naadloos te integreren.

Tutian Tang, Xingyu Ji, Wanli Xing, Ce Hao, Wenqiang Xu, Lin Shao, Cewu Lu, Qiaojun Yu, Jiangmiao Pang, Kaifeng Zhang2026-03-10💻 cs

UniGround: Universal 3D Visual Grounding via Training-Free Scene Parsing

Dit paper introduceert UniGround, een training-vrije methode voor universele 3D-visual grounding die door middel van visuele en geometrische redenering objecten in willekeurige 3D-scènes lokaliseert zonder afhankelijk te zijn van vooraf getrainde modellen, waardoor robuustheid en generalisatie naar ongeziene ruimtelijke relaties en domeinen worden bereikt.

Jiaxi Zhang, Yunheng Wang, Wei Lu, Taowen Wang, Weisheng Xu, Shuning Zhang, Yixiao Feng, Yuetong Fang, Renjing Xu2026-03-10💻 cs

POIROT: Investigating Direct Tangible vs. Digitally Mediated Interaction and Attitude Moderation in Multi-party Murder Mystery Games

Deze studie toont aan dat de effectiviteit van fysieke interactie met een robot als spelmeester in moordmysterie-spellen afhankelijk is van de houding van de gebruiker, waarbij personen met een negatieve robotattitude (NARS) juist baat hebben bij een digitale interface om hun immersie te behouden.

Wen Chen, Rongxi Chen, Shankai Chen, Huiyang Gong, Minghui Guo, Yingri Xu, Xintong Wu, Xinyi Fu2026-03-10💻 cs

The Differential Effects of Agreeableness and Extraversion on Older Adults' Perceptions of Conversational AI Explanations in Assistive Settings

Deze studie toont aan dat bij ouderen de persoonlijkheid van een spraakassistent (met name hoge vriendelijkheid) hun empathie- en sympathiepercepties beïnvloedt zonder hun oordeel over intelligentie te veranderen, terwijl contextuele verklaringen in noodsituaties effectiever zijn dan die op basis van gespreksgeschiedenis.

Niharika Mathur, Hasibur Rahman, Smit Desai2026-03-10💻 cs

MERLIN: Building Low-SNR Robust Multimodal LLMs for Electromagnetic Signals

Dit paper introduceert MERLIN, een robuust multimodaal groot taalmodel voor elektromagnetische signalen dat de uitdagingen van data-schaarste, benchmark-tekort en lage signaal-ruisverhoudingen aanpakt door middel van de nieuwe datasets EM-100k, de benchmark EM-Bench en een geavanceerd trainingsframework.

Junyu Shen, Zhendong She, Chenghanyu Zhang, Yuchuang Sun, Luqing Luo, Dingwei Tan, Zonghao Guo, Bo Guo, Zehua Han, Wupeng Xie, Yaxin Mu, Peng Zhang, Peipei Li, Fengxiang Wang, Yangang Sun, Maosong Sun2026-03-10💻 cs

Privacy-Preserving End-to-End Full-Duplex Speech Dialogue Models

Deze studie toont aan dat end-to-end full-duplex spraakmodellen zoals SALM-Duplex en Moshi gevoelige sprekeridentiteitsinformatie lekken in hun verborgen representaties, en presenteert twee streaming-anonimisatiemethoden die de herkenbaarheid van sprekers aanzienlijk verminderen terwijl de responslatentie onder de seconde blijft.

Nikita Kuzmin, Tao Zhong, Jiajun Deng, Yingke Zhu, Tristan Tsoi, Tianxiang Cao, Simon Lui, Kong Aik Lee, Eng Siong Chng2026-03-10💻 cs

Human-AI Collaboration for Scaling Agile Regression Testing: An Agentic-AI Teammate from Manual to Automated Testing

Dit paper presenteert een agentic-AI-systeem dat in samenwerking met Hacon (Siemens) automatisch testscripts genereert op basis van specificaties, waardoor de regressietestcapaciteit in agile omgevingen aanzienlijk wordt verhoogd terwijl menselijke toezicht en kwaliteit behouden blijven.

Moustapha El Outmani, Manthan Venkataramana Shenoy, Ahmad Hatahet, Andreas Rausch, Tim Niklas Kniep, Thomas Raddatz, Benjamin King2026-03-10💻 cs