Towards Instance Segmentation with Polygon Detection Transformers

Deze paper introduceert Poly-DETR, een lichtgewicht transformer-model dat instantiesegmentatie omvormt tot regressie van polygonen via polaire representatie, waardoor het de afhankelijkheid van dichte pixelmaskers elimineert en aanzienlijk betere prestaties en lagere geheugenvraag bereikt dan bestaande methoden, vooral bij hoge resoluties en regelmatige objecten.

Jiacheng Sun, Jiaqi Lin, Wenlong Hu, Haoyang Li, Xinghong Zhou, Chenghai Mao, Yan Peng, Xiaomao Li2026-03-11💻 cs

Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval

Dit paper introduceert RF-Mem, een adaptief tweestapsretrievalsysteem voor gepersonaliseerde LLM's dat menselijk geheugen nabootst door te schakelen tussen snelle 'familiarity'-herkenning en diepgaande 'recollection'-reconstructie, waardoor het zowel schaalbaar is als nauwkeuriger dan bestaande methoden.

Yingyi Zhang, Junyi Li, Wenlin Zhang, Penyue Jia, Xianneng Li, Yichao Wang, Derong Xu, Yi Wen, Huifeng Guo, Yong Liu, Xiangyu Zhao2026-03-11💻 cs

Platooning as a Service (PlaaS): A Sustainable Transportation Framework for Connected and Autonomous Vehicles

Dit artikel introduceert Platooning as a Service (PlaaS), een op Stackelberg-spellen gebaseerd raamwerk dat de samenwerking tussen een platoonaanbieder en gebruikers optimaliseert om brandstofverbruik en CO2-uitstoot te verminderen, waarbij de analyse aantoont dat winstgevendheid samenhangt met hoge snelheden voor tijdkritische transporten, terwijl brandstofbesparing vooral optreedt bij gematigde snelheden.

Bhosale Akshay Tanaji, Sayak Roychowdhury, Anand Abrahamb2026-03-11💻 cs

Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos

Deze paper introduceert een nieuw raamwerk voor visueel-taalnavigatie dat gebruikmaakt van webvideo's en impliciete geometrische representaties om agents te trainen in realistische omgevingen, wat leidt tot state-of-the-art prestaties en robuuste zero-shot navigatie.

Mingfei Han, Haihong Hao, Liang Ma, Kamila Zhumakhanova, Ekaterina Radionova, Jingyi Zhang, Xiaojun Chang, Xiaodan Liang, Ivan Laptev2026-03-11💻 cs

Entangling Like Mycorrhizae: Mixing Realities Through Touch in "FungiSync"

Het artikel introduceert FungiSync, een co-locale mixed reality-ervaring die mycorrhizale symbiose vertaalt naar een fysiek ritueel waarbij deelnemers door het aanraken van hun handen elkaars individuele augmented reality-werelden laten samensmelten, waardoor ze via een somatische ervaring een meer-dan-menselijke, relationele vorm van kennis en ethiek kunnen ervaren die individuele isolatie uitdaagt.

Botao Amber Hu, Danlin Huang, Yilan Elan Tao, Xiaobo Aaron Hu, Rem RunGu Lin2026-03-11💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

ToolRosetta is een geautomatiseerd framework dat open-source code repositories en API's omzet in MCP-compatibele tools, waardoor LLM-agenten complexe taken kunnen uitvoeren met minimale menselijke tussenkomst en verbeterde prestaties.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong Rui2026-03-11💻 cs

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

Dit paper introduceert See, Plan, Rewind (SPR), een vooruitgangsgevoelig vision-language-action-framework dat robuuste robotmanipulatie bereikt door taken te onderbreken in verifieerbare mijlpalen en automatisch terug te keren naar een herstelpunt bij fouten, wat resulteert in state-of-the-art prestaties en generalisatie op uitdagende benchmarks.

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun Chang2026-03-11💻 cs