Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports

Deze paper introduceert CourtSI, het eerste grote dataset en benchmark voor ruimtelijke intelligentie in sporten, waarmee de beperkingen van bestaande vision-language modellen worden blootgelegd en een aanzienlijke prestatieverbetering wordt bereikt door fine-tuning.

Yuchen Yang, Yuqing Shao, Duxiu Huang, Linfeng Dong, Yifei Liu, Suixin Tang, Xiang Zhou, Yuanyuan Gao, Wei Wang, Yue Zhou, Xue Yang, Yanfeng Wang, Xiao Sun, Zhihang Zhong2026-03-11💻 cs

Role Classification of Hosts within Enterprise Networks Based on Connection Patterns

Dit artikel introduceert twee praktische algoritmen die hosts in enterprise-netwerken groeperen op basis van connectiepatronen om de logische structuur bloot te leggen en netwerkbeheer te vereenvoudigen, waarbij de resultaten aantonen dat de gegenereerde groepen aanzienlijk kleiner zijn dan het aantal hosts en de netwerklogica nauwkeurig weerspiegelen.

Godfrey Tan, Massimiliano Poletto, John Guttag, Frans Kaashoek2026-03-11💻 cs

WikiCLIP: An Efficient Contrastive Baseline for Open-domain Visual Entity Recognition

Dit paper introduceert WikiCLIP, een efficiënt contrastief raamwerk dat open-domein visuele entiteitsherkenning aanzienlijk verbetert door grote taalmodel-embeddings te combineren met een visueel geleide kennisadapter en een mechanisme voor het synthetiseren van harde negatieven, waardoor het prestaties op benchmarks zoals OVEN significant verhoogt en de inferentielatentie in vergelijking met generatieve modellen met bijna 100 keer verlaagt.

Shan Ning, Longtian Qiu, Jiaxuan Sun, Xuming He2026-03-11💻 cs

Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization

Dit paper introduceert KDMR, een nieuw raamwerk voor het dynamisch herpositioneren van menselijke bewegingen naar humanoiden via multi-contact trajectoptimalisatie, dat fysiek consistente bewegingen genereert door rigide lichaamsdynamica en contactkrachten te integreren, wat leidt tot superieure prestaties en stabiliteit in vergelijking met bestaande kinematische methoden.

Xiaoyu Zhang, Steven Haener, Varun Madabushi, Maegan Tucker2026-03-11💻 cs

TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation

Dit paper introduceert TiPToP, een modulaire en open-vocabulaire planningssysteem dat voorgeprente visiemodellen combineert met een TAMP-planner om robotmanipulatie taken direct op te lossen vanuit RGB-beelden en natuurlijke taal, zonder dat er robotdata nodig is voor training.

William Shen, Nishanth Kumar, Sahit Chintalapudi, Jie Wang, Christopher Watson, Edward Hu, Jing Cao, Dinesh Jayaraman, Leslie Pack Kaelbling, Tomás Lozano-Pérez2026-03-11💻 cs