RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs

L'article présente RSH-SpMM, un cadre hybride de multiplication matrice-matrice creuse optimisé pour les GPU, qui améliore significativement les performances et la stabilité sur des matrices irrégulières grâce à une partitionnement adaptatif des lignes, une représentation RS-Tile compatible avec les Tensor Cores et un réordonnancement local.

Aiying Li, Jingwei Sun, Han Li, Wence Ji, Guangzhong Sun2026-03-11💻 cs

Adaptive Multi-Objective Tiered Storage Configuration for KV Cache in LLM Service

L'article présente Kareto, un optimiseur adaptatif qui résout le problème d'optimisation multi-objectif de la configuration du stockage en couches pour le cache KV des LLM en naviguant efficacement dans l'espace des configurations pour identifier la frontière de Pareto, permettant ainsi d'améliorer le débit, de réduire la latence ou de diminuer les coûts par rapport aux stratégies statiques.

Xianzhe Zheng, Zhengheng Wang, Ruiyan Ma, Rui Wang, Xiyu Wang, Rui Chen, Peng Zhang, Sicheng Pan, Zhangheng Huang, Chenxin Wu, Yi Zhang, Bo Cai, Kan Liu, Teng Ma, Yin Du, Dong Deng, Sai Wu, Guoyun Zhu, Wei Zhang, Feifei Li2026-03-11💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

Cet article présente \texttt{electoral\_sim}, un cadre open-source en Python qui simule et compare la performance de divers systèmes électoraux, y compris un mécanisme hypothétique basé sur un noyau softmax de Boltzmann, en mesurant leur capacité à se rapprocher de la médiane géométrique des électeurs à travers des distributions de préférences variées.

Sumit Mukherjee2026-03-11💻 cs

Serving Compound Inference Systems on Datacenter GPUs

Le papier présente JigsawServe, un cadre de service innovant pour les systèmes d'inférence composés sur les GPU de centre de données qui optimise conjointement la latence, la précision et les coûts en sélectionnant dynamiquement des variantes de modèles et en allouant des ressources GPU de manière spatiale et fine, permettant ainsi d'augmenter la demande de service maximale de 11,3 fois par rapport aux travaux antérieurs.

Sriram Devata, Rahul Singh, Sarita Adve2026-03-11💻 cs

Granulon: Awakening Pixel-Level Visual Encoders with Adaptive Multi-Granularity Semantics for MLLM

Le papier présente Granulon, un nouveau modèle multimodal fondé sur DINOv3 qui surpasse les approches existantes en améliorant la précision et en réduisant les hallucinations grâce à un contrôle adaptatif de la granularité visuelle permettant un raisonnement unifié allant du pixel aux concepts globaux.

Junyuan Mao, Qiankun Li, Linghao Meng, Zhicheng He, Xinliang Zhou, Kun Wang, Yang Liu, Yueming Jin2026-03-11💻 cs

VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model

Le papier présente VisionCreator-R1, un agent natif de génération visuelle doté d'un mécanisme de réflexion explicite et entraîné via une méthode d'optimisation conjointe plan-réflexion (RPCO) qui surpasse Gemini2.5Pro sur des tâches de génération d'images uniques et multiples.

Jinxiang Lai, Wenzhe Zhao, Zexin Lu, Hualei Zhang, Qinyu Yang, Rongwei Quan, Zhimin Li, Shuai Shao, Song Guo, Qinglin Lu2026-03-11💻 cs

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

Ce papier présente HMR-1, un robot de massage hiérarchique intégrant un modèle vision-langage pour l'identification des points d'acupuncture et le contrôle des mouvements, soutenu par le nouveau jeu de données multimodal MedMassage-12K et un benchmark d'évaluation pour les soins de santé incarnés.

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng Zhang2026-03-11💻 cs

Impact of Different Failures on a Robot's Perceived Reliability

Cette étude démontre que les erreurs de sélection ou de placement sont moins préjudiciables à la fiabilité perçue d'un robot que les glissements ou les blocages, et que cette fiabilité peut être rétablie par des exécutions réussies ultérieures sans nécessiter de réparation sociale explicite.

Andrew Violette, Zhanxin Wu, Haruki Nishimura, Masha Itkina, Leticia Priebe Rocha, Mark Zolotas, Guy Hoffman, Hadas Kress-Gazit2026-03-11💻 cs

HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings

Le papier présente HeteroFedSyn, le premier cadre de synthèse de données tabulaires différentiellement privées conçu spécifiquement pour les environnements fédérés horizontaux hétérogènes, qui améliore l'utilité des données synthétiques grâce à des innovations dans la sélection distribuée des marginales tout en préservant la confidentialité.

Xiaochen Li, Fengyu Gao, Xizixiang Wei, Tianhao Wang, Cong Shen, Jing Yang2026-03-11💻 cs

NaviNote: Enabling In-situ Spatial Annotation Authoring to Support Exploration and Navigation for Blind and Low Vision People

Ce papier présente NaviNote, un système conçu pour les personnes aveugles ou malvoyantes qui combine une localisation visuelle de haute précision et une architecture agentique pour permettre la création d'annotations spatiales in situ et améliorer la navigation dans des environnements inconnus.

Ruijia Chen, Yuheng Wu, Charlie Houseago, Filipe Gaspar, Filippo Aleotti, Dorian Gálvez-López, Oliver Johnston, Diego Mazala, Guillermo Garcia-Hernando, Maryam Bandukda, Gabriel Brostow, Jessica Van Brummelen2026-03-11💻 cs