cs articles | Gist.Science

BrownoutServe: SLO-Aware Inference Serving under Bursty Workloads for MoE-based LLMs

Le papier présente BrownoutServe, un cadre d'inférence innovant pour les grands modèles de langage basés sur l'architecture MoE qui optimise le débit et réduit les violations d'objectifs de niveau de service (SLO) lors de charges de travail imprévisibles grâce à l'intégration d'experts unifiés et à un mécanisme d'assèchement dynamique.

Jianmin Hu, Minxian Xu, Kejiang Ye + 1 more2026-03-10💻 cs

C-Koordinator: Interference-aware Management for Large-scale and Co-located Microservice Clusters

Cet article présente C-Koordinator, une solution open-source déployée chez Alibaba qui améliore l'efficacité des clusters de microservices à grande échelle en co-localisation grâce à des stratégies de gestion d'interférences basées sur la prédiction précise du CPI, réduisant ainsi la latence des applications de 16,7 % à 36,1 %.

Shengye Song, Minxian Xu, Zuowei Zhang + 5 more2026-03-10💻 cs

They See Me Rolling: High-Speed Event Vision-Based Tactile Roller Sensor for Large Surface Inspection

Cet article présente un nouveau capteur tactile à roulement intégrant une caméra neuromorphique qui permet une inspection 3D rapide et continue de grandes surfaces industrielles avec une précision sub-100 microns, surpassant les méthodes existantes par sa vitesse et sa robustesse au flou de mouvement.

Akram Khairi, Hussain Sajwani, Abdallah Mohammad Alkilany, Laith AbuAssi, Mohamad Halwani, Islam Mohamed Zaid, Ahmed Awadalla, Dewald Swart, Abdulla Ayyad, Yahya Zweiri2026-03-10💻 cs

Dynamic Symbolic Execution for Semantic Difference Analysis of Component and Connector Architectures

Cet article explore l'application de l'exécution symbolique dynamique pour analyser les différences sémantiques dans les architectures composants-connecteurs modélisées avec MontiArc, révélant son potentiel tout en soulignant les défis de scalabilité qui limitent son utilisation pratique sur de grands systèmes.

Johanna Grahl, Bernhard Rumpe, Max Stachon, Sebastian Stüber2026-03-10💻 cs

Empowering Microscopic Traffic Simulators with Realistic Perception using Surrogate Sensor Models

Cet article présente MIDAR, un modèle de capteur substitut qui enrichit les simulateurs de trafic microscopiques avec une perception LiDAR réaliste et évolutive en utilisant des graphes de visibilité et des transformateurs géométriques, permettant ainsi une évaluation précise des applications de systèmes de transport intelligents sans coût computationnel excessif.

Tianheng Zhu, Yiheng Feng2026-03-10💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Cette étude présente TransUNet-GradCAM, un modèle hybride combinant Transformers et U-Net qui, grâce à son mécanisme d'attention globale et à ses visualisations explicatives, réalise une segmentation précise et généralisable des ulcères diabétiques du pied sur plusieurs jeux de données cliniques.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward Moore2026-03-10💻 cs

S $^2$ Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation

L'article présente S²Q-VDiT, un cadre de quantification post-entraînement pour les transformateurs de diffusion vidéo qui combine une sélection de données saillantes basée sur l'Hessien et une distillation de tokens épars guidée par l'attention pour atteindre des performances sans perte avec une compression et une accélération significatives.

Weilun Feng, Haotong Qin, Chuanguang Yang, Xiangqi Li, Han Yang, Yuqi Li, Zhulin An, Libo Huang, Michele Magno, Yongjun Xu2026-03-10💻 cs

SPEX: A Vision-Language Model for Land Cover Extraction on Spectral Remote Sensing Images

Le papier présente SPEX, un modèle de langage multimodal innovant qui exploite les informations spectrales via un nouvel ensemble de données d'instructions (SPIE) pour réaliser une extraction précise et interprétable des types de couverture terrestre sur des images de télédétection multispectrales, surpassant les méthodes actuelles.

Dongchen Si, Di Wang, Erzhong Gao, Xiaolei Qin, Liu Zhao, Jing Zhang, Minqiang Xu, Jianbo Zhan, Jianshe Wang, Lin Liu, Bo Du, Liangpei Zhang2026-03-10💻 cs

3D Gaussian Splatting with Fisheye Images: Field of View Analysis and Depth-Based Initialization

Cette étude présente la première évaluation du 3D Gaussian Splatting sur des images fisheye à très grand champ de vue, démontrant que l'initialisation par profondeur via UniK3D surpasse les méthodes SfM traditionnelles pour surmonter les défis de distorsion et de reconstruction géométrique.

Ulas Gunes, Matias Turkulainen, Mikhail Silaev, Juho Kannala, Esa Rahtu2026-03-10💻 cs

Experimental Validation of Provably Covert Communication Using Software-Defined Radio

Cet article présente une validation expérimentale inédite de la communication radiofréquence à faible probabilité de détection en utilisant des radios logicielles, confirmant ainsi les limites théoriques de la loi racine carrée et ouvrant la voie à des systèmes de communication discrets pratiques.

Rohan Bali, Trevor E. Bailey, Michael S. Bullock, Boulat A. Bash2026-03-10💻 cs

Unified and Semantically Grounded Domain Adaptation for Medical Image Segmentation

Cet article propose un cadre unifié et sémantiquement ancré pour l'adaptation de domaine en segmentation d'images médicales, qui apprend une variété probabiliste d'anatomies génériques pour permettre une adaptation performante et interprétable sans nécessiter d'alignement explicite entre les domaines source et cible, que ceux-ci soient accessibles ou non.

Xin Wang, Yin Guo, Jiamin Xia, Kaiyu Zhang, Niranjan Balu, Mahmud Mossa-Basha, Linda Shapiro, Chun Yuan2026-03-10💻 cs

Video-EM: Event-Centric Episodic Memory for Long-Form Video Understanding

Le papier présente Video-EM, un cadre d'apprentissage gratuit basé sur la mémoire épisodique centrée sur les événements qui transforme la compréhension de vidéos longues en une construction et un raffinement d'événements temporellement cohérents pour surmonter les limites des fenêtres contextuelles des modèles de langage vidéo.

Yun Wang, Long Zhang, Jingren Liu, Jiaqi Yan, Zhanjie Zhang, Jiahao Zheng, Ao Ma, Run Ling, Xun Yang, Dapeng Wu, Xiangyu Chen, Xuelong Li2026-03-10💻 cs

UniUGG: Unified 3D Understanding and Generation via Geometric-Semantic Encoding

Ce papier présente UniUGG, le premier cadre unifié exploitant un LLM et un décodeur spatial basé sur la diffusion latente pour réaliser simultanément la compréhension et la génération de scènes 3D à partir d'images de référence et de transformations de vue, tout en répondant à des questions visuelles spatiales grâce à une stratégie d'apprentissage combinant indices géométriques et sémantiques.

Yueming Xu, Jiahui Zhang, Ze Huang, Yurui Chen, Yanpeng Zhou, Zhenyu Chen, Yu-Jie Yuan, Pengxiang Xia, Guowei Huang, Xinyue Cai, Zhongang Qi, Xingyue Quan, Jianye Hao, Hang Xu, Li Zhang2026-03-10💻 cs

UniCast: A Unified Framework for Instance-Conditioned Multimodal Time-Series Forecasting

Le papier présente UniCast, un cadre multimodal économe en paramètres qui améliore les modèles de fondation pour les séries temporelles grâce à un prompting conditionné par l'instance et un routage dynamique des modalités, permettant une adaptation précise aux variations spécifiques de chaque cas sans modifier le modèle de base.

Sehyuk Park, Soyeon Caren Han, Eduard Hovy2026-03-10💻 cs

PhysGM: Large Physical Gaussian Model for Feed-Forward 4D Synthesis

Le papier présente PhysGM, un cadre feed-forward novateur qui génère en une minute des simulations 4D réalistes à partir d'une seule image en prédisant conjointement des représentations gaussiennes 3D et des propriétés physiques, le tout entraîné sur le nouveau jeu de données PhysAssets et optimisé via DPO pour éviter les méthodes coûteuses.

Chunji Lv, Zequn Chen, Donglin Di, Weinan Zhang, Hao Li, Wei Chen, Yinjie Lei, Changsheng Li2026-03-10💻 cs

Efficient Diffusion-Based 3D Human Pose Estimation with Hierarchical Temporal Pruning

Cet article propose un cadre d'estimation de pose humaine 3D basé sur la diffusion optimisé par une stratégie d'élagage temporel hiérarchique (HTP) qui réduit considérablement les coûts computationnels tout en maintenant des performances de pointe grâce à une élimination dynamique des tokens de pose redondants.

Yuquan Bi, Hongsong Wang, Xinli Shi, Zhipeng Gui, Jie Gui, Yuan Yan Tang2026-03-10💻 cs

PointSlice: Accurate and Efficient Slice-Based Representation for 3D Object Detection from Point Clouds

Le papier présente PointSlice, une méthode innovante de détection d'objets 3D qui transforme les nuages de points en tranches 2D et intègre un réseau d'interaction de tranches (SIN) pour atteindre un équilibre optimal entre précision et efficacité, surpassant les approches par voxels et piliers en termes de vitesse et de nombre de paramètres tout en maintenant des performances élevées sur plusieurs jeux de données de référence.

Liu Qifeng, Zhao Dawei, Dong Yabo, Xiao Liang, Wang Juan, Min Chen, Li Fuyang, Jiang Weizhong, Lu Dongming, Nie Yiming2026-03-10💻 cs

AmphiKey: A Dual-Mode Secure Authenticated Key Encapsulation Protocol for Smart Grid

L'article présente AmphiKey, un protocole hybride post-quantique et classique conçu pour sécuriser les communications des réseaux intelligents grâce à deux modes opérationnels distincts offrant soit une authentification forte et non-répudiable, soit une authentification déniable, le tout validé par des performances optimisées sur des infrastructures hétérogènes allant des serveurs puissants aux appareils contraints comme le Raspberry Pi.

Kazi Hassan Shakib, Muhammad Asfand Hafeez, Arslan Munir2026-03-10💻 cs

Mix-modal Federated Learning for MRI Image Segmentation

Cet article propose un nouveau cadre d'apprentissage fédéré mixte appelé MDM-MixMFL, qui utilise des stratégies de découplage et de mémorisation des modalités pour surmonter les hétérogénéités de données et de modalités dans la segmentation d'images IRM médicales distribuées.

Guyue Hu, Siyuan Song, Jingpeng Sun, Zhe Jin, Chenglong Li, Jin Tang2026-03-10💻 cs

UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction

Le papier présente UltraUPConvNet, un cadre universel et économe en calcul basé sur UPerNet et ConvNeXt, conçu pour réaliser simultanément la segmentation des tissus et la prédiction de maladies dans les images échographiques avec des performances de pointe.

Zhi Chen, Le Zhang2026-03-10💻 cs

← Précédent Suivant →

cs