A Semi-Supervised Framework for Breast Ultrasound Segmentation with Training-Free Pseudo-Label Generation and Label Refinement

Cet article propose un cadre d'apprentissage semi-supervisé pour la segmentation des ultrasons mammaires qui génère des pseudo-étiquettes sans entraînement grâce à des modèles vision-langage, les affine par des mécanismes d'apprentissage contrastif et atteint des performances comparables aux modèles entièrement supervisés avec seulement 2,5 % de données annotées.

Ruili Li, Jiayi Ding, Ruiyu Li, Yilun Jin, Shiwen Ge, Yuwen Zeng, Xiaoyong Zhang, Eichi Takaya, Jan Vrba, Noriyasu Homma2026-03-09💻 cs

Towards Motion Turing Test: Evaluating Human-Likeness in Humanoid Robots

Cet article propose le « Motion Turing Test » et le jeu de données HHMotion pour évaluer la ressemblance humaine des mouvements de robots humanoïdes, révélant que les modèles de langage actuels sont insuffisants pour cette tâche et introduisant une nouvelle méthode de base plus performante.

Mingzhe Li, Mengyin Liu, Zekai Wu, Xincheng Lin, Junsheng Zhang, Ming Yan, Zengye Xie, Changwang Zhang, Chenglu Wen, Lan Xu, Siqi Shen, Cheng Wang2026-03-09💻 cs

CRIMSON: A Clinically-Grounded LLM-Based Metric for Generative Radiology Report Evaluation

Ce papier présente CRIMSON, un cadre d'évaluation cliniquement fondé pour les rapports de radiologie générés par IA, qui intègre le contexte complet du patient et une pondération basée sur la gravité clinique pour mieux s'aligner sur le jugement des radiologues que les métriques précédentes.

Mohammed Baharoon, Thibault Heintz, Siavash Raissi, Mahmoud Alabbad, Mona Alhammad, Hassan AlOmaish, Sung Eun Kim, Oishi Banerjee, Pranav Rajpurkar2026-03-09🤖 cs.AI

SpaCRD: Multimodal Deep Fusion of Histology and Spatial Transcriptomics for Cancer Region Detection

Le papier présente SpaCRD, une méthode d'apprentissage par transfert qui fusionne profondément l'histologie et la transcriptomique spatiale via un réseau d'attention croisée bidirectionnelle pour détecter avec précision les régions cancéreuses et généraliser les résultats à travers différents échantillons, plateformes et lots, surpassant ainsi les méthodes existantes.

Shuailin Xue, Jun Wan, Lihua Zhang, Wenwen Min2026-03-09💻 cs

Point-Supervised Skeleton-Based Human Action Segmentation

Cet article présente un cadre novateur pour la segmentation d'actions humaines basé sur le squelette et supervisé par points, qui atteint des performances compétitives, parfois supérieures aux méthodes entièrement supervisées, tout en réduisant considérablement l'effort d'annotation grâce à l'utilisation de données multimodales et à des techniques avancées de génération de pseudo-étiquettes.

Hongsong Wang, Yiqin Shen, Pengbo Yan, Jie Gui2026-03-09💻 cs

EntON: Eigenentropy-Optimized Neighborhood Densification in 3D Gaussian Splatting

L'article présente EntON, une nouvelle stratégie de densification de voisinage optimisée par l'entropie des valeurs propres pour le splatting gaussien 3D, qui améliore la précision géométrique et la qualité de rendu tout en réduisant le nombre de gaussiennes et le temps d'entraînement grâce à une alternance entre densification par gradient et densification guidée par la structure locale.

Miriam Jäger, Boris Jutzi2026-03-09💻 cs

Low-latency Event-based Object Detection with Spatially-Sparse Linear Attention

Cet article propose SSLA-Det, un modèle de détection d'objets basé sur des caméras événementielles qui utilise une attention linéaire spatialement parcimonieuse pour surmonter les compromis entre précision et latence, atteignant ainsi des performances de pointe avec une réduction significative des calculs par événement.

Haiqing Hao, Zhipeng Sui, Rong Zou, Zijia Dai, Nikola Zubic, Davide Scaramuzza, Wenhui Wang2026-03-09💻 cs

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

Le papier propose TaPD, un cadre unifié de distillation progressive adaptative au temps qui améliore la prédiction de trajectoire pour la conduite autonome en reconstruisant explicitement les historiques manquants et en transférant des connaissances de modèles à long terme, permettant ainsi des performances robustes même avec des observations très courtes.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

DC-Merge: Improving Model Merging with Directional Consistency

Le papier présente DC-Merge, une méthode de fusion de modèles qui améliore la rétention des connaissances en équilibrant la distribution d'énergie des vecteurs de tâches et en alignant leur géométrie directionnelle dans un sous-espace orthogonal commun, permettant ainsi d'atteindre des performances de pointe sur divers benchmarks.

Han-Chen Zhang, Zi-Hao Zhou, Mao-Lin Luo, Shimin Di, Min-Ling Zhang, Tong Wei2026-03-09🤖 cs.LG

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Le papier présente NOVA, une approche innovante de suivi multi-objets 3D qui utilise l'autorégression de modèles de langage pour généraliser la détection à des cibles inconnues en reformulant les trajectoires comme des séquences sémantiques spatio-temporelles, permettant ainsi d'atteindre des performances supérieures sur des catégories nouvelles grâce à un raisonnement sémantique de haut niveau.

Kai Luo, Xu Wang, Rui Fan, Kailun Yang2026-03-09💻 cs