DSA-SRGS: Super-Resolution Gaussian Splatting for Dynamic Sparse-View DSA Reconstruction

Cet article présente DSA-SRGS, un cadre pionnier de super-résolution par Gaussian Splatting conçu pour reconstruire des modèles 4D de vaisseaux sanguins à haute fidélité à partir de projections DSA dynamiques et peu nombreuses, en intégrant des modules d'apprentissage de texture multi-fidélité et de densification radiative sub-pixel pour surmonter les limitations de résolution et les artefacts des méthodes existantes.

Shiyu Zhang, Zhicong Wu, Huangxuan Zhao + 7 more2026-03-06💻 cs

MADCrowner: Margin Aware Dental Crown Design with Template Deformation and Refinement

Le papier propose MADCrowner, un cadre d'apprentissage automatique novateur qui combine la déformation de modèles 3D guidée par le contexte anatomique et la segmentation précise des marges cervicales pour générer des couronnes dentaires personnalisées avec une précision géométrique et une faisabilité clinique supérieures aux méthodes existantes.

Linda Wei, Chang Liu, Wenran Zhang + 9 more2026-03-06💻 cs

RMK RetinaNet: Rotated Multi-Kernel RetinaNet for Robust Oriented Object Detection in Remote Sensing Imagery

Ce papier propose le RMK RetinaNet, une nouvelle architecture de détection d'objets orientés pour l'imagerie satellitaire qui surpasse les méthodes existantes en surmontant les limitations des champs récepteurs, de la fusion de caractéristiques multi-échelles et de la régression d'angles grâce à des blocs de noyaux multi-échelles, une attention contextuelle directionnelle, un chemin de remontée et un module d'encodage d'angles d'Euler.

Huiran Sun2026-03-06💻 cs

LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation

Cet article propose « LAW & ORDER », un cadre adaptatif de pondération spatiale combinant un pondérateur d'apprentissage (LAW) pour améliorer la synthèse d'images médicales par diffusion et un détecteur de régions optimisé (ORDER) pour la segmentation efficace, démontrant des performances supérieures sur des lésions de petite taille tout en réduisant considérablement la complexité computationnelle.

Anugunj Naman, Ayushman Singh, Gaibo Zhang + 1 more2026-03-06💻 cs

MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models

Ce papier présente MASQuant, un cadre de quantisation post-entraînement innovant pour les modèles de langage multimodaux qui résout les problèmes de désalignement de lissage et d'invariance computationnelle intermodale grâce à un lissage spécifique à la modalité et à une compensation par blanchiment SVD, garantissant ainsi des performances stables et compétitives.

Lulu Hu, Wenhu Xiao, Xin Chen + 4 more2026-03-06💻 cs

Diffusion-Based sRGB Real Noise Generation via Prompt-Driven Noise Representation Learning

Ce papier propose un cadre novateur appelé Prompt-Driven Noise Generation (PNG) qui utilise l'apprentissage de représentations de bruit piloté par des invites pour synthétiser des images bruyantes réalistes en sRGB sans dépendre des métadonnées de la caméra, améliorant ainsi la généralisation et l'efficacité du débruitage dans des scénarios réels.

Jaekyun Ko, Dongjin Kim, Soomin Lee + 2 more2026-03-06💻 cs

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

En analysant une base de données inédite de 119 561 lancers professionnels, cette étude démontre qu'il est possible de prédire avec 80,4 % de précision le type de lancer à partir de la cinématique corporelle 3D extraite de vidéos monoscopiques, en identifiant la mécanique du haut du corps comme le facteur prédictif dominant tout en établissant une limite empirique de séparabilité pour les variantes de prise.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI