PolGS++: Physically-Guided Polarimetric Gaussian Splatting for Fast Reflective Surface Reconstruction

Le papier propose PolGS++, un cadre de reconstruction rapide de surfaces réfléchissantes qui intègre un modèle de BRDF polarisée et un mécanisme de masque de visibilité guidé par la profondeur dans le Splatting Gaussien 3D pour améliorer la précision géométrique et le rendu sans nécessiter de traçage de rayons coûteux.

Yufei Han, Chu Zhou, Youwei Lyu, Qi Chen, Si Li, Boxin Shi, Yunpeng Jia, Heng Guo, Zhanyu Ma2026-03-12💻 cs

HanMoVLM: Large Vision-Language Models for Professional Artistic Painting Evaluation

Ce papier présente HanMoVLM, un modèle vision-langage spécialisé dans l'évaluation experte des peintures chinoises grâce à un raisonnement de type chaîne de pensée validé par des experts et un nouveau jeu de données HanMo-Bench, permettant d'améliorer la génération d'images artistiques en servant de vérificateur de haute qualité.

Hongji Yang, Yucheng Zhou, Wencheng Han, Songlian Li, Xiaotong Zhao, Jianbing Shen2026-03-12💻 cs

Human Presence Detection via Wi-Fi Range-Filtered Doppler Spectrum on Commodity Laptops

Cet article présente une solution pionnière de détection de présence humaine utilisant uniquement le matériel Wi-Fi intégré d'ordinateurs portables commerciaux, grâce à une nouvelle technique de spectre Doppler filtré par portée (RF-DS) et un cadre de traitement adaptatif qui éliminent le besoin de capteurs externes tout en garantissant la confidentialité et une faible complexité computationnelle.

Jessica Sanson, Rahul C. Shah, Valerio Frascolla2026-03-12⚡ eess

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

L'article présente UltrasoundAgents, un cadre d'agents multiples hiérarchique qui imite le flux de travail clinique du diagnostic échographique mammaire en localisant les lésions, en analysant des attributs locaux spécifiques et en intégrant ces preuves pour un raisonnement traçable et précis, le tout optimisé par une stratégie d'entraînement progressive pour atténuer la propagation des erreurs.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

Ce papier propose le DIPE (Distance Invariant Position Encoding), un mécanisme simple qui atténue le phénomène d'effacement visuel dans les modèles multimodaux à long contexte en neutralisant la pénalité de distance inter-modale inhérente au Multimodal RoPE, tout en préservant la structure locale intra-modale.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

S2D: Sparse to Dense Lifting for 3D Reconstruction with Minimal Inputs

Ce papier présente S2D, une nouvelle pipeline qui combine un modèle de diffusion pour corriger les artefacts d'images et une stratégie de reconstruction robuste pour transformer des nuages de points épars en scènes 3D de haute qualité via le Splatting Gaussien 3D, permettant ainsi une reconstruction avec un nombre minimal d'images d'entrée.

Yuzhou Ji, Qijian Tian, He Zhu, Xiaoqi Jiang, Guangzhi Cao, Lizhuang Ma, Yuan Xie, Xin Tan2026-03-12💻 cs

Novel Architecture of RPA In Oral Cancer Lesion Detection

Cette étude présente une nouvelle architecture de détection des lésions du cancer oral utilisant deux implémentations RPA optimisées, dont la version OC-RPAv2, qui réduit le temps de prédiction à 0,06 seconde par image grâce à l'utilisation du patron de conception Singleton et du traitement par lots, offrant ainsi une amélioration d'efficacité de 60 à 100 fois par rapport aux méthodes standards.

Revana Magdy, Joy Naoum, Ali Hamdi2026-03-12💻 cs

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

Cet article présente un cadre d'apprentissage par imitation à vie qui améliore continuellement les politiques grâce à une réplay multimodale dans un espace latent et un ajustement incrémental des caractéristiques, établissant ainsi un nouvel état de l'art sur les benchmarks LIBERO avec une réduction significative de l'oubli.

Fanqi Yu, Matteo Tiezzi, Tommaso Apicella, Cigdem Beyan, Vittorio Murino2026-03-12💻 cs

Bridging the Skill Gap in Clinical CBCT Interpretation with CBCTRepD

Le système d'intelligence artificielle générative CBCTRepD comble le fossé des compétences en interprétation des CBCT maxillo-faciaux en produisant des rapports de haute qualité et en améliorant significativement la précision et l'exhaustivité du diagnostic pour les radiologues de tous niveaux d'expérience grâce à une collaboration homme-machine.

Qinxin Wu, Fucheng Niu, Hengchuan Zhu, Yifan Sun, Ye Shen, Xu Li, Han Wu, Leqi Liu, Zhiwen Pan, Zuozhu Liu, Fudong Zhu, Bin Feng2026-03-12💻 cs

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Ce papier propose une méthode d'entraînement par consensus historique, basée sur une sélection itérative de priors à mélange gaussien, qui élimine définitivement l'effondrement postérieur dans les autoencodeurs variationnels en créant une barrière historique stable qui exclut les solutions dégénérées, et ce sans nécessiter de conditions de stabilité explicites ni de contraintes architecturales.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Contrastive learning-based video quality assessment-jointed video vision transformer for video recognition

Cet article propose SSL-V3, une méthode d'apprentissage auto-supervisé combinant un Vision Transformer et une évaluation de la qualité vidéo sans référence pour améliorer la classification vidéo en ajustant les cartes de caractéristiques via un score de qualité, démontrant ainsi son efficacité sur des ensembles de données de soins de santé.

Jian Sun, Mohammad H. Mahoor2026-03-12💻 cs

Med-DualLoRA: Local Adaptation of Foundation Models for 3D Cardiac MRI

Le papier présente Med-DualLoRA, un cadre d'apprentissage fédéré efficace en communication qui améliore l'adaptation locale des modèles fondamentaux pour la détection de maladies en IRM cardiaque 3D en séparant les adaptations globales et locales via des modules LoRA, garantissant ainsi à la fois la confidentialité des données et des performances supérieures sur des données hétérogènes multi-centres.

Joan Perramon-Llussà, Amelia Jiménez-Sánchez, Grzegorz Skorupko, Fotis Avgoustidis, Carlos Martín-Isla, Karim Lekadir, Polyxeni Gkontra2026-03-12💻 cs