Leveraging GenAI for Segmenting and Labeling Centuries-old Technical Documents

Cet article présente une approche innovante combinant le modèle de segmentation SAM2, les outils de génération de texte Florence2 et ChatGPT, ainsi qu'une ontologie spécialisée, pour segmenter et étiqueter automatiquement les traités de construction navale des XVIe et XVIIe siècles, afin de faciliter la curation et l'accessibilité de ces documents historiques précieux malgré le manque de données d'entraînement.

Carlos Monroy, Benjamin Navarro2026-03-04⚡ eess

A Novel Evolutionary Method for Automated Skull-Face Overlay in Computer-Aided Craniofacial Superimposition

Cet article présente Lilium, une nouvelle méthode évolutive automatisée qui améliore la précision et la robustesse de la superposition crânio-faciale en modélisant explicitement la variabilité des tissus mous via une représentation conique 3D optimisée par un algorithme d'évolution différentielle.

Práxedes Martínez-Moreno, Andrea Valsecchi, Pablo Mesejo + 3 more2026-03-04🤖 cs.AI

ShiftLUT: Spatial Shift Enhanced Look-Up Tables for Efficient Image Restoration

Le papier présente ShiftLUT, un cadre novateur pour la restauration d'images qui combine un module de décalage spatial apprenable, une architecture asymétrique à double branche et une stratégie de compression de table de recherche pour atteindre un champ récepteur maximal et des performances supérieures tout en maintenant une efficacité computationnelle et un stockage réduits pour les dispositifs embarqués.

Xiaolong Zeng, Yitong Yu, Shiyao Xiong + 4 more2026-03-04💻 cs

Learning to Weigh Waste: A Physics-Informed Multimodal Fusion Framework and Large-Scale Dataset for Commercial and Industrial Applications

Cet article présente le cadre Multimodal Weight Predictor (MWP) et le jeu de données Waste-Weight-10K, qui combinent des images RGB et des métadonnées physiques via une fusion multimodale pour estimer avec précision le poids des déchets industriels et commerciaux tout en fournissant des explications interprétables.

Md. Adnanul Islam, Wasimul Karim, Md Mahbub Alam + 7 more2026-03-04💻 cs

Flow Matching-enabled Test-Time Refinement for Unsupervised Cardiac MR Registration

Le papier présente FlowReg, une méthode d'enregistrement d'images cardiaques IRM non supervisée basée sur l'appariement de flux et l'entraînement par reflu, qui permet un raffinement à l'inférence en quelques étapes avec des performances supérieures à l'état de l'art et une réduction de l'erreur d'estimation de la fraction d'éjection ventriculaire gauche.

Yunguan Fu, Wenjia Bai, Wen Yan + 3 more2026-03-04💻 cs

UETrack: A Unified and Efficient Framework for Single Object Tracking

UETrack est un cadre de suivi d'objet unique unifié et efficace capable de traiter plusieurs modalités (RGB, profondeur, thermique, événementiel et langage) grâce à un mécanisme de mélange d'experts basé sur le regroupement de tokens et une stratégie de distillation adaptative, offrant ainsi un compromis optimal entre vitesse et précision sur diverses plateformes matérielles.

Ben Kang, Jie Zhao, Xin Chen + 5 more2026-03-04💻 cs

FACE: A Face-based Autoregressive Representation for High-Fidelity and Efficient Mesh Generation

Le papier présente FACE, un cadre d'autoencodeur autorégressif novateur qui génère des maillages 3D de haute fidélité et à faible coût en traitant chaque face triangulaire comme un token unique, réduisant ainsi drastiquement la longueur des séquences tout en surpassant l'état de l'art en matière de reconstruction et de génération à partir d'une seule image.

Hanxiao Wang, Yuan-Chen Guo, Ying-Tian Liu + 6 more2026-03-04💻 cs

PromptStereo: Zero-Shot Stereo Matching via Structure and Motion Prompts

Le papier présente PromptStereo, une méthode de stéréo matching zero-shot qui améliore la généralisation en intégrant des indices de structure monoculaire et de mouvement stéréo dans un module de raffinement itératif (PRU) basé sur les décodeurs de modèles de profondeur monoculaire, surpassant ainsi les méthodes existantes tout en maintenant une vitesse d'inférence compétitive.

Xianqi Wang, Hao Yang, Hangtian Wang + 4 more2026-03-04💻 cs