MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional Reasoning

Ce papier présente MM-CondChain, un nouveau benchmark vérifiable programmatically conçu pour évaluer la capacité des modèles de langage multimodaux à effectuer un raisonnement compositionnel profond et enchaîné basé sur des preuves visuelles, révélant ainsi des lacunes significatives des modèles actuels face à cette complexité.

Haozhan Shen, Shilin Yan, Hongwei Xue + 5 more2026-03-13💻 cs

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

Ce papier présente EVATok, un cadre de tokenisation vidéo adaptative qui optimise dynamiquement l'assignation des tokens pour chaque séquence, permettant ainsi d'atteindre un meilleur compromis entre qualité de reconstruction et coût computationnel pour la génération vidéo autoregressive, tout en réduisant significativement l'utilisation des tokens par rapport aux méthodes existantes.

Tianwei Xiong, Jun Hao Liew, Zilong Huang + 3 more2026-03-13💻 cs

Beyond Binomial and Negative Binomial: Adaptation in Bernoulli Parameter Estimation

Cet article propose un cadre basé sur un treillis pour optimiser l'allocation adaptative des essais dans l'estimation de paramètres de Bernoulli, démontrant par des simulations que cette approche améliore significativement la précision de l'estimation par rapport aux méthodes binomiales classiques, en particulier dans des scénarios d'imagerie active.

Safa C. Medin, John Murray-Bruce, David Castañón + 1 more2026-03-12💻 cs

In Pursuit of Many: A Review of Modern Multiple Object Tracking Systems

Ce document de synthèse examine les avancées récentes en matière de suivi multi-objets, en retraçant l'évolution des paradigmes algorithmiques, en analysant les tendances des benchmarks et des métriques d'évaluation, et en identifiant les orientations futures telles que l'intégration des modèles de fondation pour relever les défis du déploiement réel.

Mk Bashar, Samia Islam, Kashifa Kawaakib Hussain, Md. Bakhtiar Hasan, A. B. M. Ashikur Rahman, Md. Hasanul Kabir2026-03-12💻 cs

Evolution of funding for collaborative health research towards higher-level patient-oriented research. A comparison of the European Union Framework Programmes to the program funding by the United States National Institutes of Health

Cette étude compare l'évolution des financements de la recherche santé collaborative entre l'Union européenne et les États-Unis depuis 2008, révélant que si les programmes européens se sont nettement orientés vers la recherche translationnelle et les systèmes de santé, les publications scientifiques restent dominées par la recherche biomédicale fondamentale, mettant en lumière un décalage entre les attentes stratégiques des financeurs et les trajectoires réelles de la recherche.

David Fajardo-Ortiz, Bart Thijs, Wolfgang Glanzel, Karin R. Sipido2026-03-12💻 cs

Forging the Unforgeable: On the Feasibility of Counterfeit Watermarks in Backdoor-Based Dataset Ownership Verification

Ce papier démontre que les schémas actuels de filigranes par porte dérobée pour la vérification de la propriété des jeux de données sont vulnérables à la contrefaçon, car un attaquant peut générer des filigranes forgés statistiquement indiscernables des originaux pour réfuter des accusations de violation du droit d'auteur.

Zhiying Li, Zhi Liu, Dongjie Liu, Shengda Zhuo, Guanggang Geng, Zhaoxin Fan, Shanxiang Lyu, Xiaobo Jin, Jian Weng2026-03-12💻 cs

vS-Graphs: Tightly Coupling Visual SLAM and 3D Scene Graphs Exploiting Hierarchical Scene Understanding

Le papier présente vS-Graphs, un cadre VSLAM en temps réel qui améliore la précision de la localisation et la richesse sémantique des cartes en intégrant une compréhension hiérarchique de la scène dans des graphes 3D optimisables, surpassant les méthodes de l'état de l'art de 15,22 % en moyenne.

Ali Tourani, Saad Ejaz, Hriday Bavle, Miguel Fernandez-Cortizas, David Morilla-Cabello, Jose Luis Sanchez-Lopez, Holger Voos2026-03-12💻 cs

PromCopilot: Simplifying Prometheus Metric Querying in Cloud Native Online Service Systems via Large Language Models

Cet article présente PromCopilot, un cadre basé sur les grands modèles de langage et les graphes de connaissances qui simplifie l'interrogation de Prometheus en traduisant le langage naturel en requêtes PromQL, et introduit le premier jeu de données de référence pour cette tâche.

Chenxi Zhang, Bicheng Zhang, Dingyu Yang, Xin Peng, Miao Chen, Senyu Xie, Gang Chen, Wei Bi, Wei Li2026-03-12💻 cs

Leveraging Spatial Context for Positive Pair Sampling in Histopathology Image Representation Learning

Cet article propose une stratégie d'échantillonnage de paires positives exploitant le contexte spatial des tissus pour améliorer l'apprentissage auto-supervisé en pathologie numérique, surpassant les méthodes d'augmentation synthétique traditionnelles sur plusieurs jeux de données.

Willmer Rafell Quinones Robles, Sakonporn Noree, Jongwoo Kim, Young Sin Ko, Bryan Wong, Mun Yong Yi2026-03-12💻 cs

Rethinking Two-Stage Referring-by-Tracking in Referring Multi-Object Tracking: Make it Strong Again

Cet article propose FlexHook, un nouveau cadre de suivi d'objets référé en deux étapes qui surpasse les méthodes actuelles de l'état de l'art en résolvant les limitations des constructions de caractéristiques heuristiques et de la modélisation fragile des correspondances grâce à une stratégie d'injection de repères conditionnés par le langage et à un décodeur de correspondance par paires.

Weize Li, Yunhao Du, Qixiang Yin, Zhicheng Zhao, Fei Su2026-03-12💻 cs