RiO-DETR: DETR for Real-time Oriented Object Detection

Le papier présente RiO-DETR, le premier détecteur de type Transformer en temps réel pour la détection d'objets orientés, qui résout les défis spécifiques liés à l'orientation grâce à des innovations architecturales comme l'estimation d'angle pilotée par le contenu et un raffinement périodique découplé, établissant ainsi un nouveau compromis vitesse-précision sur plusieurs benchmarks.

Zhangchi Hu, Yifan Zhao, Yansong Peng, Wenzhang Sun, Xiangchen Yin, Jie Chen, Peixi Wu, Hebei Li, Xinghao Wang, Dongsheng Jiang, Xiaoyan Sun2026-03-11💻 cs

MetaDAT: Generalizable Trajectory Prediction via Meta Pre-training and Data-Adaptive Test-Time Updating

Le papier présente MetaDAT, une méthode de prédiction de trajectoire qui améliore la généralisation face aux changements de distribution en combinant un pré-entraînement par méta-apprentissage pour une adaptation rapide et un mécanisme de mise à jour du modèle à l'inférence qui s'adapte dynamiquement aux données et aux échantillons difficiles.

Yuning Wang, Pu Zhang, Yuan He, Ke Wang, Jianru Xue2026-03-11💻 cs

First Steps towards Categorical Algebraic Artificial Chemistry

Cet article présente la construction d'un foncteur qui généralise le modèle AlChemy de Fontana et Buss en attribuant une dynamique à un modèle algébrique de composants interactifs, tout en explorant l'application de la théorie des catégories pour formaliser le lien entre les aspects algébriques et dynamiques de ces chimies artificielles.

Joe Pratt-Johns (Edinburgh Napier University), Toby St. Clere Smithe (Kodamai Ltd), Chris Guiver (Edinburgh Napier University), Kevin Hughes (Edinburgh Napier University), Peter Andras (Edinburgh Napier University)2026-03-11💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

Ce papier présente SEA-Nav, un cadre d'apprentissage par renforcement qui combine des contraintes de fonctions barrières différentiables, un mécanisme de rejou adaptatif et des contraintes cinématiques pour permettre à des robots quadrupèdes de naviguer de manière sûre et agile dans des environnements encombrés avec un temps d'entraînement de seulement quelques minutes.

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun Zhang2026-03-11💻 cs

TopoOR: A Unified Topological Scene Representation for the Operating Room

Le papier présente TopoOR, une nouvelle représentation topologique unifiée qui modélise les salles d'opération chirurgicales comme des structures d'ordre supérieur pour préserver les relations complexes et multimodales, surpassant ainsi les méthodes existantes dans des tâches critiques comme la détection de brèches de stérilité et la prédiction des phases robotiques.

Tony Danjun Wang, Ka Young Kim, Tolga Birdal, Nassir Navab, Lennart Bastian2026-03-11💻 cs

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

Ce rapport d'expérience présente une approche systématique et des principes fondamentaux pour intégrer efficacement des cours d'ingénierie des exigences dans des curriculums d'ingénierie logicielle destinés aux professionnels, en tenant compte de la nature dynamique et modulaire de ces formations.

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide Fucci2026-03-11💻 cs

The Patrologia Graeca Corpus: OCR, Annotation, and Open Release of Noisy Nineteenth-Century Polytonic Greek Editions

Cet article présente le Corpus Patrologia Graeca, la première ressource ouverte à grande échelle d'OCR et d'annotations linguistiques pour les éditions grecques du XIXe siècle, obtenue grâce à un pipeline spécialisé qui atteint des taux d'erreur record sur cette typographie dégradée et fournit six millions de tokens annotés pour la recherche philologique et l'entraînement de modèles.

Chahan Vidal-Gorène (CJM, LIPN), Bastien Kindt2026-03-11💻 cs

MORE-R1: Guiding LVLM for Multimodal Object-Entity Relation Extraction via Stepwise Reasoning with Reinforcement Learning

Le papier présente MORE-R1, un modèle novateur qui améliore l'extraction de relations entre objets visuels et entités textuelles en guidant un grand modèle vision-langage via un raisonnement étape par étape optimisé par apprentissage par renforcement, surpassant ainsi les méthodes existantes sur le benchmark MORE.

Xiang Yuan, Xu Chu, Xinrong Chen, Haochen Li, Zonghong Dai, Hongcheng Fan, Xiaoyue Yuan, Weiping Li, Tong Mo2026-03-11💻 cs

Prune Redundancy, Preserve Essence: Vision Token Compression in VLMs via Synergistic Importance-Diversity

Le papier présente PruneSID, une méthode sans entraînement pour la compression de tokens visuels dans les modèles vision-langage qui, en combinant une analyse des composantes sémantiques principales et une suppression non maximale intra-groupe, atteint des performances de pointe tout en réduisant drastiquement le nombre de tokens et en accélérant le préremplissage.

Zhengyao Fang, Pengyuan Lyu, Chengquan Zhang, Guangming Lu, Jun Yu, Wenjie Pei2026-03-11💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

Le papier présente StyleVLA, un modèle d'action vision-langage fondé sur la physique et entraîné sur un jeu de données spécialisé, qui génère des trajectoires de conduite autonomes à la fois physiquement plausibles et adaptées à des styles de conduite variés, surpassant ainsi les modèles propriétaires et les approches actuelles.

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes Betz2026-03-11💻 cs

Component-Aware Sketch-to-Image Generation Using Self-Attention Encoding and Coordinate-Preserving Fusion

Cet article propose un cadre novateur de génération d'images à partir de croquis, basé sur une architecture en deux étapes intégrant un autoencodeur à auto-attention et une fusion préservant les coordonnées, qui surpasse les modèles actuels en fidélité et en cohérence spatiale sur divers domaines.

Ali Zia, Muhammad Umer Ramzan, Usman Ali, Muhammad Faheem, Abdelwahed Khamis, Shahnawaz Qureshi2026-03-11💻 cs