Bridging Discrete Marks and Continuous Dynamics: Dual-Path Cross-Interaction for Marked Temporal Point Processes

Le papier présente NEXTPP, un cadre innovant à double voie qui unifie les représentations discrètes et continues via une interaction croisée pour améliorer la prédiction des processus ponctuels temporels marqués en surmontant les limites des approches séquentielles et des équations différentielles neuronales existantes.

Yuxiang Liu, Qiao Liu, Tong Luo, Yanglei Gan, Peng He, Yao LIu2026-03-13🤖 cs.LG

Grammar of the Wave: Towards Explainable Multivariate Time Series Event Detection via Neuro-Symbolic VLM Agents

Cet article propose une approche neuro-symbolique novatrice, baptisée « Grammar of the Wave », qui utilise des arbres de logique d'événements (ELT) pour permettre à des agents VLM de détecter des événements dans des séries temporelles multivariées à partir de descriptions textuelles avec peu de données, tout en générant des explications fiables et en réduisant les hallucinations.

Sky Chenwei Wan, Tianjun Hou, Yifei Wang, Xiqing Chang, Aymeric Jan2026-03-13🤖 cs.LG

INFACT: A Diagnostic Benchmark for Induced Faithfulness and Factuality Hallucinations in Video-LLMs

Le papier présente INFACT, un benchmark diagnostique composé de 9 800 instances de questions-réponses sur des vidéos réelles et synthétiques, conçu pour évaluer la fiabilité des modèles de langage vidéo face aux hallucinations de fidélité et de factualité dans des conditions dégradées, révélant ainsi que la précision de base ne garantit pas la robustesse du modèle.

Junqi Yang, Yuecong Min, Jie Zhang, Shiguang Shan, Xilin Chen2026-03-13🤖 cs.AI

SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation

Ce papier propose SPEGC, une méthode d'adaptation continue en temps réel pour la segmentation d'images médicales qui surmonte les limites des approches existantes en combinant une amélioration des caractéristiques par des invites sémantiques et un solveur de clustering graphique différentiable pour atténuer l'accumulation d'erreurs et améliorer la robustesse face aux décalages de domaine.

Xiaogang Du, Jiawei Zhang, Tongfei Liu, Tao Lei, Yingbo Wang2026-03-13🤖 cs.AI

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

L'article présente KEPo, une nouvelle méthode d'attaque par empoisonnement conçue spécifiquement pour contourner la robustesse des systèmes GraphRAG en injectant des événements toxiques et des trajectoires d'évolution de connaissances dans le graphe afin de manipuler les réponses des grands modèles de langage.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang2026-03-13🤖 cs.LG

Gen-Fab: A Variation-Aware Generative Model for Predicting Fabrication Variations in Nanophotonic Devices

Ce papier présente Gen-Fab, un modèle génératif conditionnel basé sur Pix2Pix qui prédit avec précision et modélise l'incertitude des variations de fabrication nanophotoniques en générant des images haute résolution réalistes à partir de conceptions, surpassant ainsi les méthodes déterministes et probabilistes existantes.

Rambod Azimi, Yuri Grinberg, Dan-Xia Xu, Odile Liboiron-Ladouceur2026-03-13🤖 cs.AI

Multi-Agent Collaboration for Automated Design Exploration on High Performance Computing Systems

Ce papier présente MADA, un cadre multi-agents piloté par des modèles de langage qui automatise l'exploration de conceptions complexes sur des systèmes de calcul haute performance pour optimiser la suppression des instabilités de Richtmyer-Meshkov dans la fusion par confinement inertiel.

Harshitha Menon, Charles F. Jekel, Kevin Korner, Brian Gunnarson, Nathan K. Brown, Michael Stees, M. Giselle Fernandez-Godino, Walter Nissen, Meir H. Shachar, Dane M. Sterbentz, William J. Schill, Yue Hao, Robert Rieben, William Quadros, Steve Owen, Scott Mitchell, Ismael D. Boureima, Jonathan L. Belof2026-03-13🤖 cs.AI

FBCIR: Balancing Cross-Modal Focuses in Composed Image Retrieval

Ce papier présente FBCIR, une méthode d'interprétation révélant les déséquilibres d'attention entre modalités dans la recherche d'images composées, et propose une augmentation de données avec des négatifs difficiles pour améliorer la robustesse des modèles dans des scénarios exigeants.

Chenchen Zhao, Jianhuan Zhuo, Muxi Chen, Zhaohua Zhang, Wenyu Jiang, Tianwen Jiang, Qiuyong Xiao, Jihong Zhang, Qiang Xu2026-03-13🤖 cs.AI

EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection

Ce papier présente EReCu, un cadre unifié pour la détection d'objets camouflés non supervisée qui améliore la fiabilité des pseudo-étiquettes et la fidélité des caractéristiques grâce à une fusion d'évolution de pseudo-étiquettes, à une perception native multi-indices et à un raffinement local, permettant d'atteindre des performances de pointe avec une meilleure perception des détails et une alignement robuste des frontières.

Shuo Jiang, Gaojia Zhang, Min Tan, Yufei Yin, Gang Pan2026-03-13🤖 cs.AI

Expert Threshold Routing for Autoregressive Language Modeling with Dynamic Computation Allocation and Load Balancing

Cette présentation propose un routage par seuil d'expert (ET) pour les modèles de langage autoregressifs, qui alloue dynamiquement le calcul et assure l'équilibrage de charge sans pertes auxiliaires en routant chaque token indépendamment selon un seuil mobile, surpassant ainsi les méthodes Mixture-of-Experts à choix de token classiques.

Hanchi Sun, Yixin Liu, Yonghui Wu, Lichao Sun2026-03-13🤖 cs.AI

ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation

Le papier présente ReHARK, un cadre d'adaptation sans entraînement qui résout le dilemme stabilité-plasticité dans l'apprentissage vision-langage en un seul exemple grâce à une régularisation globale dans un espace de Hilbert à noyaux reproduisants et à une pipeline de raffinement multistade, établissant ainsi un nouvel état de l'art avec une précision moyenne de 65,83 % sur 11 benchmarks.

Md Jahidul Islam2026-03-13🤖 cs.AI

MANSION: Multi-floor lANguage-to-3D Scene generatIOn for loNg-horizon tasks

Le papier présente MANSION, le premier cadre de génération d'environnements 3D multi-étages à l'échelle d'un bâtiment piloté par le langage, ainsi que MansionWorld, un jeu de données de plus de 1 000 bâtiments diversifiés conçu pour évaluer et améliorer les capacités de raisonnement spatial et de planification à long horizon des agents robotiques.

Lirong Che, Shuo Wen, Shan Huang, Chuang Wang, Yuzhe Yang, Gregory Dudek, Xueqian Wang, Jian Su2026-03-13🤖 cs.AI

RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks

Le papier présente RoboClaw, un cadre robotique agentic unifié piloté par un modèle vision-langage qui intègre la collecte de données, l'apprentissage et l'exécution via des paires d'actions entrelacées pour permettre une acquisition de données continue et une exécution robuste de tâches à long horizon avec une réduction significative de l'intervention humaine.

Ruiying Li, Yunlang Zhou, YuYao Zhu, Kylin Chen, Jingyuan Wang, Sukai Wang, Kongtao Hu, Minhui Yu, Bowen Jiang, Zhan Su, Jiayao Ma, Xin He, Yongjian Shen, Yangyang, Guanghui Ren, Maoqing Yao, Wenhao Wang, Yao Mu2026-03-13🤖 cs.AI