cs.AI articles | Gist.Science

Bridging Discrete Marks and Continuous Dynamics: Dual-Path Cross-Interaction for Marked Temporal Point Processes

Le papier présente NEXTPP, un cadre innovant à double voie qui unifie les représentations discrètes et continues via une interaction croisée pour améliorer la prédiction des processus ponctuels temporels marqués en surmontant les limites des approches séquentielles et des équations différentielles neuronales existantes.

Yuxiang Liu, Qiao Liu, Tong Luo, Yanglei Gan, Peng He, Yao LIu2026-03-13🤖 cs.LG

Stage-Adaptive Reliability Modeling for Continuous Valence-Arousal Estimation

Le papier présente SAGE, un cadre d'estimation de la valence et de l'arousal continu qui améliore la robustesse multimodale en adaptant dynamiquement la fusion audio-visuelle à la fiabilité variable des signaux selon les étapes d'interaction.

Yubeen Lee, Sangeun Lee, Junyeop Cha, Eunil Park2026-03-13🤖 cs.AI

Grammar of the Wave: Towards Explainable Multivariate Time Series Event Detection via Neuro-Symbolic VLM Agents

Cet article propose une approche neuro-symbolique novatrice, baptisée « Grammar of the Wave », qui utilise des arbres de logique d'événements (ELT) pour permettre à des agents VLM de détecter des événements dans des séries temporelles multivariées à partir de descriptions textuelles avec peu de données, tout en générant des explications fiables et en réduisant les hallucinations.

Sky Chenwei Wan, Tianjun Hou, Yifei Wang, Xiqing Chang, Aymeric Jan2026-03-13🤖 cs.LG

INFACT: A Diagnostic Benchmark for Induced Faithfulness and Factuality Hallucinations in Video-LLMs

Le papier présente INFACT, un benchmark diagnostique composé de 9 800 instances de questions-réponses sur des vidéos réelles et synthétiques, conçu pour évaluer la fiabilité des modèles de langage vidéo face aux hallucinations de fidélité et de factualité dans des conditions dégradées, révélant ainsi que la précision de base ne garantit pas la robustesse du modèle.

Junqi Yang, Yuecong Min, Jie Zhang, Shiguang Shan, Xilin Chen2026-03-13🤖 cs.AI

SPEGC: Continual Test-Time Adaptation via Semantic-Prompt-Enhanced Graph Clustering for Medical Image Segmentation

Ce papier propose SPEGC, une méthode d'adaptation continue en temps réel pour la segmentation d'images médicales qui surmonte les limites des approches existantes en combinant une amélioration des caractéristiques par des invites sémantiques et un solveur de clustering graphique différentiable pour atténuer l'accumulation d'erreurs et améliorer la robustesse face aux décalages de domaine.

Xiaogang Du, Jiawei Zhang, Tongfei Liu, Tao Lei, Yingbo Wang2026-03-13🤖 cs.AI

OrthoEraser: Coupled-Neuron Orthogonal Projection for Concept Erasure

Le papier présente OrthoEraser, une méthode innovante qui utilise des auto-encodeurs épars et une projection orthogonale couplée pour éliminer les concepts dangereux des modèles de génération d'images tout en préservant les attributs bénins grâce à un découplage précis des sous-espaces d'activation entrelacés.

Chuancheng Shi, Wenhua Wu, Fei Shen, Xiaogang Zhu, Kun Hu, Zhiyong Wang2026-03-13🤖 cs.AI

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

L'article présente KEPo, une nouvelle méthode d'attaque par empoisonnement conçue spécifiquement pour contourner la robustesse des systèmes GraphRAG en injectant des événements toxiques et des trajectoires d'évolution de connaissances dans le graphe afin de manipuler les réponses des grands modèles de langage.

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang2026-03-13🤖 cs.LG

Gen-Fab: A Variation-Aware Generative Model for Predicting Fabrication Variations in Nanophotonic Devices

Ce papier présente Gen-Fab, un modèle génératif conditionnel basé sur Pix2Pix qui prédit avec précision et modélise l'incertitude des variations de fabrication nanophotoniques en générant des images haute résolution réalistes à partir de conceptions, surpassant ainsi les méthodes déterministes et probabilistes existantes.

Rambod Azimi, Yuri Grinberg, Dan-Xia Xu, Odile Liboiron-Ladouceur2026-03-13🤖 cs.AI

Multi-Agent Collaboration for Automated Design Exploration on High Performance Computing Systems

Ce papier présente MADA, un cadre multi-agents piloté par des modèles de langage qui automatise l'exploration de conceptions complexes sur des systèmes de calcul haute performance pour optimiser la suppression des instabilités de Richtmyer-Meshkov dans la fusion par confinement inertiel.

Harshitha Menon, Charles F. Jekel, Kevin Korner, Brian Gunnarson, Nathan K. Brown, Michael Stees, M. Giselle Fernandez-Godino, Walter Nissen, Meir H. Shachar, Dane M. Sterbentz, William J. Schill, Yue Hao, Robert Rieben, William Quadros, Steve Owen, Scott Mitchell, Ismael D. Boureima, Jonathan L. Belof2026-03-13🤖 cs.AI

FBCIR: Balancing Cross-Modal Focuses in Composed Image Retrieval

Ce papier présente FBCIR, une méthode d'interprétation révélant les déséquilibres d'attention entre modalités dans la recherche d'images composées, et propose une augmentation de données avec des négatifs difficiles pour améliorer la robustesse des modèles dans des scénarios exigeants.

Chenchen Zhao, Jianhuan Zhuo, Muxi Chen, Zhaohua Zhang, Wenyu Jiang, Tianwen Jiang, Qiuyong Xiao, Jihong Zhang, Qiang Xu2026-03-13🤖 cs.AI

EReCu: Pseudo-label Evolution Fusion and Refinement with Multi-Cue Learning for Unsupervised Camouflage Detection

Ce papier présente EReCu, un cadre unifié pour la détection d'objets camouflés non supervisée qui améliore la fiabilité des pseudo-étiquettes et la fidélité des caractéristiques grâce à une fusion d'évolution de pseudo-étiquettes, à une perception native multi-indices et à un raffinement local, permettant d'atteindre des performances de pointe avec une meilleure perception des détails et une alignement robuste des frontières.

Shuo Jiang, Gaojia Zhang, Min Tan, Yufei Yin, Gang Pan2026-03-13🤖 cs.AI

Expert Threshold Routing for Autoregressive Language Modeling with Dynamic Computation Allocation and Load Balancing

Cette présentation propose un routage par seuil d'expert (ET) pour les modèles de langage autoregressifs, qui alloue dynamiquement le calcul et assure l'équilibrage de charge sans pertes auxiliaires en routant chaque token indépendamment selon un seuil mobile, surpassant ainsi les méthodes Mixture-of-Experts à choix de token classiques.

Hanchi Sun, Yixin Liu, Yonghui Wu, Lichao Sun2026-03-13🤖 cs.AI

ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation

Le papier présente ReHARK, un cadre d'adaptation sans entraînement qui résout le dilemme stabilité-plasticité dans l'apprentissage vision-langage en un seul exemple grâce à une régularisation globale dans un espace de Hilbert à noyaux reproduisants et à une pipeline de raffinement multistade, établissant ainsi un nouvel état de l'art avec une précision moyenne de 65,83 % sur 11 benchmarks.

Md Jahidul Islam2026-03-13🤖 cs.AI

One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries

Ce papier présente un cadre d'IA agentique autonome qui orchestre dynamiquement des outils spécialisés pour traiter des requêtes multimodales, réduisant ainsi significativement le temps de réponse, les reformulations et les coûts tout en maintenant une précision équivalente aux approches hiérarchiques.

Mayank Saini Arit Kumar Bishwas2026-03-13💬 cs.CL

MANSION: Multi-floor lANguage-to-3D Scene generatIOn for loNg-horizon tasks

Le papier présente MANSION, le premier cadre de génération d'environnements 3D multi-étages à l'échelle d'un bâtiment piloté par le langage, ainsi que MansionWorld, un jeu de données de plus de 1 000 bâtiments diversifiés conçu pour évaluer et améliorer les capacités de raisonnement spatial et de planification à long horizon des agents robotiques.

Lirong Che, Shuo Wen, Shan Huang, Chuang Wang, Yuzhe Yang, Gregory Dudek, Xueqian Wang, Jian Su2026-03-13🤖 cs.AI

RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks

Le papier présente RoboClaw, un cadre robotique agentic unifié piloté par un modèle vision-langage qui intègre la collecte de données, l'apprentissage et l'exécution via des paires d'actions entrelacées pour permettre une acquisition de données continue et une exécution robuste de tâches à long horizon avec une réduction significative de l'intervention humaine.

Ruiying Li, Yunlang Zhou, YuYao Zhu, Kylin Chen, Jingyuan Wang, Sukai Wang, Kongtao Hu, Minhui Yu, Bowen Jiang, Zhan Su, Jiayao Ma, Xin He, Yongjian Shen, Yangyang, Guanghui Ren, Maoqing Yao, Wenhao Wang, Yao Mu2026-03-13🤖 cs.AI

AI Knows What's Wrong But Cannot Fix It: Helicoid Dynamics in Frontier LLMs Under High-Stakes Decisions

Cette étude prospective révèle que les grands modèles de langage, bien qu'identifiant leurs propres erreurs, tendent à reproduire des schémas d'erreurs sophistiqués dans des situations à haut risque où la vérification est impossible, privilégiant ainsi le confort au détriment de la fiabilité.

Alejandro R Jadad2026-03-13🤖 cs.AI

How Intelligence Emerges: A Minimal Theory of Dynamic Adaptive Coordination

Ce papier propose une théorie dynamique de la coordination adaptative dans les systèmes multi-agents, démontrant que l'intelligence émerge de l'interaction couplée entre agents, incitations et environnement persistant sans nécessiter d'optimisation globale ni de conception centralisée.

Stefano Grassi2026-03-13📈 econ

UtilityMax Prompting: A Formal Framework for Multi-Objective Large Language Model Optimization

Cet article présente le « UtilityMax Prompting », un cadre formel utilisant des diagrammes d'influence et des fonctions d'utilité mathématiques pour optimiser les réponses des grands modèles de langage dans des tâches multi-objectifs, démontrant ainsi des performances supérieures aux approches par langage naturel sur des recommandations de films.

Ofir Marom2026-03-13💬 cs.CL

Toward Complex-Valued Neural Networks for Waveform Generation

Ce papier présente ComVo, un vocodeur neuronal complexe natif qui améliore la qualité de la génération d'audio et réduit le temps d'entraînement grâce à l'utilisation d'arithmétique complexe, d'une quantification de phase et d'un schéma de calcul matriciel par blocs.

Hyung-Seok Oh, Deok-Hyeon Cho, Seung-Bin Kim, Seong-Whan Lee2026-03-13🤖 cs.AI

← Précédent Suivant →