cs.AI articles | Gist.Science

Telogenesis: Goal Is All U Need

L'article Telogenesis démontre que des priorités attentionnelles adaptatives et capables de révéler la structure environnementale latente peuvent émerger de manière endogène chez un agent uniquement à partir de trois écarts épistémiques (ignorance, surprise et obsolescence), sans nécessiter de récompenses externes.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan Shen2026-03-11🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Le papier présente GenePlan, un cadre novateur utilisant des algorithmes évolutionnaires assistés par des modèles de langage pour générer des planificateurs généralisés interprétables en Python qui surpassent les méthodes basées sur le prompting et rivalisent avec les planificateurs de l'état de l'art en termes de performance et d'efficacité.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore2026-03-11🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Cet article propose que l'interaction entre le raisonnement humain et l'IA générative crée une « troisième entité » émergente naviguant par « vibe-creation », une forme d'automatisation du savoir tacite qui redéfinit l'épistémologie, la philosophie de l'esprit et la pédagogie.

Ilya Levin2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Cet article présente les flux de normalisation conditionnés temporellement (tcNF), un nouveau cadre d'apprentissage profond qui améliore la détection d'anomalies dans les séries temporelles multivariées en modélisant avec précision les dépendances temporelles et les incertitudes via une approche autorégressive.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

L'article présente EvoPrompt, un cadre novateur qui assure une adaptation stable et sans oubli des modèles vision-langage pré-entraînés vers des tâches à peu d'exemples en guidant l'évolution des prompts via un projecteur partagé, une stratégie de mise à jour hiérarchique et une régularisation géométrique des caractéristiques.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li2026-03-11🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Ce papier présente EDA, un cadre efficace et économe en paramètres et en données qui restaure les performances du décodage spéculatif sur des modèles cibles adaptés à des domaines spécifiques en utilisant une architecture découplée, une régénération de données et une sélection d'échantillons, évitant ainsi le coût d'un réentraînement complet.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong Ji2026-03-11🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Cette étude propose une méthode novatrice utilisant les grands modèles de langage pour adapter les messages de démystification des fausses nouvelles aux traits de personnalité des individus, démontrant que cette personnalisation améliore la persuasion tout en soulevant des questions éthiques importantes.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. Passaro2026-03-11🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Ce papier présente une implémentation de Mamba-2 entièrement compilée via XLA, éliminant la dépendance aux noyaux CUDA personnalisés pour permettre un cache autorégressif portable en $O(1)$ et des performances élevées sur CPU, GPU NVIDIA et TPU à partir d'une seule source JAX.

Cosmo Santoni2026-03-11🤖 cs.AI

Routing without Forgetting

Le papier présente « Routing without Forgetting » (RwF), une architecture de transformateur qui résout l'apprentissage continu en ligne en remplaçant l'adaptation par des paramètres fixes par une récupération associative dynamique basée sur l'énergie, permettant ainsi un routage instantané des représentations sans oublier les tâches précédentes.

Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato2026-03-11🤖 cs.AI

A Variational Latent Equilibrium for Learning in Cortex

Cet article propose un formalisme général biologiquement plausible qui approxime la rétropropagation dans le temps en unifiant et en étendant le modèle d'équilibre latent généralisé (GLE) pour offrir un cadre rigoureux d'apprentissage spatiotemporel dans le cortex et des pistes pour des circuits physiques réalisant ces calculs.

Simon Brandt, Paul Haider, Walter Senn, Federico Benitez, Mihai A. Petrovici2026-03-11🤖 cs.AI

Context Engineering: From Prompts to Corporate Multi-Agent Architecture

Cet article propose une nouvelle discipline, l'ingénierie du contexte, qui, complétée par l'ingénierie de l'intention et de la spécification, forme un modèle de maturité pyramidal essentiel pour passer du simple prompt engineering à des architectures multi-agents autonomes et évolutives au sein des entreprises.

Vera V. Vishnyakova2026-03-11🤖 cs.AI

Grounding Synthetic Data Generation With Vision and Language Models

Cet article propose un cadre fondé sur la vision et le langage pour générer et évaluer des données synthétiques interprétables en télédétection, introduisant le jeu de données ARAS400k qui démontre que l'entraînement combiné à des données réelles et synthétiques surpasse systématiquement les modèles basés uniquement sur des données réelles pour les tâches de segmentation sémantique et de légendage d'images.

Ümit Mert Ça\u{g}lar, Alptekin Temizel2026-03-11🤖 cs.AI

PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

Le papier présente PRECEPT, un cadre unifié d'adaptation au moment du test qui améliore la fiabilité des agents LLM en combinant une récupération de règles déterministe, une mémoire conflictuelle et une évolution de prompts guidée par le Pareto, permettant ainsi de surmonter les dégradations de récupération, d'assurer une généralisation compositionnelle robuste et de récupérer efficacement face aux connaissances obsolètes ou adverses.

Arash Shahmansoori2026-03-11🤖 cs.AI

MM-tau-p $^2$ : Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

Le papier propose le benchmark MM-tau-p $^2$ , doté de 12 métriques novatrices, pour évaluer de manière holistique la robustesse et l'adaptation aux personnalités des agents multimodaux dans des environnements à double contrôle, comblant ainsi le vide laissé par les cadres d'évaluation actuels axés sur le chat textuel.

Anupam Purwar, Aditya Choudhary2026-03-11🤖 cs.AI

MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

Ce papier présente MiniAppBench, le premier benchmark complet évaluant la capacité des LLMs à générer des mini-applications interactives en HTML, ainsi que MiniAppEval, un cadre d'évaluation agentic qui utilise l'automatisation du navigateur pour mesurer la qualité de ces applications selon des dimensions intentionnelles, statiques et dynamiques.

Zuhao Zhang, Chengyue Yu, Yuante Li, Chenyi Zhuang, Linjian Mo, Shuai Li2026-03-11🤖 cs.AI

When to Lock Attention: Training-Free KV Control in Video Diffusion

Le papier présente KV-Lock, un cadre sans entraînement pour les modèles de diffusion vidéo basés sur DiT, qui améliore la qualité du premier plan tout en préservant la cohérence de l'arrière-plan en ajustant dynamiquement le verrouillage des clés-valeurs et l'échelle de guidage en fonction de la détection d'hallucinations.

Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian Wang2026-03-11🤖 cs.AI

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Cet article présente un cadre open-source pour la détection d'anomalies dans les séries temporelles utilisant des réseaux de neurones graphiques (GNN), qui démontre non seulement des performances supérieures et une meilleure interprétabilité, mais propose également une évaluation critique des pratiques méthodologiques actuelles.

Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gastón García González, Federico Larroca2026-03-11🤖 cs.AI

Logics-Parsing-Omni Technical Report

Ce rapport technique présente le cadre Omni Parsing, qui intègre détection holistique, reconnaissance fine et interprétation multi-niveaux pour transformer des données multimodales non structurées en connaissances structurées et traçables, tout en introduisant le modèle Logics-Parsing-Omni et l'ensemble de données de référence OmniParsingBench pour évaluer ces capacités.

Xin An, Jingyi Cai, Xiangyang Chen, Huayao Liu, Peiting Liu, Peng Wang, Bei Yang, Xiuwen Zhu, Yongfan Chen, Baoyu Hou, Shuzhao Li, Weidong Ren, Fan Yang, Jiangtao Zhang, Xiaoxiao Xu, Lin Qu2026-03-11🤖 cs.AI

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Le papier présente EsoLang-Bench, un nouveau benchmark utilisant des langages de programmation ésotériques pour révéler que les grands modèles de langage, bien que performants sur les tâches de codage standards, échouent à démontrer un raisonnement véritable en raison d'une dépendance excessive à la mémorisation des données d'entraînement.

Aman Sharma, Paras Chopra2026-03-11🤖 cs.AI

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

Cette étude propose un cadre de classification automatisé pour la gestion des risques cardiaques chez les personnes âgées, démontrant qu'une architecture Transformer personnalisée surpassant les modèles classiques et les grands modèles de langage génériques permet d'exploiter efficacement les dossiers médicaux électroniques non structurés pour une stratification clinique précise.

Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van Es2026-03-11🤖 cs.AI

← Précédent Suivant →

cs.AI