cs.AI articles | Gist.Science

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Ce papier présente PromptDLA, un cadre d'analyse de mise en page de documents sensible au domaine qui intègre des connaissances descriptives via un générateur d'invocations personnalisé pour améliorer la généralisation et atteindre les performances les plus avancées sur plusieurs ensembles de données publics.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Cet article propose un cadre de distillation de distribution basé sur l'estimation de vraisemblance maximale implicite (IMLE) qui transforme une politique experte à base de flux conditionnel en une politique étudiante en une seule étape, permettant un contrôle robotique multi-modal en temps réel sans effondrement de la distribution.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Cette étude révèle que les grands modèles de langage perpétuent des stéréotypes de genre en s'appuyant sur des déterminants sociaux de la santé dans des dossiers médicaux français, soulignant la nécessité d'évaluer les interactions entre ces facteurs pour mieux mesurer les biais.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel MorinWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Cet article propose un cadre de prévision de mouvement en monde ouvert qui, en s'appuyant sur une stratégie d'apprentissage incrémental de classe combinant étiquetage pseudo et échantillonnage de replay, permet aux véhicules autonomes d'anticiper les trajectoires d'objets directement à partir d'images tout en évitant l'oubli catastrophique et en s'adaptant continuellement à de nouvelles classes d'objets.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

CERES est un système d'alerte précoce probabiliste, automatisé et ouvert qui fournit des estimations hebdomadaires à 90 jours de l'insécurité alimentaire aiguë pour 43 pays à risque élevé en fusionnant six flux de données via un modèle de scoring logistique, tout en s'engageant à une vérification prospective publique de chaque prédiction.

Tom Danny S. PedersenWed, 11 Ma🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Cette étude révèle que les grands modèles de langage privilégient systématiquement le raisonnement moral au détriment du bon sens, et qu'ils présentent un biais de focalisation narrative les empêchant de détecter les contradictions de bon sens lorsqu'elles sont attribuées au narrateur principal plutôt qu'à un personnage secondaire.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya PurkayasthaWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Ce papier présente un jeu de données ouvert, transparent et reproductible conçu pour évaluer automatiquement la conformité des systèmes NLP et RAG au Règlement sur l'IA de l'UE, en générant des tâches complexes comme la classification des risques et la récupération d'articles à l'aide de modèles de langage pour surmonter les ambiguïtés réglementaires.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

Ce papier présente OncoAgent, un agent IA novateur capable de générer en zéro-shot et sans réentraînement des volumes cibles tridimensionnels pour la radiothérapie en convertissant directement des lignes directrices cliniques textuelles, surpassant ainsi les modèles supervisés traditionnels en termes de conformité aux protocoles et d'acceptabilité clinique.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Ce papier présente VMoER, une approche bayésienne structurée qui intègre l'inférence variationnelle dans le routage des modèles Mixture-of-Experts pour fournir une quantification fiable de l'incertitude à grande échelle avec un surcoût computationnel négligeable.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

Le papier présente RoadLogic, une solution open-source qui comble le fossé entre les spécifications déclaratives OpenSCENARIO et les simulations exécutables pour les véhicules autonomes en utilisant la programmation par ensembles de réponses et la planification de mouvement pour générer automatiquement des scénarios réalistes et conformes.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Cette étude identifie et explique théoriquement le phénomène d'effondrement lors de la fusion de modèles, démontrant que l'incompatibilité des représentations, et non des conflits dans l'espace des paramètres, est la cause principale des dégradations de performance catastrophiques lors de la combinaison de modèles spécialisés dans différentes tâches.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao XieWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

Le papier présente EvoDriveVLA, un cadre novateur de distillation collaborative perception-planification qui améliore les modèles Vision-Language-Action pour la conduite autonome en intégrant des contraintes perceptuelles auto-ancrées et une optimisation de trajectoire guidée par un oracle pour surmonter les problèmes de dégradation de la perception et d'instabilité à long terme.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI

Telogenesis: Goal Is All U Need

L'article Telogenesis démontre que des priorités attentionnelles adaptatives et capables de révéler la structure environnementale latente peuvent émerger de manière endogène chez un agent uniquement à partir de trois écarts épistémiques (ignorance, surprise et obsolescence), sans nécessiter de récompenses externes.

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan ShenWed, 11 Ma🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Le papier présente GenePlan, un cadre novateur utilisant des algorithmes évolutionnaires assistés par des modèles de langage pour générer des planificateurs généralisés interprétables en Python qui surpassent les méthodes basées sur le prompting et rivalisent avec les planificateurs de l'état de l'art en termes de performance et d'efficacité.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael CashmoreWed, 11 Ma🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

Cet article propose que l'interaction entre le raisonnement humain et l'IA générative crée une « troisième entité » émergente naviguant par « vibe-creation », une forme d'automatisation du savoir tacite qui redéfinit l'épistémologie, la philosophie de l'esprit et la pédagogie.

Ilya LevinWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Cet article présente les flux de normalisation conditionnés temporellement (tcNF), un nouveau cadre d'apprentissage profond qui améliore la détection d'anomalies dans les séries temporelles multivariées en modélisant avec précision les dépendances temporelles et les incertitudes via une approche autorégressive.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

L'article présente EvoPrompt, un cadre novateur qui assure une adaptation stable et sans oubli des modèles vision-langage pré-entraînés vers des tâches à peu d'exemples en guidant l'évolution des prompts via un projecteur partagé, une stratégie de mise à jour hiérarchique et une régularisation géométrique des caractéristiques.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang LiWed, 11 Ma🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

Ce papier présente EDA, un cadre efficace et économe en paramètres et en données qui restaure les performances du décodage spéculatif sur des modèles cibles adaptés à des domaines spécifiques en utilisant une architecture découplée, une régénération de données et une sélection d'échantillons, évitant ainsi le coût d'un réentraînement complet.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong JiWed, 11 Ma🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Cette étude propose une méthode novatrice utilisant les grands modèles de langage pour adapter les messages de démystification des fausses nouvelles aux traits de personnalité des individus, démontrant que cette personnalisation améliore la persuasion tout en soulevant des questions éthiques importantes.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. PassaroWed, 11 Ma🤖 cs.AI

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Ce papier présente une implémentation de Mamba-2 entièrement compilée via XLA, éliminant la dépendance aux noyaux CUDA personnalisés pour permettre un cache autorégressif portable en $O(1)$ et des performances élevées sur CPU, GPU NVIDIA et TPU à partir d'une seule source JAX.

Cosmo SantoniWed, 11 Ma🤖 cs.AI

← Précédent Suivant →

cs.AI