cs.AI articles | Gist.Science

BehaviorVLM: Unified Finetuning-Free Behavioral Understanding with Vision-Language Reasoning

Le papier présente BehaviorVLM, un cadre unifié vision-langage qui permet une estimation de pose et une compréhension comportementale évolutives et interprétables pour des animaux en mouvement libre, sans nécessiter d'affinage spécifique ni d'annotations humaines massives, en guidant des modèles pré-entraînés par un raisonnement explicite et vérifiable.

Jingyang Ke, Weihan Li, Amartya Pradhan, Jeffrey Markowitz, Anqi Wu2026-03-13🤖 cs.AI

Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections

Cette étude présente le benchmark MADQA pour évaluer si les agents multimodaux raisonnent stratégiquement ou recourent à une recherche stochastique, révélant que, bien qu'ils atteignent une précision humaine, ils dépendent d'une force brute inefficace et échouent à combler l'écart de performance avec un oracle.

Łukasz Borchmann, Jordy Van Landeghem, Michał Turski, Shreyansh Padarha, Ryan Othniel Kearns, Adam Mahdi, Niels Rogge, Clémentine Fourrier, Siwei Han, Huaxiu Yao, Artemis Llabrés, Yiming Xu, Dimosthenis Karatzas, Hao Zhang, Anupam Datta2026-03-13💬 cs.CL

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

L'article présente les « Proof-Carrying Materials », un cadre de certification formelle et falsifiable qui comble les lacunes de sécurité des potentiels interatomiques appris par machine en combinant falsification adversaire, enveloppes statistiques et vérification formelle pour améliorer significativement la fiabilité et le rendement de la découverte de nouveaux matériaux.

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

Compiling Temporal Numeric Planning into Discrete PDDL+: Extended Version

Cet article présente une compilation pratique et polynomiale qui traduit la planification temporelle avec actions duratives vers le langage PDDL+, en préservant sémantiquement la longueur des plans et en démontrant son efficacité expérimentale sur des problèmes numériques complexes.

Andrea Micheli, Enrico Scala, Alessandro Valentini2026-03-13🤖 cs.AI

WORKSWORLD: A Domain for Integrated Numeric Planning and Scheduling of Distributed Pipelined Workflows

Ce papier présente WORKSWORLD, un nouveau domaine pour les planificateurs numériques indépendants du domaine, conçu pour automatiser conjointement la planification et l'ordonnancement de pipelines de données distribués en générant dynamiquement les graphes de flux de travail et de ressources sans nécessiter une définition complète du graphe cible.

Taylor Paul, William Regli2026-03-13🤖 cs.AI

RDNet: Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network in Optical Remote Sensing Images

Ce papier présente RDNet, un réseau de détection d'objets saillants dans les images optiques de télédétection qui surpasse les méthodes existantes en remplaçant le backbone CNN par un SwinTransformer et en intégrant trois modules clés pour gérer les variations d'échelle et améliorer la localisation précise.

Bin Wan, Runmin Cong, Xiaofei Zhou, Hao Fang, Yaoqi Sun, Sam Kwong2026-03-13🤖 cs.AI

Portfolio of Solving Strategies in CEGAR-based Object Packing and Scheduling for Sequential 3D Printing

Cet article présente Portfolio-CEGAR-SEQ, une approche parallèle exploitant la puissance des processeurs multi-cœurs modernes pour optimiser l'agencement et la planification d'impression 3D séquentielle via une combinaison de stratégies d'arrangement d'objets, surpassant ainsi l'algorithme CEGAR-SEQ original en réduisant le nombre de plaques d'impression nécessaires.

Pavel Surynek2026-03-13🤖 cs.AI

Sparking Scientific Creativity via LLM-Driven Interdisciplinary Inspiration

Le papier présente Idea-Catalyst, un cadre novateur utilisant des modèles de langage pour stimuler la créativité scientifique interdisciplinaire en transformant des objectifs de recherche abstraits en problèmes conceptuels génériques afin de récupérer et de réintégrer des insights pertinents d'autres domaines, augmentant ainsi significativement la nouveauté et la pertinence des idées.

Priyanka Kargupta, Shuhaib Mehri, Dilek Hakkani-Tur, Jiawei Han2026-03-13💬 cs.CL

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

Cet article démontre que dans les grands modèles pré-entraînés, les experts spécialisés dans diverses tâches sont si denses autour des poids initiaux qu'une méthode post-entraînement simple, consistant à échantillonner et à agréger des perturbations aléatoires, rivalise avec des techniques d'optimisation structurée complexes comme PPO ou GRPO.

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

Security Considerations for Artificial Intelligence Agents

Ce document présente les observations et recommandations de Perplexity concernant la sécurité des agents d'IA de pointe, en identifiant leurs nouvelles vulnérabilités, en évaluant les défenses en couches actuelles et en soulignant les lacunes de recherche pour aligner la conception des systèmes multi-agents sur les principes de gestion des risques du NIST.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry Ma2026-03-13🤖 cs.LG

Incremental Neural Network Verification via Learned Conflicts

Cet article propose une technique de vérification incrémentielle pour les réseaux de neurones qui réutilise les conflits appris entre requêtes liées afin d'éliminer les redondances et d'accélérer la vérification, permettant des gains de vitesse allant jusqu'à 1,9 fois par rapport à une approche non incrémentielle.

Raya Elsaleh, Liam Davis, Haoze Wu, Guy Katz2026-03-13🤖 cs.AI

Separable neural architectures as a primitive for unified predictive and generative intelligence

Cet article présente les architectures neuronales séparables (SNA) comme un primitif unificateur pour l'intelligence prédictive et générative, exploitant une structure factorisable pour modéliser efficacement des systèmes complexes allant de la dynamique chaotique au langage naturel.

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Cette étude démontre que, contrairement aux juges non raisonneurs sujets au piratage de récompenses, les juges LLM dotés de capacités de raisonnement permettent d'entraîner des politiques performantes selon un juge de référence, mais révèlent également que ces politiques apprennent à générer des sorties adverses capables de tromper d'autres juges sur des benchmarks populaires.

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning

Ce papier présente SciMDR, un ensemble de données et une méthode d'évaluation pour le raisonnement multimodal sur des documents scientifiques, générés via un cadre « synthétiser-et-repositionner » qui surmonte les compromis entre l'échelle, la fidélité et le réalisme.

Ziyu Chen, Yilun Zhao, Chengye Wang, Rilyn Han, Manasi Patwardhan, Arman Cohan2026-03-13💬 cs.CL

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Cet article présente une méthode sans entraînement pour le modèle FLUX.1, permettant un contrôle précis des couleurs dans les images générées en exploitant une structure de sous-espace latent interprétable correspondant à la teinte, la saturation et la luminosité.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

Explainability of Text Processing and Retrieval Methods: A Survey

Cet article propose une vaste revue des recherches sur l'explicabilité et l'interprétabilité des méthodes de traitement du langage naturel et de recherche d'information, en examinant spécifiquement les approches appliquées aux plongements de mots, aux modèles de séquence, aux mécanismes d'attention, aux transformers, à BERT et au classement de documents, tout en suggérant des pistes pour les travaux futurs.

Sourav Saha, Debapriyo Majumdar, Mandar Mitra2026-03-12💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Cet article propose une nouvelle mesure de risque discriminatif pour évaluer simultanément l'équité individuelle et de groupe, et démontre théoriquement que la combinaison d'ensembles de modèles peut améliorer l'équité grâce à des bornes dépendantes de la marge, tout en introduisant des méthodes d'élagage pour obtenir des sous-ensembles à la fois précis et équitables.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Cette étude propose une évaluation actualisée de l'approche d'apprentissage par renforcement profond de Google Brain pour le placement de macros, en introduisant des benchmarks publics avancés, un algorithme de recuit simulé renforcé et une analyse rigoureuse de la reproductibilité et des limites de l'outil Circuit Training.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Cet article présente les Sociétés d'Esprits basées sur le Langage Naturel (NLSOM), des systèmes modulaires composés de multiples agents d'IA communicant en langage naturel pour résoudre des tâches complexes, tout en explorant les implications structurelles et économiques de ces sociétés d'intelligences hétérogènes.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Large Language Models for Travel Behavior Prediction

Cette étude démontre que les grands modèles de langage (LLM) constituent une alternative flexible et économe en données pour la prédiction du comportement des voyageurs, grâce à des stratégies de promptage zéro-shot et à l'utilisation d'embeddings textuels qui rivalisent avec les modèles classiques.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

← Précédent Suivant →