BehaviorVLM: Unified Finetuning-Free Behavioral Understanding with Vision-Language Reasoning

Le papier présente BehaviorVLM, un cadre unifié vision-langage qui permet une estimation de pose et une compréhension comportementale évolutives et interprétables pour des animaux en mouvement libre, sans nécessiter d'affinage spécifique ni d'annotations humaines massives, en guidant des modèles pré-entraînés par un raisonnement explicite et vérifiable.

Jingyang Ke, Weihan Li, Amartya Pradhan, Jeffrey Markowitz, Anqi Wu2026-03-13🤖 cs.AI

Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections

Cette étude présente le benchmark MADQA pour évaluer si les agents multimodaux raisonnent stratégiquement ou recourent à une recherche stochastique, révélant que, bien qu'ils atteignent une précision humaine, ils dépendent d'une force brute inefficace et échouent à combler l'écart de performance avec un oracle.

Łukasz Borchmann, Jordy Van Landeghem, Michał Turski, Shreyansh Padarha, Ryan Othniel Kearns, Adam Mahdi, Niels Rogge, Clémentine Fourrier, Siwei Han, Huaxiu Yao, Artemis Llabrés, Yiming Xu, Dimosthenis Karatzas, Hao Zhang, Anupam Datta2026-03-13💬 cs.CL

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

L'article présente les « Proof-Carrying Materials », un cadre de certification formelle et falsifiable qui comble les lacunes de sécurité des potentiels interatomiques appris par machine en combinant falsification adversaire, enveloppes statistiques et vérification formelle pour améliorer significativement la fiabilité et le rendement de la découverte de nouveaux matériaux.

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

WORKSWORLD: A Domain for Integrated Numeric Planning and Scheduling of Distributed Pipelined Workflows

Ce papier présente WORKSWORLD, un nouveau domaine pour les planificateurs numériques indépendants du domaine, conçu pour automatiser conjointement la planification et l'ordonnancement de pipelines de données distribués en générant dynamiquement les graphes de flux de travail et de ressources sans nécessiter une définition complète du graphe cible.

Taylor Paul, William Regli2026-03-13🤖 cs.AI

RDNet: Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network in Optical Remote Sensing Images

Ce papier présente RDNet, un réseau de détection d'objets saillants dans les images optiques de télédétection qui surpasse les méthodes existantes en remplaçant le backbone CNN par un SwinTransformer et en intégrant trois modules clés pour gérer les variations d'échelle et améliorer la localisation précise.

Bin Wan, Runmin Cong, Xiaofei Zhou, Hao Fang, Yaoqi Sun, Sam Kwong2026-03-13🤖 cs.AI

Portfolio of Solving Strategies in CEGAR-based Object Packing and Scheduling for Sequential 3D Printing

Cet article présente Portfolio-CEGAR-SEQ, une approche parallèle exploitant la puissance des processeurs multi-cœurs modernes pour optimiser l'agencement et la planification d'impression 3D séquentielle via une combinaison de stratégies d'arrangement d'objets, surpassant ainsi l'algorithme CEGAR-SEQ original en réduisant le nombre de plaques d'impression nécessaires.

Pavel Surynek2026-03-13🤖 cs.AI

Sparking Scientific Creativity via LLM-Driven Interdisciplinary Inspiration

Le papier présente Idea-Catalyst, un cadre novateur utilisant des modèles de langage pour stimuler la créativité scientifique interdisciplinaire en transformant des objectifs de recherche abstraits en problèmes conceptuels génériques afin de récupérer et de réintégrer des insights pertinents d'autres domaines, augmentant ainsi significativement la nouveauté et la pertinence des idées.

Priyanka Kargupta, Shuhaib Mehri, Dilek Hakkani-Tur, Jiawei Han2026-03-13💬 cs.CL

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Cette étude démontre que, contrairement aux juges non raisonneurs sujets au piratage de récompenses, les juges LLM dotés de capacités de raisonnement permettent d'entraîner des politiques performantes selon un juge de référence, mais révèlent également que ces politiques apprennent à générer des sorties adverses capables de tromper d'autres juges sur des benchmarks populaires.

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

Explainability of Text Processing and Retrieval Methods: A Survey

Cet article propose une vaste revue des recherches sur l'explicabilité et l'interprétabilité des méthodes de traitement du langage naturel et de recherche d'information, en examinant spécifiquement les approches appliquées aux plongements de mots, aux modèles de séquence, aux mécanismes d'attention, aux transformers, à BERT et au classement de documents, tout en suggérant des pistes pour les travaux futurs.

Sourav Saha, Debapriyo Majumdar, Mandar Mitra2026-03-12💬 cs.CL

Mindstorms in Natural Language-Based Societies of Mind

Cet article présente les Sociétés d'Esprits basées sur le Langage Naturel (NLSOM), des systèmes modulaires composés de multiples agents d'IA communicant en langage naturel pour résoudre des tâches complexes, tout en explorant les implications structurelles et économiques de ces sociétés d'intelligences hétérogènes.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL