Cycle-Consistent Multi-Graph Matching for Self-Supervised Annotation of C.Elegans

Cet article présente une méthode d'apprentissage non supervisé basée sur la cohérence cyclique et l'optimisation bayésienne pour la correspondance de graphes multiples, permettant d'atteindre la précision des approches supervisées dans l'annotation sémantique des cellules de *C. elegans* et de construire le premier atlas cellulaire non supervisé de cet organisme.

Christoph Karg, Sebastian Stricker, Lisa Hutschenreiter + 2 more2026-03-04💻 cs

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

Cet article présente HSSBench, un benchmark multilingue de plus de 13 000 échantillons conçu pour évaluer et stimuler les capacités de raisonnement interdisciplinaire des modèles de langage multimodaux dans le domaine des sciences humaines et sociales, comblant ainsi une lacune majeure des évaluations actuelles axées sur les STEM.

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI

Frame Guidance: Training-Free Guidance for Frame-Level Control in Video Diffusion Models

Ce papier présente Frame Guidance, une méthode d'entraînement gratuit qui permet un contrôle précis au niveau des images dans la génération de vidéos par diffusion en utilisant des signaux tels que des images clés ou des croquis, tout en optimisant l'utilisation de la mémoire et en assurant une cohérence globale sans nécessiter de fine-tuning.

Sangwon Jang, Taekyung Ki, Jaehyeong Jo + 4 more2026-03-04🤖 cs.AI

MC-INR: Efficient Encoding of Multivariate Scientific Simulation Data using Meta-Learning and Clustered Implicit Neural Representations

Cet article présente MC-INR, un cadre novateur basé sur l'apprentissage par méta-entraînement et le regroupement dynamique pour encoder efficacement des données de simulation scientifique multivariées sur des grilles non structurées, surmontant ainsi les limitations des représentations neuronales implicites existantes.

Hyunsoo Son, Jeonghyun Noh, Suemin Jeon + 2 more2026-03-04🤖 cs.LG

CoBELa: Steering Transparent Generation via Concept Bottlenecks on Energy Landscapes

Le papier présente CoBELa, un cadre basé sur l'énergie sans décodeur qui améliore la transparence de la génération en conditionnant entièrement la synthèse via des fonctions d'énergie par concept, permettant ainsi des interventions compositionnelles fiables et une interprétation post-hoc sans nécessiter de réentraînement du générateur.

Sangwon Kim, Kyoungoh Lee, Jeyoun Dong + 1 more2026-03-04🤖 cs.AI

InstructVLA: Vision-Language-Action Instruction Tuning from Understanding to Manipulation

Le papier présente InstructVLA, un modèle vision-langage-action qui, grâce à un nouveau paradigme d'ajustement par instructions (VLA-IT) et à une adaptation par mélange d'experts, préserve les capacités de raisonnement des grands modèles tout en atteignant des performances de manipulation de pointe et une forte généralisation sur des tâches complexes.

Shuai Yang, Hao Li, Bin Wang + 7 more2026-03-04💻 cs