cs articles | Gist.Science

CDE: Concept-Driven Exploration for Reinforcement Learning

Ce papier propose CDE, une méthode d'exploration en apprentissage par renforcement qui utilise un modèle vision-langage pré-entraîné pour générer des concepts visuels et les exploiter via une tâche de reconstruction comme récompense intrinsèque, permettant ainsi une exploration ciblée efficace dans des tâches de manipulation visuelle complexes, y compris dans le monde réel.

Le Mao, Andrew H. Liu, Renos Zabounidis, Yanan Niu, Zachary Kingston, Joseph Campbell2026-03-10💻 cs

Deliberative Dynamics and Value Alignment in LLM Debates

Cette étude examine comment les dynamiques de délibération et les protocoles d'interaction (synchrone ou séquentiel) influencent la révision des verdicts et l'alignement des valeurs de plusieurs grands modèles de langage lors de l'analyse de dilemmes moraux, révélant des différences significatives de flexibilité et de conformité entre les modèles.

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

Cet article propose un plugin léger et sans réentraînement nommé « Functional Head Identification and Class-Conditioned Rescaling » qui rééquilibre l'attention entre les couches perceptives et de raisonnement des modèles de raisonnement multimodaux pour réduire les hallucinations et améliorer la fiabilité sans modifier l'architecture.

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

Preference-Conditioned Multi-Objective RL for Integrated Command Tracking and Force Compliance in Humanoid Locomotion

Cet article présente un cadre d'apprentissage par renforcement multi-objectif conditionné par des préférences qui permet à une seule politique de locomotion humanoïde de trouver un équilibre dynamique entre le suivi de commandes de navigation et la conformité aux forces externes lors des interactions humaines.

Tingxuan Leng, Yushi Wang, Tinglong Zheng, Changsheng Luo, Mingguo Zhao2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

L'article présente DropVLA, une attaque par porte dérobée au niveau des actions qui permet de forcer l'exécution d'un primitif d'action spécifique dans les modèles Vision-Language-Action (VLA) avec un taux de succès élevé et une perturbation minimale des tâches normales, même dans des environnements physiques réels.

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

Cet article présente un cadre d'apprentissage combinant un modèle du monde et un contrôle prédictif pour permettre aux robots humanoïdes de planifier de manière efficace et robuste des contacts physiques à partir de données visuelles et proprioceptives, surpassant les méthodes traditionnelles en termes d'efficacité d'échantillonnage et de capacité multi-tâches.

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

Protege Effect for Behaviour Change: Does Teaching Digital Stress Solutions to Others Reduce One's Own?

Cette étude conclut que l'approche basée sur l'effet de protgégé, consistant à enseigner des solutions au stress numérique à autrui, ne permet pas de réduire significativement ce stress ni d'améliorer la gestion des comportements problématiques liés aux médias sociaux, soulignant ainsi la difficulté de transformer l'engagement cognitif en changement comportemental durable.

Sameha Alshakhsi, Ala Yankouskaya, Dena Al-Thani, Raian Ali2026-03-10💻 cs

Unsupervised Deep Generative Models for Anomaly Detection in Neuroimaging: A Systematic Scoping Review

Cette revue systématique examine l'application des modèles génératifs profonds non supervisés à la détection d'anomalies en neuroimagerie, soulignant leur potentiel pour identifier des pathologies sans annotations tout en mettant en évidence les défis liés à l'hétérogénéité méthodologique et au manque de validation externe.

Youwan Mahé, Elise Bannier, Stéphanie Leplaideur, Elisa Fromont, Francesca Galassi2026-03-10💻 cs

A Robust Placeability Metric for Model-Free Unified Pick-and-Place Reasoning

Cet article présente une métrique probabiliste robuste permettant d'évaluer la placeabilité d'objets inconnus à partir d'observations partielles, unifiant ainsi la planification de préhension et de dépôt sans nécessiter de modèles d'objets préalables.

Benno Wingender, Nils Dengler, Rohit Menon, Sicong Pan, Maren Bennewitz2026-03-10💻 cs

Taming Modality Entanglement in Continual Audio-Visual Segmentation

Cet article propose un nouveau cadre de rééchantillonnage par collision (CMR) pour la segmentation audio-vidéo continue, qui résout les problèmes de dérive sémantique et de confusion entre classes co-occurrentes en sélectionnant des échantillons multimodaux cohérents et en augmentant la fréquence de réentraînement des classes confusables.

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

PolyJailbreak: Cross-Modal Jailbreaking Attacks on Black-Box Multimodal LLMs

Ce papier présente PolyJailbreak, un nouveau cadre d'attaque en boîte noire pour les modèles de langage multimodaux (MLLM) qui exploite une asymétrie de sécurité entre les modalités pour générer des contournements de sécurité efficaces via une optimisation par apprentissage par renforcement multi-agents.

Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Guangquan Xu, Shouling Ji2026-03-10💻 cs

HumanHalo - Safe and Efficient 3D Navigation Among Humans via Minimally Conservative MPC

Ce papier présente HumanMPC, un cadre de commande prédictive (MPC) innovant qui garantit une navigation 3D sûre et efficace pour les micro-drones parmi des humains en combinant des modèles de mouvement réalistes basés sur les données avec une formulation de sécurité par faisabilité de contrôle minimisant le conservatisme.

Simon Schaefer, Helen Oleynikova, Sandra Hirche, Stefan Leutenegger2026-03-10💻 cs

Khelte Khelte Shikhi: A Proposed HCI Framework for Gamified Interactive Learning with Minecraft in Bangladeshi Education Systems

Cet article propose un cadre HCI conceptuel pour intégrer Minecraft dans le système éducatif bangladais en adaptant l'infrastructure à trois niveaux de ressources (du cloud au mode hors ligne) et en localisant le contenu culturellement, afin de rendre l'apprentissage par le jeu accessible malgré les contraintes énergétiques et matérielles sévères.

Mohd Ruhul Ameen, Akif Islam, Momen Khandokar Ope2026-03-10💻 cs

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

Le papier présente Dream4Drive, un cadre de génération de données synthétiques qui améliore les performances des modèles de perception pour la conduite autonome en produisant des cas limites multi-vues photoréalistes, tout en introduisant l'ensemble de données 3D DriveObj3D pour faciliter la recherche future.

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

MoE-GS: Mixture of Experts for Dynamic Gaussian Splatting

Le papier présente MoE-GS, un cadre unifié pionnier qui intègre une architecture de mélange d'experts avec un routeur de pixels sensible au volume pour améliorer la synthèse de nouvelles vues dans les scènes dynamiques, tout en proposant des stratégies d'optimisation pour atténuer les coûts de calcul inhérents.

In-Hwan Jin, Hyeongju Mun, Joonsoo Kim, Kugjin Yun, Kyeongbo Kong2026-03-10💻 cs

Next Generation Cloud-native In-Memory Stores: From Redis to Valkey and Beyond

Cette étude comble un vide dans la littérature en évaluant expérimentalement, via des benchmarks Kubernetes réalistes, les compromis de performance, d'efficacité et de viabilité à long terme entre les solutions de stockage en mémoire Redis, Valkey, KeyDB et Garnet.

Carl-Johan Fauvelle Munck af Rosensch"old, Feras M. Awaysheh, Ahmad Awad2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

Cet article présente HCLA, un système multi-agents centré sur l'humain qui améliore la transparence et la responsabilité dans la détection d'anomalies des transactions d'actifs numériques en reconstruisant un processus de raisonnement d'expert traçable plutôt qu'en se limitant à expliquer des modèles boîte noire.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

AnyPcc: Compressing Any Point Cloud with a Single Universal Model

Le papier présente AnyPcc, un cadre universel de compression de nuages de points qui surpasse l'état de l'art en généralisation grâce à un modèle de contexte robuste et une stratégie de fine-tuning adaptatif par instance pour gérer efficacement les données hors distribution.

Kangli Wang, Qianxi Yi, Yuqi Ye, Shihao Li, Wei Gao2026-03-10💻 cs

Automated Pest Counting in Water Traps through Active Robotic Stirring for Occlusion Handling

Cet article présente une méthode de comptage automatisé des ravageurs dans des pièges à eau utilisant un bras robotique actif pour réduire les occlusions, où un système de contrôle en boucle fermée adaptatif optimise les motifs de brassage et la vitesse pour améliorer la précision et réduire le temps d'exécution par rapport aux méthodes statiques.

Xumin Gao, Mark Stevens, Grzegorz Cielniak2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

Ce papier présente CountFormer, un cadre de comptage d'objets sans exemple qui remplace l'encodeur d'image par le modèle fondation auto-supervisé DINOv2 pour améliorer la cohérence structurelle et réduire les erreurs de surcomptage liées aux répétitions visuelles, tout en obtenant des performances compétitives sur le jeu de données FSC-147.

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

← Précédent Suivant →