cs articles | Gist.Science

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

Cet article présente iProg, un outil d'induction inductive interactive structurée qui utilise un protocole de communication à double intelligibilité pour collaborer avec des LLMs et des experts humains afin de générer rapidement des systèmes d'analyse de données fiables et interprétables, surpassant les approches Low Code/No Code traditionnelles.

Shraddha Surana, Ashwin Srinivasan, Michael Bain2026-03-10💻 cs

SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis

Ce papier présente SceneEval, un cadre d'évaluation et un benchmark de 500 scènes conçu pour mesurer de manière complète et interprétable la cohérence sémantique des scènes intérieures 3D générées à partir de texte, en évaluant à la fois les exigences explicites et les attentes implicites de plausibilité.

Hou In Ivan Tam, Hou In Derek Pun, Austin T. Wang, Angel X. Chang, Manolis Savva2026-03-10💻 cs

Prototype Perturbation for Relaxing Alignment Constraints in Backward-Compatible Learning

Cet article propose une méthode d'apprentissage rétrocompatible qui améliore la capacité discriminative des nouveaux modèles de recherche en assouplissant les contraintes d'alignement grâce à l'introduction de perturbations sur les prototypes des anciennes caractéristiques, évitant ainsi le coûteux processus de recalcul des embeddings.

Zikun Zhou, Yushuai Sun, Wenjie Pei, Xin Li, Yaowei Wang2026-03-10💻 cs

Privacy Enhanced QKD Networks: Zero Trust Relay Architecture based on Homomorphic Encryption

Ce papier propose une architecture de relais à confiance zéro pour les réseaux QKD, utilisant le chiffrement homomorphe pour effectuer la ré-encryption des clés sans révéler leur contenu en clair, éliminant ainsi le besoin de nœuds intermédiaires entièrement fiables tout en assurant une intégration compatible avec les normes ETSI.

Aitor Brazaola-Vicario, Oscar Lage, Julen Bernabé-Rodríguez + 2 more2026-03-10💻 cs

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

Cet article propose une méthode unifiée pour la reconstruction 3D de deux mains à partir d'images monoculaires, combinant un encodeur d'alignement fusionnant des priors hétérogènes de modèles de vision fondamentaux pour l'alignement 2D et un modèle de diffusion sans pénétration pour garantir des interactions spatiales réalistes et robustes aux occlusions.

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

MediTools -- Medical Education Powered by LLMs

Ce projet présente MediTools, une application prototype exploitant les grands modèles de langage pour révolutionner l'éducation médicale via des simulations cliniques interactives, l'analyse assistée d'articles de recherche et des résumés d'actualités, dont l'efficacité est évaluée par une enquête auprès de professionnels et d'étudiants.

Amr Alshatnawi, Remi Sampaleanu, David Liebovitz2026-03-10💻 cs

Medium Access for Push-Pull Data Transmission in 6G Wireless Systems

Cet article propose une taxonomie et des directives de conception pour les protocoles d'accès au support (MAC) dans les systèmes 6G, en articulant une coexistence entre les communications de type « push » et « pull » pour répondre aux exigences de l'IA et de la communication axée sur les objectifs.

Shashi Raj Pandey, Fabio Saggese, Junya Shiraishi, Federico Chiariotti, Petar Popovski2026-03-10💻 cs

Point-based Instance Completion with Scene Constraints

Cet article présente un nouveau modèle de complétion d'instances par nuage de points qui intègre des contraintes de scène via un mécanisme d'attention croisée pour améliorer la qualité et la plausibilité des reconstructions, et introduit le jeu de données ScanWCF pour évaluer cette tâche dans des scènes intérieures.

Wesley Khademi, Li Fuxin2026-03-10💻 cs

LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition

Cet article présente LEL, un cadre d'apprentissage d'ensemble contraint par la continuité de Lipschitz qui améliore la stabilité, la précision et la robustesse de la reconnaissance des émotions à partir de signaux EEG intra-sujets en combinant des mécanismes d'attention basés sur les Transformers avec une stratégie de fusion optimisée, validée par des résultats supérieurs sur trois jeux de données publics.

Shengyu Gong, Yueyang Li, Zijian Kang, Bo Chai, Weiming Zeng, Hongjie Yan, Zhiguo Zhang, Wai Ting Siok, Nizhuan Wang2026-03-10💻 cs

GeoNav: Empowering MLLMs with dual-scale geospatial reasoning for language-goal aerial navigation

Le papier présente GeoNav, un agent multimodal qui améliore la navigation aérienne vers des objectifs textuels en milieu urbain grâce à un raisonnement géospatial à double échelle combinant une carte cognitive globale et un graphe de scène local, surpassant ainsi les méthodes actuelles sur le benchmark CityNav.

Haotian Xu, Yue Hu, Chen Gao, Zhengqiu Zhu, Yong Zhao, Yong Li, Quanjun Yin2026-03-10💻 cs

Task-Oriented Semantic Compression for Localization at the Network Edge

Ce papier propose un cadre de communication orienté tâche, baptisé O-VIB, qui utilise un encodeur à goulot d'information variationnel avec contrainte orthogonale et détermination automatique de la pertinence pour compresser efficacement les caractéristiques multi-vues et permettre une localisation visuelle précise sur des plateformes mobiles aux ressources limitées dans des environnements urbains.

Zhengru Fang, Senkang Hu, Yu Guo, Yiqin Deng, Yuguang Fang2026-03-10💻 cs

Smart placement, faster robots-a comparison of algorithms for robot base-pose optimization

Cette étude compare quatre algorithmes d'optimisation de la pose de base pour les robots industriels et démontre que, bien que tous réduisent le temps de cycle, la descente de gradient stochastique offre le taux de réussite le plus élevé tandis que les algorithmes génétiques minimisent le mieux les coûts finaux.

Matthias Mayer, Matthias Althoff2026-03-10💻 cs

SFIBA: Spatial-based Full-target Invisible Backdoor Attacks

Ce papier propose SFIBA, une attaque par porte dérobée invisible et spatiale qui permet de cibler simultanément toutes les classes dans un scénario boîte noire en injectant des déclencheurs spécifiques dans des régions locales via une méthode basée sur le domaine fréquentiel, garantissant ainsi à la fois une efficacité d'attaque élevée et une imperceptibilité visuelle.

Yangxu Yin, Honglong Chen, Yudong Gao, Peng Sun, Zhishuai Li, Weifeng Liu2026-03-10💻 cs

Holistic Optimization of Modular Robots

Cette étude présente une approche holistique optimisant conjointement la composition, le positionnement de la base et la trajectoire de robots modulaires pour réduire le temps de cycle des tâches industrielles, démontrant des gains de performance significatifs et une faisabilité en conditions réelles.

Matthias Mayer, Matthias Althoff2026-03-10💻 cs

A Coordinated Routing Approach for Enhancing Bus Timeliness and Travel Efficiency in Mixed-Traffic Environment

Cet article propose une approche de routage coordonné utilisant des véhicules connectés et automatisés dans des voies réservées aux bus pour améliorer, grâce à des données en temps réel, à la fois la ponctualité des transports en commun et l'efficacité du trafic dans un environnement mixte.

Tanlu Liang, Ting Bai, Andreas A. Malikopoulos2026-03-10💻 cs

Can LLM-Simulated Practice and Feedback Upskill Human Counselors? A Randomized Study with 90+ Novice Counselors

Une étude randomisée auprès de 94 conseillers novices démontre que l'entraînement par simulation avec un grand modèle de langage, couplé à un retour d'information structuré, améliore significativement les compétences microtechniques et l'empathie, contrairement à la pratique seule qui s'avère inefficace ou même préjudiciable.

Ryan Louie, Raj Sanjay Shah, Ifdita Hasan Orney, Juan Pablo Pacheco, Emma Brunskill, Diyi Yang2026-03-10💻 cs

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Ce papier présente DeepSparse, un modèle fondation innovant pour la reconstruction CBCT à vues éparses, qui intègre une architecture DiCE et une stratégie de préentraînement HyViP pour surmonter les limites des méthodes existantes en matière de qualité d'image, de généralisation et de coût computationnel, permettant ainsi une imagerie médicale plus sûre et efficace.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng Li2026-03-10💻 cs

HEXGEN-FLOW: Optimizing LLM Inference Request Scheduling for Agentic Text-to-SQL

Ce papier présente HEXGEN-FLOW, un cadre de planification hiérarchique et adaptatif conçu pour optimiser l'exécution des requêtes Text-to-SQL agentic sur des clusters de GPU hétérogènes, réduisant ainsi significativement la latence et augmentant le débit par rapport aux solutions existantes.

You Peng, Youhe Jiang, Wenqi Jiang, Chen Wang, Binhang Yuan2026-03-10💻 cs

M3CAD: Towards Generic Cooperative Autonomous Driving Benchmark

Ce papier présente M³CAD, un benchmark complet et multimodal de 30 000 images conçu pour faire progresser la recherche sur la conduite autonome coopérative générique, en évaluant des tâches multiples et en proposant une nouvelle approche de fusion adaptative pour optimiser l'équilibre entre efficacité de communication et précision de perception.

Morui Zhu, Yongqi Zhu, Yihao Zhu, Qi Chen, Deyuan Qu, Song Fu, Qing Yang2026-03-10💻 cs

FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis

Ce papier présente FoldNet, une approche qui génère un jeu de données synthétique basé sur des points clés et des textures réalistes pour entraîner, via l'apprentissage par imitation en boucle fermée et la méthode KG-DAgger, une politique de pliage de vêtements généralisable et robuste atteignant un taux de réussite de 75 % dans le monde réel.

Yuxing Chen, Bowen Xiao, He Wang2026-03-10💻 cs

← Précédent Suivant →