cs articles | Gist.Science

SoK: "Interoperability vs Security" Arguments: A Technical Framework

Ce papier de recherche propose un cadre technique et une taxonomie pour analyser systématiquement les arguments de sécurité invoqués par les géants technologiques pour s'opposer à l'interopérabilité dans le contexte des procédures antitrust européennes, en examinant leurs motivations économiques et leurs impacts réels à travers plusieurs études de cas.

Daji Landis, Elettra Bietti, Sunoo Park2026-03-10💻 cs

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

Le papier présente Prompt-SID, un cadre d'apprentissage auto-supervisé pour le débruitage d'images uniques qui préserve les détails structurels grâce à un modèle de génération de représentations basé sur la diffusion latente et un mécanisme de réjouissance d'échelle, surpassant les méthodes existantes sur divers jeux de données synthétiques et réels.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs

Who is Responsible? The Data, Models, Users or Regulations? A Comprehensive Survey on Responsible Generative AI for a Sustainable Future

Cet article présente une enquête complète sur l'IA générative responsable, proposant un cadre unifié intégrant gouvernance, évaluation technique et déploiement sectoriel pour orienter le développement durable et sécurisé de ces systèmes.

Shaina Raza, Rizwan Qureshi, Anam Zahid + 14 more2026-03-10💻 cs

Subclass Classification of Gliomas Using MRI Fusion Technique

Cette étude propose une méthode de classification des sous-types de gliomes atteignant une précision de 99,25 % en fusionnant des images IRM multimodales prétraitées via une architecture UNET 2D/3D et une technique de moyenne pondérée, puis en les soumettant à un modèle ResNet50.

Kiranmayee Janardhan, Christy Bobby Thomas2026-03-10💻 cs

Deep Learning-Based Approach for Automatic 2D and 3D MRI Segmentation of Gliomas

Cette étude propose une approche d'apprentissage profond basée sur les architectures UNET, Inception et ResNet pour réaliser une segmentation automatique et optimisée des gliomes en 2D et 3D à partir des données BraTS, atteignant des performances exceptionnelles (notamment 99,77 % de précision en 2D) qui surpassent les limites des méthodes traditionnelles en équilibrant efficacité computationnelle et précision spatiale.

Kiranmayee Janardhan, Christy Bobby T2026-03-10💻 cs

Pricing for Routing and Flow-Control in Payment Channel Networks

Cet article présente DEBT control, un protocole conjoint de routage et de contrôle de flux pour les réseaux de canaux de paiement qui utilise des mécanismes de tarification et une optimisation duale par descente de gradient pour guider le réseau vers un état opérationnel optimal tout en garantissant la convergence.

Suryanarayana Sankagiri, Bruce Hajek2026-03-10💻 cs

Diffusion Stabilizer Policy for Automated Surgical Robot Manipulations

Cet article propose la Diffusion Stabilizer Policy (DSP), un cadre d'apprentissage par politique basé sur la diffusion qui permet d'entraîner des robots chirurgicaux à l'aide de trajectoires imparfaites ou échouées, démontrant ainsi une robustesse supérieure face aux perturbations dans divers environnements chirurgicaux.

Chonlam Ho, Jianshu Hu, Lei Song, Hesheng Wang, Qi Dou, Yutong Ban2026-03-10💻 cs

Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems in Minecraft

Cet article propose un cadre innovant de planification et d'action parallélisée pour les systèmes multi-agents basés sur les grands modèles de langage dans Minecraft, utilisant une architecture à double thread pour surmonter les limitations de l'exécution sérielle et améliorer la réactivité en temps réel.

Yaoru Li, Shunyu Liu, Tongya Zheng, Li Sun, Mingli Song2026-03-10💻 cs

Enhancing Alzheimer's Diagnosis: Leveraging Anatomical Landmarks in Graph Convolutional Neural Networks on Tetrahedral Meshes

Cet article propose un modèle d'apprentissage profond géométrique basé sur les transformers et des repères anatomiques sur des maillages tétraédriques pour améliorer le diagnostic de la maladie d'Alzheimer et prédire la positivité à l'amyloïde chez les patients à risque moyen, offrant ainsi une alternative non invasive et précise aux examens TEP coûteux.

Yanxi Chen, Mohammad Farazi, Zhangsihao Yang, Yonghui Fan, Nicholas Ashton, Eric M Reiman, Yi Su, Yalin Wang2026-03-10💻 cs

ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation

Le papier présente ViLAM, une méthode novatrice qui distille le raisonnement vision-langage de grands modèles dans des cartes d'attention spatiale pour guider la navigation de robots sociaux, démontrant ainsi une amélioration significative du taux de réussite par rapport aux méthodes existantes lors d'expériences réelles.

Mohamed Elnoor, Kasun Weerakoon, Gershom Seneviratne, Jing Liang, Vignesh Rajagopal, Dinesh Manocha2026-03-10💻 cs

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Le papier présente Snapmoji, un système qui génère instantanément des avatars 3D animables et personnalisables via une « dual-stylisation » combinant l'adaptation de domaine gaussienne et l'application d'un second style, tout en préservant l'identité de l'utilisateur et en permettant un rendu fluide sur mobile.

Eric M. Chen, Di Liu, Sizhuo Ma, Michael Vasilkovsky, Bing Zhou, Qiang Gao, Wenzhou Wang, Jiahao Luo, Dimitris N. Metaxas, Vincent Sitzmann, Jian Wang2026-03-10💻 cs

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

Cet article présente iProg, un outil d'induction inductive interactive structurée qui utilise un protocole de communication à double intelligibilité pour collaborer avec des LLMs et des experts humains afin de générer rapidement des systèmes d'analyse de données fiables et interprétables, surpassant les approches Low Code/No Code traditionnelles.

Shraddha Surana, Ashwin Srinivasan, Michael Bain2026-03-10💻 cs

SceneEval: Evaluating Semantic Coherence in Text-Conditioned 3D Indoor Scene Synthesis

Ce papier présente SceneEval, un cadre d'évaluation et un benchmark de 500 scènes conçu pour mesurer de manière complète et interprétable la cohérence sémantique des scènes intérieures 3D générées à partir de texte, en évaluant à la fois les exigences explicites et les attentes implicites de plausibilité.

Hou In Ivan Tam, Hou In Derek Pun, Austin T. Wang, Angel X. Chang, Manolis Savva2026-03-10💻 cs

Prototype Perturbation for Relaxing Alignment Constraints in Backward-Compatible Learning

Cet article propose une méthode d'apprentissage rétrocompatible qui améliore la capacité discriminative des nouveaux modèles de recherche en assouplissant les contraintes d'alignement grâce à l'introduction de perturbations sur les prototypes des anciennes caractéristiques, évitant ainsi le coûteux processus de recalcul des embeddings.

Zikun Zhou, Yushuai Sun, Wenjie Pei, Xin Li, Yaowei Wang2026-03-10💻 cs

Privacy Enhanced QKD Networks: Zero Trust Relay Architecture based on Homomorphic Encryption

Ce papier propose une architecture de relais à confiance zéro pour les réseaux QKD, utilisant le chiffrement homomorphe pour effectuer la ré-encryption des clés sans révéler leur contenu en clair, éliminant ainsi le besoin de nœuds intermédiaires entièrement fiables tout en assurant une intégration compatible avec les normes ETSI.

Aitor Brazaola-Vicario, Oscar Lage, Julen Bernabé-Rodríguez + 2 more2026-03-10💻 cs

From 2D Alignment to 3D Plausibility: Unifying Heterogeneous 2D Priors and Penetration-Free Diffusion for Occlusion-Robust Two-Hand Reconstruction

Cet article propose une méthode unifiée pour la reconstruction 3D de deux mains à partir d'images monoculaires, combinant un encodeur d'alignement fusionnant des priors hétérogènes de modèles de vision fondamentaux pour l'alignement 2D et un modèle de diffusion sans pénétration pour garantir des interactions spatiales réalistes et robustes aux occlusions.

Gaoge Han, Yongkang Cheng, Zhe Chen, Shaoli Huang, Tongliang Liu2026-03-10💻 cs

MediTools -- Medical Education Powered by LLMs

Ce projet présente MediTools, une application prototype exploitant les grands modèles de langage pour révolutionner l'éducation médicale via des simulations cliniques interactives, l'analyse assistée d'articles de recherche et des résumés d'actualités, dont l'efficacité est évaluée par une enquête auprès de professionnels et d'étudiants.

Amr Alshatnawi, Remi Sampaleanu, David Liebovitz2026-03-10💻 cs

Medium Access for Push-Pull Data Transmission in 6G Wireless Systems

Cet article propose une taxonomie et des directives de conception pour les protocoles d'accès au support (MAC) dans les systèmes 6G, en articulant une coexistence entre les communications de type « push » et « pull » pour répondre aux exigences de l'IA et de la communication axée sur les objectifs.

Shashi Raj Pandey, Fabio Saggese, Junya Shiraishi, Federico Chiariotti, Petar Popovski2026-03-10💻 cs

Point-based Instance Completion with Scene Constraints

Cet article présente un nouveau modèle de complétion d'instances par nuage de points qui intègre des contraintes de scène via un mécanisme d'attention croisée pour améliorer la qualité et la plausibilité des reconstructions, et introduit le jeu de données ScanWCF pour évaluer cette tâche dans des scènes intérieures.

Wesley Khademi, Li Fuxin2026-03-10💻 cs

LEL: Lipschitz Continuity Constrained Ensemble Learning for Efficient EEG-Based Intra-subject Emotion Recognition

Cet article présente LEL, un cadre d'apprentissage d'ensemble contraint par la continuité de Lipschitz qui améliore la stabilité, la précision et la robustesse de la reconnaissance des émotions à partir de signaux EEG intra-sujets en combinant des mécanismes d'attention basés sur les Transformers avec une stratégie de fusion optimisée, validée par des résultats supérieurs sur trois jeux de données publics.

Shengyu Gong, Yueyang Li, Zijian Kang, Bo Chai, Weiming Zeng, Hongjie Yan, Zhiguo Zhang, Wai Ting Siok, Nizhuan Wang2026-03-10💻 cs

← Précédent Suivant →