cs.AI articles | Gist.Science

Social Knowledge for Cross-Domain User Preference Modeling

Cette étude démontre que la modélisation sociale à grande échelle sur le réseau X permet de représenter et de prédire les préférences des utilisateurs à travers différents domaines, offrant ainsi une personnalisation efficace en configuration « zero-shot » grâce à des embeddings sociaux qui capturent également des facteurs socio-démographiques.

Nir Lotan, Adir Solomon, Ido Guy, Einat Minkov2026-03-12🤖 cs.AI

Mashup Learning: Faster Finetuning by Remixing Past Checkpoints

L'article propose le « Mashup Learning », une méthode simple qui améliore l'adaptation des grands modèles de langage à de nouvelles tâches en fusionnant des checkpoints historiques pertinents pour servir d'initialisation, permettant ainsi d'accélérer la convergence et d'augmenter la précision par rapport à un apprentissage à partir de zéro.

Sofia Maria Lo Cicero Vaina, Artem Chumachenko, Max Ryabinin2026-03-12🤖 cs.LG

Compatibility at a Cost: Systematic Discovery and Exploitation of MCP Clause-Compliance Vulnerabilities

Cet article présente le premier cadre systématique pour détecter et exploiter les vulnérabilités de conformité aux clauses du protocole MCP, révélant ainsi une nouvelle surface d'attaque appelée « abus de compatibilité » qui permet des injections de prompts silencieuses et des dénis de service.

Nanzi Yang, Weiheng Bai, Kangjie Lu2026-03-12🤖 cs.AI

MCP-in-SoS: Risk assessment framework for open-source MCP servers

Cet article présente un cadre d'évaluation des risques pour les serveurs MCP open-source, basé sur une analyse statique du code et des taxonomies de menaces, qui révèle l'existence de vulnérabilités exploitables compromettant la sécurité des déploiements d'agents LLM.

Pratyay Kumar, Miguel Antonio Guirao Aguilera, Srikathyayani Srikanteswara, Satyajayant Misra, Abu Saleh Md Tayeen2026-03-12🤖 cs.AI

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Ce papier présente l'Adaptive Activation Cancellation (AAC), un cadre d'inférence en temps réel qui atténue les hallucinations des grands modèles de langage en identifiant et en supprimant sélectivement les activations neuronales associées aux erreurs factuelles, améliorant ainsi la précision sans altérer la fluidité ni les capacités générales du modèle.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Delta-K: Boosting Multi-Instance Generation via Cross-Attention Augmentation

Le papier présente Delta-K, un cadre d'inférence plug-and-play qui résout l'omission de concepts dans la génération d'images multi-instances en injectant dynamiquement des clés différentielles extraites par un modèle vision-langage dans l'espace d'attention croisée partagée, améliorant ainsi l'alignement compositionnel sans nécessiter de réentraînement ni de modifications architecturales.

Zitong Wang, Zijun Shen, Haohao Xu, Zhengjie Luo, Weibin Wu2026-03-12🤖 cs.AI

Multilingual AI-Driven Password Strength Estimation with Similarity-Based Detection

Cette recherche présente un estimateur de force de mot de passe multilingue et piloté par l'IA, optimisé pour les données indiennes et utilisant une détection de similarité Jaro, démontrant que les données générées par ChatGPT surpassent les modèles traditionnels comme PassGAN pour améliorer la sécurité des mots de passe.

Nikitha M. Palaniappan, Ying He2026-03-12🤖 cs.AI

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Cet article étudie une approximation par diffusion en temps continu des algorithmes de gradient de politique pour les bandits stochastiques à $k$ bras, démontrant que des taux de regret optimaux sont atteints avec un taux d'apprentissage spécifique, tout en établissant que des taux linéaires inévitables surviennent sans cette condition même pour un nombre logarithmique de bras.

Tor Lattimore2026-03-12📊 stat

Robotic Ultrasound Makes CBCT Alive

Cet article propose un cadre de mise à jour des images CBCT en temps réel, utilisant l'échographie robotisée et un réseau neuronal léger (USCorUNet) pour estimer les déformations des tissus mous et corriger les images statiques sans exposition supplémentaire aux rayonnements.

Feng Li, Ziyuan Li, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-12🤖 cs.AI

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Ce papier propose d'étendre la perte harmonique au-delà de la géométrie euclidienne en évaluant systématiquement diverses métriques de distance sur des modèles de vision et de langage, démontrant que l'utilisation de distances cosinus améliore la précision, la stabilité et la durabilité environnementale par rapport à la perte par entropie croisée.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

Learning from Radio using Variational Quantum RF Sensing

Cet article présente une méthode d'apprentissage environnemental utilisant une sonde de détection quantique optimisée par circuit pour exploiter les signaux radio, démontrant que cette approche permet une localisation précise sans mesures de canal, une sensibilité accrue aux signaux faibles et une performance supérieure à celle des méthodes classiques malgré une information disponible réduite.

Ivana Nikoloska2026-03-12⚛️ quant-ph

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Cette étude démontre qu'un algorithme neuromorphique nativement épiqué conçu pour résoudre des équations aux dérivées partielles possède une robustesse intrinsèque remarquable, tolérant jusqu'à 32 % de neurones et 90 % de spikes supprimés sans dégradation significative de la précision.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

Ce papier présente DUCTILE, une approche d'orchestration agentic par LLM qui sépare l'adaptation des processus de l'exécution déterministe des outils d'ingénierie, permettant ainsi d'automatiser avec succès des tâches d'analyse structurelle dans l'industrie aérospatiale malgré des variations de données, tout en soulevant des questions sur l'évolution du rôle de supervision des ingénieurs.

Alejandro Pradas-Gomez, Arindam Brahma, Ola Isaksson2026-03-12🤖 cs.AI

Joint Imaging-ROI Representation Learning via Cross-View Contrastive Alignment for Brain Disorder Classification

Cet article propose un cadre d'apprentissage par contraste croisé unifié qui aligne les représentations globales d'imagerie cérébrale et locales de régions d'intérêt (ROI) dans un espace latent commun, démontrant que leur intégration conjointe améliore significativement la classification des troubles neurologiques par rapport à l'utilisation de ces modalités isolément.

Wei Liang, Lifang He2026-03-12🤖 cs.AI

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Cet article propose un cadre ADMM plug-and-play convergent intégrant un nouveau débruiteur AC-DC pour résoudre le problème de décalage de variété entre les données d'entraînement et les itérations d'optimisation, garantissant ainsi la convergence et améliorant la qualité des solutions sur divers problèmes inverses.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

Cet article présente un système conçu par une approche centrée sur l'humain qui utilise l'intelligence artificielle conversationnelle et une carte interactive pour permettre au public d'explorer et d'interroger en langage naturel près de 1,7 million de spécimens numérisés des collections de sciences naturelles du Musée australien.

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. Ahyong2026-03-12🤖 cs.AI

Quantum entanglement provides a competitive advantage in adversarial games

Cette étude démontre que l'intrication quantique confère un avantage compétitif significatif dans l'apprentissage par renforcement adversarial, permettant à des agents hybrides quantiques-classiques de surpasser leurs équivalents séparables et certains réseaux de neurones classiques sur le jeu de Pong.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Le papier propose HyMEM, une mémoire structurée hybride et auto-évolutive inspirée du cerveau humain qui améliore significativement les performances des agents GUI en couplant des nœuds symboliques discrets et des embeddings continus pour une récupération multi-sauts et une mise à jour dynamique.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

Simulation-in-the-Reasoning (SiR): A Conceptual Framework for Empirically Grounded AI in Autonomous Transportation

Ce papier propose le cadre conceptuel de la « Simulation-in-the-Reasoning » (SiR), qui intègre des simulateurs de domaine directement dans le cycle de raisonnement des modèles de langage pour transformer le raisonnement hypothétique en un processus vérifiable et empiriquement fondé, spécifiquement conçu pour les systèmes de transport autonomes.

Wuping Xin2026-03-12⚡ eess

Is this Idea Novel? An Automated Benchmark for Judgment of Research Ideas

Cet article présente RINoBench, le premier benchmark complet pour l'évaluation automatisée de la nouveauté des idées de recherche, révélant que les grands modèles de langage, bien qu'alignés sur le raisonnement humain, échouent encore à prédire avec précision la nouveauté par rapport aux jugements humains.

Tim Schopf, Michael Färber2026-03-12💬 cs.CL

← Précédent Suivant →