cs articles | Gist.Science

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

Cet article présente FSTab, un cadre d'évaluation et d'attaque en boîte noire capable de prédire et de quantifier la persistance de vulnérabilités récurrentes dans le code généré par des LLMs, révélant ainsi des risques de sécurité systémiques même dans des domaines non vus lors de l'entraînement.

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

Ce papier présente LMMRec, un cadre de recommandation multimodale piloté par les grands modèles de langage qui exploite des techniques de raisonnement pour extraire et aligner les motivations fines des utilisateurs et des articles à partir de textes et d'interactions, surpassant ainsi les méthodes existantes sur plusieurs jeux de données.

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

Cette étude démontre qu'il n'existe pas de corrélation significative entre les mesures auto-rapportées et les indicateurs comportementaux issus d'un jeu pour évaluer la résolution de problèmes, soulignant ainsi la nécessité d'intégrer ces deux approches complémentaires dans les processus de sélection du personnel.

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach

Cet article propose un cadre théorique et algorithmique fondé sur la transformée h de Doob et les processus de martingale pour guider les modèles de diffusion vers la génération d'échantillons satisfaisant des contraintes strictes avec une probabilité de un, tout en fournissant des garanties de convergence non asymptotiques et des méthodes d'apprentissage hors politique pour estimer les corrections de dérive nécessaires.

Zhengyi Guo, Wenpin Tang, Renyuan Xu2026-03-10💻 cs

Beyond Judgment: Exploring Large Language Models as Non-Judgmental Support for Maternal Mental Health

Cette étude explore comment les mères utilisent les modèles de langage pour obtenir un soutien émotionnel et informationnel sans jugement, tout en soulignant que, bien que ces outils soient appréciés pour leur neutralité, la chaleur humaine reste généralement préférée.

Shayla Sharmin, Sadia Afrin Ratna2026-03-10💻 cs

NAAMSE: Framework for Evolutionary Security Evaluation of Agents

Ce papier présente NAAMSE, un cadre d'évaluation de sécurité évolutionnaire qui utilise un agent autonome pour optimiser itérativement les attaques par mutation génétique et exploration hiérarchique, révélant ainsi des vulnérabilités complexes chez les agents IA que les méthodes statiques traditionnelles ne parviennent pas à détecter.

Kunal Pai, Parth Shah, Harshil Patel2026-03-10💻 cs

PhysDrape: Learning Explicit Forces and Collision Constraints for Physically Realistic Garment Draping

PhysDrape est une méthode hybride combinant un réseau de neurones graphiques et un solveur physique différentiable à deux étapes pour réaliser un drapé de vêtements réaliste en résolvant explicitement les forces et en garantissant l'absence de pénétration par des contraintes géométriques strictes.

Minghai Chen, Mingyuan Liu, Ning Ma, Jianqing Li, Yuxiang Huan2026-03-10💻 cs

LLM4PQC - Accurate and Efficient Synthesis of PQC Cores by Feedback-Driven LLMs

L'article présente LLM4PQC, un cadre basé sur les grands modèles de langage qui automatise la refactoring des codes de cryptographie post-quantique vers du code C synthétisable et génère des RTL vérifiés, réduisant ainsi l'effort manuel et accélérant l'exploration de l'espace de conception.

Buddhi Perera, Zeng Wang, Weihua Xiao, Mohammed Nabeel, Ozgur Sinanoglu, Johann Knechtel, Ramesh Karri2026-03-10💻 cs

Move What Matters: Parameter-Efficient Domain Adaptation via Optimal Transport Flow for Collaborative Perception

L'article propose FlowAdapt, un cadre d'adaptation de domaine efficace en paramètres pour la perception collaborative V2X, qui utilise la théorie du transport optimal et un échantillonnage glouton de Wasserstein pour surmonter les limitations des méthodes PEFT existantes en réduisant la redondance des données et en préservant les sémantiques fines.

Zesheng Jia, Jin Wang, Siao Liu, Lingzhi Li, Ziyao Huang, Yunjiang Xu, Jianping Wang2026-03-10💻 cs

SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

Ce papier propose SToRM, un cadre novateur de réduction supervisée de tokens pour les modèles de langage multimodaux, qui permet d'accélérer considérablement la conduite autonome de bout en bout tout en préservant les performances grâce à une sélection intelligente des tokens visuels.

Seo Hyun Kim, Jin Bok Park, Do Yeon Koo, Hogun Park, Il Yong Chun2026-03-10💻 cs

Accelerating Robotic Reinforcement Learning with Agent Guidance

Ce papier présente AGPS, un cadre qui remplace la supervision humaine par un agent multimodal agissant comme un modèle du monde sémantique pour guider l'exploration des robots, améliorant ainsi considérablement l'efficacité des échantillons et la scalabilité de l'apprentissage par renforcement par rapport aux méthodes traditionnelles à boucle humaine.

Haojun Chen, Zili Zou, Chengdong Ma, Yaoxiang Pu, Haotong Zhang, Yuanpei Chen, Yaodong Yang2026-03-10💻 cs

To Mix or To Merge: Toward Multi-Domain Reinforcement Learning for Large Language Models

L'article M2RL analyse et compare les paradigmes d'apprentissage par renforcement à récompenses vérifiables (RLVR) pour les modèles de langage, démontrant que l'entraînement mixte multi-tâches et le fusionnement de modèles entraînés séparément sont tous deux efficaces car les domaines de raisonnement s'avèrent synergiques et peu interférents.

Haoqing Wang, Xiang Long, Ziheng Li, Yilong Xu, Tingguang Li, Yehui Tang2026-03-10💻 cs

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Le benchmark SkillsBench évalue l'efficacité des compétences d'agents sur 86 tâches et révèle que, bien que les compétences curatées améliorent significativement les performances moyennes, leur impact varie considérablement selon les domaines et que les modèles ne parviennent pas actuellement à générer de manière fiable les compétences dont ils bénéficieraient.

Xiangyi Li, Wenbo Chen, Yimin Liu, Shenghan Zheng, Xiaokun Chen, Yifeng He, Yubo Li, Bingran You, Haotian Shen, Jiankai Sun, Shuyi Wang, Binxu Li, Qunhong Zeng, Di Wang, Xuandong Zhao, Yuanli Wang, Roey Ben Chaim, Zonglin Di, Yipeng Gao, Junwei He, Yizhuo He, Liqiang Jing, Luyang Kong, Xin Lan, Jiachen Li, Songlin Li, Yijiang Li, Yueqian Lin, Xinyi Liu, Xuanqing Liu, Haoran Lyu, Ze Ma, Bowei Wang, Runhui Wang, Tianyu Wang, Wengao Ye, Yue Zhang, Hanwen Xing, Yiqi Xue, Steven Dillmann, Han-chung Lee2026-03-10💻 cs

State Feedback Control of State-Delayed LPV Systems using Dynamic IQCs

Cet article propose un nouveau cadre de commande par retour d'état pour les systèmes LPV à retards d'état variables, intégrant des contraintes quadratiques intégrales dynamiques et des fonctions de Lyapunov dépendantes des paramètres afin d'obtenir des conditions de synthèse convexes garantissant la stabilité et des performances améliorées avec une réduction de la conservativité.

Fen Wu2026-03-10💻 cs

Social Life of Code: Modeling Evolution through Code Embedding and Opinion Dynamics

Cet article propose une approche novatrice intégrant des embeddings sémantiques de code et la théorie des dynamiques d'opinion pour modéliser quantitativement l'évolution des logiciels et révéler les mécanismes de collaboration implicite au sein des communautés de développement open source.

Yulong He, Nikita Verbin, Sergey Kovalchuk2026-03-10💻 cs

RIS Control through the Lens of Stochastic Network Calculus: An O-RAN Framework for Delay-Sensitive 6G Applications

Cet article propose DARIO, un cadre conforme à O-RAN qui utilise le calcul de réseaux stochastique pour orchestrer dynamiquement des surfaces intelligentes reconfigurables (RIS) et minimiser les délais dans les applications 6G sensibles à la latence.

Oscar Adamuz-Hinojosa, Lanfranco Zanzi, Vincenzo Sciancalepore, Marco Di Renzo, Xavier Costa-Pérez2026-03-10💻 cs

Graph Neural Model Predictive Control for High-Dimensional Systems

Cet article présente un cadre de contrôle prédictif basé sur des réseaux de neurones graphiques qui permet le contrôle en temps réel de systèmes haute dimension, tels que les robots souples, en exploitant la parcimonie des interactions et l'accélération GPU pour atteindre une précision subcentimétrique et une évolutivité jusqu'à 1 000 nœuds.

Patrick Benito Eberhard, Luis Pabon, Daniele Gammelli, Hugo Buurmeijer, Amon Lahr, Mark Leone, Andrea Carron, Marco Pavone2026-03-10💻 cs

3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis

Le papier présente 3DMedAgent, un agent unifié qui permet aux modèles de langage multimodaux 2D d'analyser des données médicales 3D complexes via une décomposition progressive des tâches et une mémoire structurée, surpassant ainsi les méthodes existantes sur plus de 40 tâches d'imagerie thoracique.

Ziyue Wang, Linghan Cai, Chang Han Low, Haofeng Liu, Junde Wu, Jingyu Wang, Rui Wang, Lei Song, Jiang Bian, Jingjing Fu, Yueming Jin2026-03-10💻 cs

OVerSeeC: Open-Vocabulary Costmap Generation from Satellite Images and Natural Language

Le papier présente OVerSeeC, un cadre modulaire zéro-shot qui génère des cartes de coût globales pour la planification autonome à partir d'images satellites et de directives en langage naturel, en décomposant le processus en interprétation, localisation et synthèse pour s'adapter à des missions variées et à des entités inconnues.

Rwik Rana, Jesse Quattrociocchi, Dongmyeong Lee, Christian Ellis, Amanda Adkins, Adam Uccello, Garrett Warnell, Joydeep Biswas2026-03-10💻 cs

On the Energy Cost of Post-Quantum Key Establishment in Wireless Low-Power Personal Area Networks

Cette étude démontre que, sur les réseaux personnels à faible consommation comme Bluetooth Low Energy, le coût énergétique de la communication lors de l'établissement de clés post-quantiques dépasse souvent celui du calcul cryptographique, soulignant ainsi la nécessité d'une optimisation conjointe des protocoles et des couches basses pour assurer une transition efficace vers la sécurité quantique.

Tao Liu, Gowri Ramachandra, Raja Jurdak2026-03-10💻 cs

← Précédent Suivant →