cs.LG articles | Gist.Science

Make VLM Recognize Visual Hallucination on Cartoon Character Image with Pose Information

Cet article propose un système de détection d'hallucinations visuelles dans les images de personnages de dessins animés générés par IA, utilisant un modèle vision-langage enrichi par des informations de pose et l'apprentissage en contexte pour améliorer significativement la précision par rapport aux méthodes basées uniquement sur les images RVB.

Bumsoo Kim, Wonseop Shin, Kyuchul Lee, Yonghoon Jung, Sanghyun Seo2026-03-09🤖 cs.AI

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

Le modèle de diffusion BInD, guidé par des connaissances, surmonte les limites des méthodes existantes de conception de médicaments basée sur la structure en générant simultanément des molécules et leurs interactions avec une protéine cible, permettant ainsi d'optimiser de manière équilibrée les objectifs multiples tels que les interactions spécifiques, les propriétés moléculaires et la géométrie locale.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn Kim2026-03-09🤖 cs.LG

Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition

Cette article présente un pipeline d'apprentissage actif en deux étapes pour la reconnaissance automatique de la parole, combinant le clustering d'x-vectors pour la diversité et une méthode bayésienne basée sur le dropout Monte Carlo pour l'information, afin d'optimiser l'entraînement des modèles avec moins de données étiquetées.

Ognjen Kundacina, Vladimir Vincan, Dragisa Miskovic2026-03-09⚡ eess

Predictive Coding Networks and Inference Learning: Tutorial and Survey

Ce travail présente une revue complète et une spécification formelle des réseaux de codage prédictif, un cadre inspiré des neurosciences qui utilise l'apprentissage par inférence comme alternative biologiquement plausible et potentiellement plus efficace à la rétropropagation, tout en offrant une approche unifiée pour l'apprentissage supervisé et génératif.

Björn van Zwol, Ro Jefferson, Egon L. van den Broek2026-03-09🤖 cs.AI

Transforming Agency. On the mode of existence of Large Language Models

Cet article soutient que les grands modèles de langage, bien qu'ils ne possèdent pas d'agence autonome car ils échouent à satisfaire les conditions d'individualité, de normativité et d'asymétrie interactionnelle requises par les théories incarnées de l'esprit, doivent être définis comme des interlocuteurs linguistiques qui, par leur couplage avec les humains, transforment profondément les formes d'agence existantes en produisant des modalités d'agence « intermédiaires » (midtended) dépassant la simple instrumentalité étendue.

Xabier E. Barandiaran, Lola S. Almendros2026-03-09🤖 cs.AI

PACE: Marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization

Le papier présente PACE, une méthode de fine-tuning efficace en paramètres qui améliore la généralisation des modèles en réduisant les normes des gradients et en assurant la cohérence des modèles via une régularisation par bruit multiplicatif, surpassant ainsi les approches existantes sur diverses tâches visuelles et textuelles.

Yao Ni, Shan Zhang, Piotr Koniusz2026-03-09🤖 cs.LG

FALCON: Future-Aware Learning with Contextual Object-Centric Pretraining for UAV Action Recognition

Le papier présente FALCON, une méthode d'apprentissage auto-supervisé unifiée pour la reconnaissance d'actions par drone, qui surmonte les déséquilibres spatiaux des vidéos aériennes en intégrant un masquage centré sur les objets et une reconstruction du futur à double horizon pour améliorer la précision et la vitesse d'inférence.

Ruiqi Xian, Xiyang Wu, Tianrui Guan, Xijun Wang, Boqing Gong, Dinesh Manocha2026-03-09🤖 cs.AI

An Efficient Self-supervised Seismic Data Reconstruction Method Based on Self-Consistency Learning

Cet article propose une méthode d'apprentissage auto-supervisé basée sur l'auto-cohérence et un réseau léger pour reconstruire efficacement des données sismiques irrégulières sans nécessiter de jeux de données supplémentaires.

Mingwei Wang, Junheng Peng, Yingtian Liu, Yong Li2026-03-09🤖 cs.LG

Ditto: Motion-Space Diffusion for Controllable Realtime Talking Head Synthesis

Le papier présente Ditto, un cadre de synthèse de têtes parlantes basé sur la diffusion qui permet un contrôle fin et une inférence en temps réel en générant des représentations dans un espace de mouvement spécifique tout en optimisant l'architecture pour résoudre les problèmes de désentanglement et de latence.

Tianqi Li, Ruobing Zheng, Minghui Yang + 2 more2026-03-09⚡ eess

L0-Regularized Quadratic Surface Support Vector Machines

Cet article propose des variantes parcimonieuses des machines à vecteurs de support sur des surfaces quadratiques (QSVM) en imposant une contrainte de cardinalité via la norme $\ell_0$ , et développe un algorithme de décomposition de pénalité efficace pour résoudre ce problème d'optimisation complexe tout en démontrant la supériorité du modèle sur des données de crédit réelles.

Ahmad Mousavi, Ramin Zandvakili, Zheming Gao2026-03-09🤖 cs.LG

Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation

Ce rapport de synthèse présente une vue d'ensemble structurée des techniques, des ensembles de données et des enjeux éthiques liés à l'utilisation des grands modèles de langage pour assister les chercheurs dans l'ensemble du cycle scientifique, de la découverte et l'expérimentation à la génération de contenu multimodal et à l'évaluation.

Steffen Eger, Yong Cao, Jennifer D'Souza, Andreas Geiger, Christian Greisinger, Stephanie Gross, Yufang Hou, Brigitte Krenn, Anne Lauscher, Yizhi Li, Chenghua Lin, Nafise Sadat Moosavi, Wei Zhao, Tristan Miller2026-03-09🤖 cs.AI

FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching

Ce papier présente FragFM, un cadre hiérarchique innovant basé sur l'appariement de flux discret au niveau des fragments pour générer efficacement des graphes moléculaires avec un meilleur contrôle des propriétés, tout en introduisant le benchmark NPGen pour évaluer la génération de produits naturels.

Joongwon Lee, Seonghwan Kim, Seokhyun Moon, Hyunwoo Kim, Woo Youn Kim2026-03-09🤖 cs.AI

Aligning Compound AI Systems via System-level DPO

Ce papier présente SysDPO, un cadre innovant qui étend l'optimisation directe des préférences (DPO) pour aligner les systèmes d'IA composés, modélisés comme des graphes acycliques dirigés, en surmontant les défis liés aux interactions non différentiables et à l'alignement au niveau du système.

Xiangwen Wang, Yibo Jacky Zhang, Zhoujie Ding, Katherine Tsai, Haolun Wu, Sanmi Koyejo2026-03-09🤖 cs.AI

Adversarial Robustness of Partitioned Quantum Classifiers

Cet article examine la robustesse des classificateurs quantiques partitionnés face aux perturbations adverses ciblant le découpage de circuits ou la téléportation, en établissant un lien théorique et expérimental entre ces attaques et l'implémentation de portes adverses au sein des couches intermédiaires du modèle.

Pouya Kananian, Hans-Arno Jacobsen2026-03-09⚛️ quant-ph

CAPS: Context-Aware Priority Sampling for Enhanced Imitation Learning in Autonomous Driving

Ce papier présente CAPS, une méthode de rééchantillonnage prioritaire contextuel utilisant des VQ-VAE pour équilibrer les données d'apprentissage par imitation et améliorer la généralisation des systèmes de conduite autonome dans le simulateur CARLA.

Hamidreza Mirkhani, Behzad Khamidehi, Ehsan Ahmadi, Mohammed Elmahgiubi, Weize Zhang, Fazel Arasteh, Umar Rajguru, Kasra Rezaee, Dongfeng Bai2026-03-09🤖 cs.LG

From Tokenizer Bias to Backbone Capability: A Controlled Study of LLMs for Time Series Forecasting

Cette étude démontre que, bien que les modèles de langage (LLM) présentent un certain potentiel pour la prévision de séries temporelles, leur performance reste limitée et ne surpasse pas systématiquement celle des modèles spécifiquement entraînés sur de vastes ensembles de données temporelles, une conclusion rendue possible par une méthodologie contrôlée visant à éliminer les biais introduits par les coupleurs de tokenisation.

Xinyu Zhang, Shanshan Feng, Xutao Li, Kenghong Lin, Fan Li, Pengfei Jia2026-03-09🤖 cs.AI

The Malicious Technical Ecosystem: Exposing Limitations in Technical Governance of AI-Generated Non-Consensual Intimate Images of Adults

En adoptant une approche centrée sur les survivants, cette étude expose l'écosystème technique malveillant facilitant la création d'images intimes non consensuelles générées par l'IA et démontre l'inefficacité des cadres de gouvernance actuels, tels que le rapport NIST AI 100-4, pour réguler ce phénomène.

Michelle L. Ding, Harini Suresh2026-03-09🤖 cs.AI

Federated Learning: A Survey on Privacy-Preserving Collaborative Intelligence

Ce document de synthèse présente une vue d'ensemble complète de l'apprentissage fédéré, en détaillant son architecture, ses défis techniques majeurs tels que l'hétérogénéité des données et la confidentialité, ainsi que ses applications émergentes et ses perspectives de recherche futures.

Ratun Rahman2026-03-09🤖 cs.AI

FourierSpecNet: Neural Collision Operator Approximation Inspired by the Fourier Spectral Method for Solving the Boltzmann Equation

Cet article présente FourierSpecNet, une méthode hybride combinant la méthode spectrale de Fourier et l'apprentissage profond pour approximer efficacement l'opérateur de collision de l'équation de Boltzmann avec une précision compétitive et une réduction significative des coûts de calcul, tout en garantissant la convergence vers la solution spectrale.

Jae Yong Lee, Gwang Jae Jung, Byung Chan Lim, Hyung Ju Hwang2026-03-09🤖 cs.AI

Scalable Multi-Task Learning for Particle Collision Event Reconstruction with Heterogeneous Graph Neural Networks

Cet article propose une architecture innovante de Réseau de Neurones à Graphes Hétérogènes (HGNN) intégrant l'élagage de graphes et l'apprentissage multi-tâches pour améliorer de manière scalable la reconstruction des événements de collision de particules, notamment celle des hadrons beaux, dans des conditions similaires à celles de l'expérience LHCb.

William Sutcliffe, Marta Calvi, Simone Capelli + 5 more2026-03-09⚛️ hep-ex

← Précédent Suivant →