cs.AI articles | Gist.Science

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Cet article propose une méthode d'échantillonnage par importance recuit (AIS) couplée à une reparamétrisation efficace pour surmonter les limitations des modèles latents à processus gaussiens (GPLVM) dans les espaces de grande dimension, permettant ainsi d'obtenir des bornes variationnelles plus serrées et une convergence plus robuste que les méthodes actuelles.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Cet article présente le MLVAS, un système multimodal innovant qui combine l'analyse vidéo et audio pour extraire automatiquement des segments clés et des métriques objectives afin d'assister le diagnostic clinique de la paralysie des cordes vocales.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Cet article examine comment l'intelligence artificielle transforme le génie logiciel en automatisant la génération et la validation des cas de test pour améliorer l'efficacité, la précision et l'évolutivité, tout en abordant les défis liés à la qualité des données et à la nécessité d'une supervision humaine.

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

Reconsidering the energy efficiency of spiking neural networks

Cet article propose une réévaluation rigoureuse de l'efficacité énergétique des réseaux de neurones à impulsions (SNN) en comparant des modèles équivalents à des réseaux de neurones quantifiés (QNN) via un modèle analytique complet, révélant ainsi les conditions spécifiques où les SNN surpassent réellement les QNN et peuvent doubler l'autonomie des appareils portables.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Cet article propose un réseau d'oscillateurs couplés (CON) qui modélise la dynamique des systèmes physiques dans un espace latent sous forme lagrangienne avec une stabilité prouvée, permettant ainsi un contrôle basé sur des modèles en boucle fermée performant utilisant uniquement des images brutes.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Ce papier propose BNEM, un échantillonneur Boltzmann innovant basé sur l'apprentissage de l'énergie de données bruitées via un processus de diffusion et une technique de bootstrap, qui surpasse les méthodes existantes en termes de performance et de robustesse pour générer des échantillons IID.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Improving Visual Object Tracking through Visual Prompting

Ce papier présente PiVOT, un nouveau mécanisme de prompt visuel pour le suivi d'objets générique qui exploite le modèle fondamental CLIP pour générer et affiner dynamiquement des prompts en ligne, permettant ainsi au suiveur de mieux supprimer les distracteurs et d'améliorer ses performances.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-10💻 cs

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Cet article propose un cadre d'équations différentielles à retard neuronal (NDDE) inspiré du formalisme de Mori-Zwanzig pour apprendre efficacement des dynamiques non markoviennes à partir de systèmes partiellement observables, surpassant ainsi les méthodes existantes comme les réseaux LSTM et les ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

Ce papier présente Puppet-CNN, un cadre qui modélise les paramètres des réseaux de neurones convolutifs comme un système dynamique continu régi par une équation différentielle ordinaire, permettant ainsi une adaptation de la profondeur du réseau à la complexité de l'entrée tout en réduisant considérablement le nombre de paramètres entraînables.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

Ce papier propose un cadre de diffusion adaptatif qui ajuste dynamiquement la trajectoire de génération en fonction de la complexité de chaque échantillon, permettant ainsi de réduire le nombre d'étapes d'échantillonnage tout en maintenant la qualité des images générées.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

The Illusion of Collusion

Cette étude démontre que des agents algorithmiques apprenant sans modèle préalable peuvent développer une « collusion naïve » dans des jeux répétés, un phénomène dont l'émergence dépend crucialement de la synchronisation des actions et du type de politique d'apprentissage utilisée, allant de l'absence totale de collusion avec des algorithmes persistamment aléatoires à une collusion systématique avec des algorithmes déterministes comme UCB.

Connor Douglas, Foster Provost, Arun Sundararajan2026-03-10💻 cs

Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed

Cet article propose une méthode d'optimisation conjointe de la durée de détection, de la puissance d'émission, de la durée de transmission et de la vitesse d'exploration pour minimiser la consommation énergétique des robots mobiles effectuant une SLAM à long terme avec reconstruction de carte en temps réel par apprentissage profond.

Zidong Han, Ruibo Jin, Xiaoyang Li + 3 more2026-03-10🤖 cs.AI

Multi-modal, Multi-task, Multi-criteria Automatic Evaluation with Vision Language Models

Ce papier présente HarmonicEval, une métrique d'évaluation automatique sans référence capable d'agréger des scores par critère pour évaluer plusieurs tâches multimodales, et introduit le benchmark MMHE basé sur 18 000 jugements humains pour valider la généralisabilité de cette approche.

Masanari Ohi, Masahiro Kaneko, Naoaki Okazaki, Nakamasa Inoue2026-03-10💬 cs.CL

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Cet article propose une méthode permettant d'apprendre des modèles du monde symboliques abstraits à partir de démonstrations visuelles et de modèles vision-langage préentraînés, afin de résoudre par planification des tâches de prise de décision à long horizon dans des environnements robotiques complexes avec une généralisation zéro-shot.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Cet article propose des stratégies de réduction de données basées sur le clustering latent pour optimiser l'entraînement adversaire semi-supervisé, permettant de réduire considérablement les besoins en données non étiquetées et le temps de calcul tout en préservant une robustesse élevée.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

A Single Model Ensemble Framework for Neural Machine Translation using Pivot Translation

Cet article présente un cadre d'ensemble utilisant un seul modèle pour la traduction automatique neuronale, qui améliore la qualité des traductions, notamment pour les paires de langues à ressources limitées, en générant des candidats via une traduction pivot et en les fusionnant postérieurement pour capturer les nuances subtiles de la phrase source.

Seokjin Oh, Keonwoong Noh, Woohwan Jung2026-03-10💬 cs.CL

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Cette étude présente GRADIEND, une méthode novatrice d'encodage-décodage utilisant les gradients des réseaux de neurones pour identifier et modifier spécifiquement les biais sociétaux (tels que le genre, la race ou la religion) tout en préservant les autres capacités des modèles.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks

Cet article propose une nouvelle approche de recherche locale efficace pour découvrir des communautés polarisées dans des réseaux signés, en résolvant le problème du déséquilibre de taille des communautés et en permettant l'existence de nœuds neutres, tout en garantissant une convergence linéaire et des performances supérieures aux méthodes existantes.

Linus Aronsson, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs

Cette étude démontre que l'utilisation de l'adaptation à faible rang (LoRA) dans l'apprentissage fédéré pour les grands modèles de langage réduit considérablement la mémorisation des données d'entraînement, limitant ainsi les risques de fuite d'informations privées sans compromettre les performances du modèle.

Thierry Bossy, Julien Vignoud, Tahseen Rabbani, Juan R. Troncoso Pastoriza, Martin Jaggi2026-03-10🤖 cs.LG

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

Le papier présente Prompt-SID, un cadre d'apprentissage auto-supervisé pour le débruitage d'images uniques qui préserve les détails structurels grâce à un modèle de génération de représentations basé sur la diffusion latente et un mécanisme de réjouissance d'échelle, surpassant les méthodes existantes sur divers jeux de données synthétiques et réels.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs

← Précédent Suivant →