cs.AI articles | Gist.Science

Coarse-Guided Visual Generation via Weighted h-Transform Sampling

Cet article propose une méthode de génération visuelle sans entraînement, basée sur la transformée h et un calendrier de pondération adaptatif, pour synthétiser des échantillons de haute qualité à partir de références dégradées tout en surmontant les limites des approches existantes concernant la connaissance de l'opérateur de transformation et l'équilibre entre guidage et qualité.

Yanghao Wang, Ziqi Jiang, Zhen Wang, Long Chen2026-03-13🤖 cs.AI

Chemical Reaction Networks Learn Better than Spiking Neural Networks

Ce papier démontre mathématiquement et expérimentalement que les réseaux de réactions chimiques sans couches cachées surpassent les réseaux de neurones à impulsions nécessitant des couches cachées pour l'apprentissage de tâches de classification, offrant ainsi une explication mathématique à l'efficacité potentielle de l'apprentissage dans les réseaux biochimiques cellulaires.

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

Cet article propose une taxonomie systématique des opérateurs structurés qui étendent ou remplacent la convolution dans le traitement d'images par apprentissage, en les classant en cinq familles distinctes et en analysant leurs propriétés structurelles, leurs performances comparatives et leurs défis futurs.

Simone Cammarasana2026-03-13🤖 cs.AI

Paper Title: LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments

Le papier présente LoV3D, une pipeline d'apprentissage profond qui ancre le pronostic cognitif dans l'évaluation longitudinale des volumes cérébraux 3D via un vérificateur pondéré cliniquement, permettant ainsi d'atteindre une haute précision diagnostique et de réduire les hallucinations sans nécessiter d'annotations humaines.

Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu2026-03-13🤖 cs.AI

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

Cet article propose un cadre d'apprentissage profond basé sur des réseaux de convolution temporelle pour traiter la reconnaissance des sites de liaison des facteurs de transcription comme un problème de classification multi-étiquettes, permettant ainsi de prédire simultanément plusieurs profils de liaison, de capturer leurs corrélations et de révéler des motifs biologiques ainsi que des mécanismes coopératifs, y compris de nouvelles relations entre facteurs de transcription.

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

Cet article propose une méthode de recherche d'architecture neuronale (NAS) économe en ressources qui utilise des modèles de langage (LLM) de taille modeste et une mémoire de feedback itérative pour concevoir et optimiser automatiquement des architectures de réseaux de neurones performantes pour la classification d'images sur un seul GPU grand public, sans nécessiter de fine-tuning ni d'infrastructure cloud.

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Human-Centred LLM Privacy Audits: Findings and Frictions

Cette étude présente LMP2, un outil d'auto-audit permettant aux utilisateurs d'inspecter les associations que les grands modèles de langage font à leur sujet, et met en lumière les défis méthodologiques et les neuf frictions rencontrés dans la création d'audits de confidentialité centrés sur l'humain pour l'IA générative.

Dimitri Staufer, Kirsten Morehouse, David Hartmann, Bettina Berendt2026-03-13💬 cs.CL

A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control

Cet article propose un cadre robuste et efficace d'apprentissage par renforcement multi-agents pour le contrôle des feux de circulation, intégrant des mécanismes de randomisation des ratios de tournants, un ajustement exponentiel de la durée des phases et une observation basée sur les voisins, ce qui permet de réduire le temps d'attente moyen de plus de 10 % tout en améliorant la généralisation et la stabilité face aux variations dynamiques du trafic.

Sheng-You Huang, Hsiao-Chuan Chang, Yen-Chi Chen, Ting-Han Wei, I-Hau Yeh, Sheng-Yao Kuan, Chien-Yao Wang, Hsuan-Han Lee, I-Chen Wu2026-03-13🤖 cs.AI

On Information Self-Locking in Reinforcement Learning for Active Reasoning of LLM agents

Cet article identifie et résout le problème de l'auto-verrouillage informationnel dans les agents LLM utilisant l'apprentissage par renforcement pour le raisonnement actif, en décomposant la tâche en sélection d'action et suivi de croyance pour proposer une méthode d'injection de critiques directionnelles qui améliore significativement les performances.

Deyu Zou, Yongqiang Chen, Fan Feng, Mufei Li, Pan Li, Yu Gong, James Cheng2026-03-13🤖 cs.AI

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

Cet article propose le cadre MMDDPG, qui utilise une optimisation minimax avec un objectif fractionnaire pour apprendre des politiques de contrôle robustes et stables face aux perturbations externes et aux incertitudes de modèle dans des tâches de contrôle continu.

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

SommBench: Assessing Sommelier Expertise of Language Models

Ce papier présente SommBench, un nouveau benchmark multilingue conçu pour évaluer l'expertise des modèles de langage dans le domaine de la sommellerie, en testant leur capacité à maîtriser la théorie du vin, la complétion de caractéristiques et l'accord mets-vins au-delà de la simple connaissance textuelle.

William Brach, Tomas Bedej, Jacob Nielsen, Jacob Pichna, Juraj Bedej, Eemeli Saarensilta, Julie Dupouy, Gianluca Barmina, Andrea Blasi Núñez, Peter Schneider-Kamp, Kristian Koštál, Michal Ries, Lukas Galke Poech2026-03-13💬 cs.CL

CRAFT: A Tendon-Driven Hand with Hybrid Hard-Soft Compliance

Le papier présente CRAFT, une main anthropomorphe actionnée par tendons dotée d'une conformité hybride rigide-douce qui améliore la force, l'endurance et la manipulation d'objets fragiles tout en restant compacte, peu coûteuse et open-source.

Leo Lin, Shivansh Patel, Jay Moon, Svetlana Lazebnik, Unnat Jain2026-03-13🤖 cs.AI

Increasing intelligence in AI agents can worsen collective outcomes

Cette étude démontre que l'augmentation de l'intelligence et de la diversité des agents IA peut empirir les résultats collectifs en cas de pénurie de ressources, car la sophistication de ces agents aggrave la surcharge du système à moins que la capacité disponible ne dépasse un seuil critique déterminé par la formation spontanée de tribus.

Neil F. Johnson2026-03-13💰 q-fin

TopoBench: Benchmarking LLMs on Hard Topological Reasoning

Ce papier présente TopoBench, un benchmark évaluant les capacités de raisonnement topologique des grands modèles de langage sur des énigmes spatiales complexes, révélant que leurs échecs proviennent principalement de difficultés à extraire et maintenir les contraintes spatiales plutôt que d'une incapacité à raisonner sur celles-ci.

Mayug Maniparambil, Nils Hoehing, Janak Kapuriya, Arjun Karuvally, Ellen Rushe, Anthony Ventresque, Noel O'Connor, Fergal Reid2026-03-13🤖 cs.AI

Automatic Generation of High-Performance RL Environments

Cet article présente une méthode automatisée et peu coûteuse utilisant des agents IA pour générer des environnements d'apprentissage par renforcement haute performance en JAX ou Rust, garantissant une équivalence sémantique et des gains de vitesse considérables par rapport aux implémentations de référence.

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

Le papier présente FlashMotion, un cadre d'entraînement novateur qui permet une génération vidéo contrôlée par trajectoire en quelques étapes en combinant l'entraînement d'un adaptateur de trajectoire, la distillation d'un générateur vidéo et un affinage hybride, surpassant ainsi les méthodes existantes en qualité visuelle et en précision du mouvement.

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

Ce papier propose un guide pratique pour l'entraînement par renforcement des grands modèles de langage en identifiant les règles d'allocation optimales des ressources de calcul, notamment en démontrant que le nombre de déroulés parallèles par problème doit augmenter puis se saturer en fonction du budget disponible pour améliorer la stabilité et l'efficacité.

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

GlyphBanana: Advancing Precise Text Rendering Through Agentic Workflows

Le papier présente GlyphBanana, une méthode sans entraînement utilisant un flux de travail d'agents pour intégrer des modèles de glyphes dans l'espace latent et les cartes d'attention, permettant ainsi d'améliorer considérablement la précision du rendu de textes complexes et de formules mathématiques dans les modèles de génération d'images.

Zexuan Yan, Jiarui Jin, Yue Ma, Shijian Wang, Jiahui Hu, Wenxiang Jiao, Yuan Lu, Linfeng Zhang2026-03-13🤖 cs.AI

A Quantitative Characterization of Forgetting in Post-Training

Ce papier propose une caractérisation quantitative du phénomène d'oubli lors du post-entraînement continu de modèles génératifs en démontrant théoriquement comment la direction de la divergence (KL direct ou inverse), le chevauchement géométrique des modes et les stratégies d'échantillonnage déterminent respectivement l'effondrement des poids des anciennes tâches ou leur dérive contrôlée.

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

BehaviorVLM: Unified Finetuning-Free Behavioral Understanding with Vision-Language Reasoning

Le papier présente BehaviorVLM, un cadre unifié vision-langage qui permet une estimation de pose et une compréhension comportementale évolutives et interprétables pour des animaux en mouvement libre, sans nécessiter d'affinage spécifique ni d'annotations humaines massives, en guidant des modèles pré-entraînés par un raisonnement explicite et vérifiable.

Jingyang Ke, Weihan Li, Amartya Pradhan, Jeffrey Markowitz, Anqi Wu2026-03-13🤖 cs.AI

← Précédent Suivant →