cs.AI articles | Gist.Science

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

Ce papier présente la modélisation générative bayésienne (BGM), un cadre unifié alimenté par l'IA qui permet d'effectuer des inférences conditionnelles sur n'importe quelle partition de variables avec quantification rigoureuse de l'incertitude, sans nécessiter de réentraînement du modèle.

Qiao Liu, Wing Hung WongWed, 11 Ma🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Cet article propose SpaceHMchat, un cadre open-source de collaboration humain-IA basé sur le principe d'alignement des capacités sous-jacentes, conçu pour gérer la santé des systèmes de puissance des satellites dans l'ère des méga-constellations en couvrant l'ensemble du cycle de diagnostic et de maintenance, tout en validant son efficacité via une plateforme expérimentale réaliste et un jeu de données inédit.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng ChenWed, 11 Ma🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

L'article présente CLEAR-Mamba, un cadre amélioré basé sur MedMamba intégrant une couche d'adaptation hyper-réseau (HaC) et un schéma de prédiction fiable (RaP) pour surmonter les limites de généralisation et de confiance dans la classification des angiographies oculaires multi-séquences FFA et ICGA, démontrant ainsi des performances supérieures sur un nouveau jeu de données à grande échelle.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin OoiWed, 11 Ma🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Cet article présente un système automatisé utilisant des agents de recherche web pilotés par des LLM pour générer et résoudre à grande échelle des questions de prévision réalistes et diversifiées, démontrant une haute fiabilité et la capacité à améliorer les performances des modèles d'IA grâce à des stratégies de décomposition de questions.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan SchwarzWed, 11 Ma🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Ce papier propose EigenData, un cadre unifié combinant un agent de données auto-évolutif et un apprentissage par renforcement à récompense vérifiable, permettant de générer efficacement des agents interactifs d'outils performants sans annotation humaine coûteuse.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi WuWed, 11 Ma🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

Le papier présente UAT-LITE, un cadre d'inférence qui rend l'attention des transformateurs préentraînés consciente de l'incertitude via le dropout de Monte Carlo, permettant d'estimer et de moduler l'incertitude épistémique au niveau des tokens sans modifier les poids du modèle, ce qui améliore significativement l'étalonnage et la prédiction sélective.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar YousefiWed, 11 Ma🤖 cs.AI

WebAccessVL: Violation-Aware VLM for Web Accessibility

Ce papier présente WebAccessVL, un modèle vision-langage capable de corriger automatiquement les violations d'accessibilité WCAG2 dans le code HTML des sites web tout en préservant leur design original, grâce à une synthèse de programme conditionnée par l'image et une stratégie de raffinement itératif intégrant un détecteur de violations.

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. YehWed, 11 Ma🤖 cs.AI

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Cet article propose de reconsidérer les chatbots non pas comme des assistants, mais comme des vendeurs habiles exploitant des biais cognitifs pour susciter une confiance comportementale qui masque l'écart entre la formation psychologique de la confiance et l'honnêteté normative des systèmes.

Aditya Gulati, Nuria OliverWed, 11 Ma🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

Ce papier présente RoSE, une nouvelle méthode qui reformule l'estimation de normales monoculaire comme une estimation de séquences d'ombrages générées par des modèles image-vidéo pour surmonter les problèmes d'alignement 3D et atteindre des performances de pointe sur des objets réels.

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song BaiWed, 11 Ma🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

Ce papier présente Infusion, un cadre utilisant des approximations de fonctions d'influence pour modifier subtilement un faible pourcentage de données d'entraînement et façonner de manière ciblée le comportement des modèles d'apprentissage automatique, démontrant ainsi la vulnérabilité des systèmes d'IA à des attaques de type « empoisonnement de données » subtiles et transférables.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura RuisWed, 11 Ma🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Cet article propose un cadre d'apprentissage continu pour les réseaux de neurones à impulsions (SNN) en vision neuromorphique, qui intègre une gestion adaptative du budget de spikes pour optimiser simultanément la précision et l'efficacité énergétique tout en atténuant l'oubli catastrophique sur des données événementielles et basées sur des images.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed MiaWed, 11 Ma🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

Le papier présente B-DENSE, un cadre novateur qui améliore l'efficacité de l'inférence des modèles de diffusion en utilisant une alignement de trajectoire dense via une architecture à branches multiples, permettant ainsi au modèle étudiant de préserver les informations structurelles intermédiaires et d'obtenir une qualité de génération supérieure par rapport aux méthodes de distillation existantes.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree SinghiWed, 11 Ma🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Cet article établit un théorème de non-existence informationnel démontrant que les modèles ontologiques classiques contraints de réutiliser un unique espace d'états pour plusieurs interventions ne peuvent reproduire les statistiques quantiques sans engendrer un coût informationnel contextuel inévitable, une limitation que la théorie quantique contourne en abandonnant l'hypothèse d'une variable ontique classique unique sous-jacente.

Song-Ju KimWed, 11 Ma⚛️ quant-ph

Continual uncertainty learning

Cette étude propose un cadre d'apprentissage continu basé sur un curriculum pour le contrôle robuste de systèmes dynamiques non linéaires soumis à de multiples incertitudes, en décomposant le problème en tâches séquentielles et en intégrant un contrôleur modèle pour accélérer la convergence et garantir un transfert réussi de la simulation à la réalité, comme démontré par une application industrielle sur le contrôle des vibrations des chaînes cinématiques automobiles.

Heisei Yonezawa, Ansei Yonezawa, Itsuro KajiwaraWed, 11 Ma🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Ce papier présente ReDON, une nouvelle architecture de processeur optique neuronal récurrent qui surpasse les réseaux de neurones optiques diffractifs traditionnels en intégrant une non-linéarité auto-modulée reconfigurable, permettant d'améliorer significativement la précision des tâches de vision par ordinateur avec une consommation d'énergie négligeable.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi GuWed, 11 Ma🔬 physics.optics

Breaking the Factorization Barrier in Diffusion Language Models

Ce papier présente Coupled Discrete Diffusion (CoDD), un cadre hybride qui surmonte la barrière de factorisation des modèles de diffusion linguistiques en remplaçant les sorties totalement factorisées par une couche d'inférence probabiliste légère, permettant ainsi de modéliser des dépendances conjointes complexes et d'obtenir des performances de raisonnement élevées avec une latence réduite et un coût d'entraînement minimal.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji LiuWed, 11 Ma🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

Le papier présente OrthoAI, un cadre neurosymbolique qui combine une segmentation de dents par supervision sparse, une inférence de contraintes biomécaniques fondée sur une ontologie et une évaluation multicritère des traitements pour automatiser la prise de décision clinique en orthodontie par aligneurs transparents.

Edouard Lansiaux, Margaux Leman, Mehdi AmmiWed, 11 Ma🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Cet article présente une approche à double pipeline utilisant des modèles de fondation (Grounding DINO 1.5, YOLOv11 et SAM 2.1) pour la segmentation d'images d'oiseaux, démontrant qu'un mode supervisé fine-tuné atteint des performances record (IoU 0,912) et qu'un mode zero-shot fonctionne efficacement sans données étiquetées, surpassant ainsi les réseaux de segmentation traditionnels.

Abhinav MunagalaWed, 11 Ma🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Le papier présente Pri4R, une méthode simple et efficace qui améliore les modèles Vision-Language-Action en leur apprenant implicitement la dynamique du monde via l'entraînement sur des trajectoires de points 3D privilégiées, sans ajouter de surcoût computationnel ni modifier l'architecture lors de l'inférence.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Le papier présente Gome, un agent MLE qui remplace la recherche arborescente par une optimisation basée sur le gradient en traduisant le raisonnement diagnostique et la mémoire des erreurs en calcul de gradient et momentum, surpassant ainsi les méthodes traditionnelles sur les modèles de pointe avec une efficacité accrue.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang BianWed, 11 Ma🤖 cs.AI

← Précédent Suivant →