Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Cet article propose SpaceHMchat, un cadre open-source de collaboration humain-IA basé sur le principe d'alignement des capacités sous-jacentes, conçu pour gérer la santé des systèmes de puissance des satellites dans l'ère des méga-constellations en couvrant l'ensemble du cycle de diagnostic et de maintenance, tout en validant son efficacité via une plateforme expérimentale réaliste et un jeu de données inédit.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng ChenWed, 11 Ma🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

L'article présente CLEAR-Mamba, un cadre amélioré basé sur MedMamba intégrant une couche d'adaptation hyper-réseau (HaC) et un schéma de prédiction fiable (RaP) pour surmonter les limites de généralisation et de confiance dans la classification des angiographies oculaires multi-séquences FFA et ICGA, démontrant ainsi des performances supérieures sur un nouveau jeu de données à grande échelle.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin OoiWed, 11 Ma🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Cet article présente un système automatisé utilisant des agents de recherche web pilotés par des LLM pour générer et résoudre à grande échelle des questions de prévision réalistes et diversifiées, démontrant une haute fiabilité et la capacité à améliorer les performances des modèles d'IA grâce à des stratégies de décomposition de questions.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan SchwarzWed, 11 Ma🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

Le papier présente UAT-LITE, un cadre d'inférence qui rend l'attention des transformateurs préentraînés consciente de l'incertitude via le dropout de Monte Carlo, permettant d'estimer et de moduler l'incertitude épistémique au niveau des tokens sans modifier les poids du modèle, ce qui améliore significativement l'étalonnage et la prédiction sélective.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar YousefiWed, 11 Ma🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

Ce papier présente Infusion, un cadre utilisant des approximations de fonctions d'influence pour modifier subtilement un faible pourcentage de données d'entraînement et façonner de manière ciblée le comportement des modèles d'apprentissage automatique, démontrant ainsi la vulnérabilité des systèmes d'IA à des attaques de type « empoisonnement de données » subtiles et transférables.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura RuisWed, 11 Ma🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Cet article propose un cadre d'apprentissage continu pour les réseaux de neurones à impulsions (SNN) en vision neuromorphique, qui intègre une gestion adaptative du budget de spikes pour optimiser simultanément la précision et l'efficacité énergétique tout en atténuant l'oubli catastrophique sur des données événementielles et basées sur des images.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed MiaWed, 11 Ma🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

Le papier présente B-DENSE, un cadre novateur qui améliore l'efficacité de l'inférence des modèles de diffusion en utilisant une alignement de trajectoire dense via une architecture à branches multiples, permettant ainsi au modèle étudiant de préserver les informations structurelles intermédiaires et d'obtenir une qualité de génération supérieure par rapport aux méthodes de distillation existantes.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree SinghiWed, 11 Ma🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Cet article établit un théorème de non-existence informationnel démontrant que les modèles ontologiques classiques contraints de réutiliser un unique espace d'états pour plusieurs interventions ne peuvent reproduire les statistiques quantiques sans engendrer un coût informationnel contextuel inévitable, une limitation que la théorie quantique contourne en abandonnant l'hypothèse d'une variable ontique classique unique sous-jacente.

Song-Ju KimWed, 11 Ma⚛️ quant-ph

Continual uncertainty learning

Cette étude propose un cadre d'apprentissage continu basé sur un curriculum pour le contrôle robuste de systèmes dynamiques non linéaires soumis à de multiples incertitudes, en décomposant le problème en tâches séquentielles et en intégrant un contrôleur modèle pour accélérer la convergence et garantir un transfert réussi de la simulation à la réalité, comme démontré par une application industrielle sur le contrôle des vibrations des chaînes cinématiques automobiles.

Heisei Yonezawa, Ansei Yonezawa, Itsuro KajiwaraWed, 11 Ma🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Ce papier présente ReDON, une nouvelle architecture de processeur optique neuronal récurrent qui surpasse les réseaux de neurones optiques diffractifs traditionnels en intégrant une non-linéarité auto-modulée reconfigurable, permettant d'améliorer significativement la précision des tâches de vision par ordinateur avec une consommation d'énergie négligeable.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi GuWed, 11 Ma🔬 physics.optics

Breaking the Factorization Barrier in Diffusion Language Models

Ce papier présente Coupled Discrete Diffusion (CoDD), un cadre hybride qui surmonte la barrière de factorisation des modèles de diffusion linguistiques en remplaçant les sorties totalement factorisées par une couche d'inférence probabiliste légère, permettant ainsi de modéliser des dépendances conjointes complexes et d'obtenir des performances de raisonnement élevées avec une latence réduite et un coût d'entraînement minimal.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji LiuWed, 11 Ma🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Cet article présente une approche à double pipeline utilisant des modèles de fondation (Grounding DINO 1.5, YOLOv11 et SAM 2.1) pour la segmentation d'images d'oiseaux, démontrant qu'un mode supervisé fine-tuné atteint des performances record (IoU 0,912) et qu'un mode zero-shot fonctionne efficacement sans données étiquetées, surpassant ainsi les réseaux de segmentation traditionnels.

Abhinav MunagalaWed, 11 Ma🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Le papier présente Pri4R, une méthode simple et efficace qui améliore les modèles Vision-Language-Action en leur apprenant implicitement la dynamique du monde via l'entraînement sur des trajectoires de points 3D privilégiées, sans ajouter de surcoût computationnel ni modifier l'architecture lors de l'inférence.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong KimWed, 11 Ma🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Le papier présente Gome, un agent MLE qui remplace la recherche arborescente par une optimisation basée sur le gradient en traduisant le raisonnement diagnostique et la mémoire des erreurs en calcul de gradient et momentum, surpassant ainsi les méthodes traditionnelles sur les modèles de pointe avec une efficacité accrue.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang BianWed, 11 Ma🤖 cs.AI