Better audio representations are more brain-like: linking model-brain alignment with performance in downstream auditory tasks

Cette étude démontre que les modèles audio auto-supervisés performants dans des tâches de perception auditive développent des représentations internes plus proches de l'activité cérébrale humaine, suggérant que cette similarité biologique émerge naturellement de l'apprentissage de la reconstruction de données audio.

Leonardo Pepino, Pablo Riera, Juan Kamienkowski + 1 more2026-03-05🤖 cs.LG

OASI: Objective-Aware Surrogate Initialization for Multi-Objective Bayesian Optimization in TinyML Keyword Spotting

Ce papier présente OASI, une méthode d'initialisation de surrogate consciente des objectifs qui améliore l'optimisation bayésienne multi-objectif pour le repérage de mots-clés sur microcontrôleurs en générant des solutions initiales biaisées vers le compromis précision-mémoire, garantissant ainsi des modèles déployables sans violer les contraintes de ressources.

Soumen Garai, Danilo Pau, Suman Samui2026-03-05🤖 cs.LG

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Cette étude propose une approche automatisée en plusieurs étapes pour détecter les fractures de la colonne cervicale en reconstruisant des volumes 3D estimés à partir de segmentations 2D orthogonales fusionnées, permettant ainsi d'obtenir des performances diagnostiques comparables à celles des radiologues experts tout en réduisant la complexité dimensionnelle du traitement.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

SpecBridge: Bridging Mass Spectrometry and Molecular Representations via Cross-Modal Alignment

Le papier présente SpecBridge, un cadre d'alignement croisé innovant qui améliore considérablement l'identification des petites molécules à partir de spectres de masse en affinant un encodeur spectral pour projeter directement dans l'espace latent d'un modèle fondamental moléculaire figé, surpassant ainsi les méthodes de base existantes avec une efficacité paramétrique accrue.

Yinkai Wang, Yan Zhou Chen, Xiaohui Chen + 2 more2026-03-05🤖 cs.LG

NRR-Phi: Text-to-State Mapping for Ambiguity Preservation in LLM Inference

Le papier présente NRR-Phi, un cadre formel de mappage texte-état qui transforme le langage naturel en un espace d'états non-collapsant préservant les multiples interprétations ambiguës grâce à une pipeline hybride de détection de conflits et d'extraction, comblant ainsi le lien algorithmique manquant entre le texte et l'espace d'états du Raisonnement Non-Résolutif (NRR) pour retarder l'effondrement sémantique prématuré des grands modèles de langage.

Kei Saito2026-03-05🤖 cs.AI