MoXaRt: Audio-Visual Object-Guided Sound Interaction for XR
Il paper presenta MoXaRt, un sistema XR in tempo reale che utilizza un'architettura cascata audio-visiva per isolare fino a cinque fonti sonore simultanee, migliorando significativamente l'intelligibilità del parlato e riducendo il carico cognitivo in ambienti acustici complessi.