MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents
Il paper introduce MA-EgoQA, un nuovo benchmark e un modello di base chiamato EgoMAS progettati per valutare e migliorare la capacità dei sistemi di intelligenza artificiale di comprendere e rispondere a domande basate su flussi video egocentrici simultanei provenienti da più agenti incarnati.