Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs
Este estudo utiliza técnicas de interpretabilidade mecânica para mapear o fluxo de informação interno em VideoLLMs, revelando padrões consistentes de raciocínio temporal e integração multimodal que permitem otimizar o desempenho ao suprimir conexões de atenção desnecessárias.