Cut to the Chase: Training-free Multimodal Summarization via Chain-of-Events
O artigo apresenta o CoE, um framework de sumarização multimodal sem treinamento que utiliza um Grafo de Eventos Hierárquico para guiar um raciocínio estruturado em cadeia de eventos, superando os métodos atuais em precisão, interpretabilidade e generalização entre domínios.