Enhancing multimodal analogical reasoning with Logic Augmented Generation
Cet article présente un cadre de génération augmentée par la logique (LAG) qui combine des graphes de connaissances sémantiques et des heuristiques d'incitation pour améliorer le raisonnement analogique multimodal, surpassant les méthodes actuelles dans la détection et la compréhension des métaphores visuelles tout en offrant un processus de raisonnement plus explicable.