3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis
O artigo apresenta o 3DMedAgent, um agente unificado que capacita modelos de linguagem multimodal (MLLMs) bidimensionais a realizar análises completas de tomografias computadorizadas 3D sem necessidade de ajuste fino específico para 3D, coordenando ferramentas heterogêneas e memória estruturada para decompor tarefas complexas em raciocínio passo a passo baseado em evidências.