3DMedAgent: Unified Perception-to-Understanding for 3D Medical Analysis
이 논문은 2D 기반의 다중모달 대형 언어 모델을 3D CT 데이터 분석에 적용할 수 있도록 다양한 시각 및 텍스트 도구를 조정하고 장기 구조적 메모리를 통해 점진적 추론을 가능하게 하는 통합 에이전트 '3DMedAgent'를 제안하며, 이를 통해 40 개 이상의 다양한 작업에서 기존 모델들을 능가하는 성능을 입증했습니다.