TrajPred: Trajectory-Conditioned Joint Embedding Prediction for Surgical Instrument-Tissue Interaction Recognition in Vision-Language Models
O artigo apresenta o TrajPred, um framework que melhora o reconhecimento de interações entre instrumentos e tecidos em cirurgias robóticas ao codificar trajetórias instrumentais para capturar informações temporais e gerar embeddings visuais mais precisos, resultando em melhor desempenho e alinhamento semântico no benchmark CholecT50.