SGR3 Model: Scene Graph Retrieval-Reasoning Model in 3D
El artículo presenta SGR3, un marco de trabajo sin entrenamiento que utiliza modelos de lenguaje grandes multimodales y recuperación aumentada para generar gráficos de escenas 3D semánticos sin necesidad de reconstrucción explícita, logrando un rendimiento competitivo frente a modelos basados en redes neuronales gráficas.