Recursive Think-Answer Process for LLMs and VLMs
O artigo propõe o Processo Recursivo de Pensar e Responder (R-TAP), um método eficiente que utiliza um gerador de confiança e recompensas complementares para permitir ciclos iterativos de raciocínio em LLMs e VLMs, resultando em respostas mais precisas e estáveis com menos erros de auto-reflexão em comparação aos métodos convencionais de inferência única.