Off-Trajectory Reasoning: Can LLMs Collaborate on Reasoning Trajectory?
Este artigo investiga a capacidade de modelos de linguagem de raciocínio colaborarem em trajetórias compartilhadas, revelando que modelos mais fortes são frequentemente mais frágeis a distrações e incapazes de superar suas limitações inatas ao seguir orientações de outros, além de destacar como estratégias de pós-treinamento influenciam essas falhas.