Query Disambiguation via Answer-Free Context: Doubling Performance on Humanity's Last Exam
Este trabalho demonstra que a reescrita de consultas para reduzir ambiguidades, utilizando contexto de fundamentação sem respostas, duplica o desempenho de modelos de linguagem no benchmark "Humanity's Last Exam", superando abordagens que apenas preparam o contexto antes da pergunta.