Query Disambiguation via Answer-Free Context: Doubling Performance on Humanity's Last Exam
Die Studie zeigt, dass das Umschreiben von Fragen unter Verwendung von kontextbezogenen, aber antwortfreien Informationen die Genauigkeit von Sprachmodellen auf dem Benchmark „Humanity's Last Exam" signifikant verdoppeln kann, indem sie die Mehrdeutigkeit der Anfragen reduziert.