Efficient Agent Training for Computer Use
Das Paper stellt PC Agent-E vor, ein effizientes Trainingsframework, das durch die Kombination von nur 312 menschlichen Demonstrationsdaten mit synthetisierten Alternativen mittels Claude 3.7 Sonnet die Leistung von Computer-Nutzungs-Agenten signifikant steigert und dabei sowohl reine Menschendaten als auch direkte Distillation von Claude 3.7 Sonnet auf dem neuen Benchmark WindowsAgentArena-V2 übertrifft.