CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents
Il paper introduce CostNav, il primo benchmark fisico-economico che valuta l'efficienza commerciale degli agenti di navigazione fisica integrando dati finanziari e medici reali, rivelando che le attuali strategie di successo del task non garantiscono la sostenibilità economica necessaria per il dispiegamento commerciale.