Uber's Failover Architecture: Reconciling Reliability and Efficiency in Hyperscale Microservice Infrastructure
Il documento presenta l'architettura di failover di Uber (UFA), un sistema che ottimizza l'affidabilità e l'efficienza dei costi su larga scala sostituendo il modello di ridondanza 2x con un approccio differenziato basato sulla criticità del servizio, riducendo così il provisioning di base da 2x a 1,3x e liberando oltre un milione di core CPU mantenendo un'uptime del 99,97%.
Mayank Bansal, Milind Chabbi, Kenneth Bogh, Srikanth Prodduturi, Kevin Xu, Amit Kumar, David Bell, Ranjib Dey, Yufei Ren, Sachin Sharma, Juan Marcano, Shriniket Kale, Subhav Pradhan, Ivan Beschastnikh, Miguel Covarrubias, Chien-Chih Liao, Sandeep Koushik Sheshadri, Wen Luo, Kai Song, Ashish Samant, Sahil Rihan, Nimish Sheth, Uday Kiran MedisettyTue, 10 Ma💻 cs