Uber's Failover Architecture: Reconciling Reliability and Efficiency in Hyperscale Microservice Infrastructure
O artigo apresenta a Arquitetura de Failover da Uber (UFA), uma solução que substitui o modelo de capacidade 2x por uma abordagem diferenciada baseada em criticidade, reduzindo o provisionamento de 2x para 1,3x e eliminando mais de um milhão de núcleos de CPU enquanto mantém uma disponibilidade de 99,97% através da preempção seletiva de serviços não críticos e da automação de salvaguardas.
Mayank Bansal, Milind Chabbi, Kenneth Bogh, Srikanth Prodduturi, Kevin Xu, Amit Kumar, David Bell, Ranjib Dey, Yufei Ren, Sachin Sharma, Juan Marcano, Shriniket Kale, Subhav Pradhan, Ivan Beschastnikh, Miguel Covarrubias, Chien-Chih Liao, Sandeep Koushik Sheshadri, Wen Luo, Kai Song, Ashish Samant, Sahil Rihan, Nimish Sheth, Uday Kiran MedisettyTue, 10 Ma💻 cs