Uber's Failover Architecture: Reconciling Reliability and Efficiency in Hyperscale Microservice Infrastructure
Uber は、ビジネスの重要度に応じた差別化アーキテクチャを導入し、非クリティカルなサービスがクリティカルなサービスの予備容量を平時に共有し、ピーク時のフェイルオーバー時にのみ選択的に中断・復元される仕組み(UFA)を構築することで、2 倍の冗長構成から 1.3 倍へリソースを削減しつつ 99.97% の可用性を維持し、400 万コア中 100 万コア以上を削減することに成功しました。
Mayank Bansal, Milind Chabbi, Kenneth Bogh, Srikanth Prodduturi, Kevin Xu, Amit Kumar, David Bell, Ranjib Dey, Yufei Ren, Sachin Sharma, Juan Marcano, Shriniket Kale, Subhav Pradhan, Ivan Beschastnikh, Miguel Covarrubias, Chien-Chih Liao, Sandeep Koushik Sheshadri, Wen Luo, Kai Song, Ashish Samant, Sahil Rihan, Nimish Sheth, Uday Kiran MedisettyTue, 10 Ma💻 cs