谷歌云服務(wù)宕機(jī)導(dǎo)致 OpenAI、Shopify 等服務(wù)中斷,此次宕機(jī)的具體技術(shù)原因是什么?
發(fā)布時(shí)間:2025-06-17 23:50:12瀏覽次數(shù):
昨天的 GCP 全球宕機(jī)事故報(bào)告出了,給大家解讀下。
從 Google 的報(bào)告來看,是給全球的API管理系統(tǒng)下發(fā)了一個(gè)非法的配額策略(比如1小時(shí)只能請(qǐng)求1次這種離譜的策略),于是所有外部請(qǐng)求都403了(因?yàn)榘凑詹呗猿?qǐng)求配額了,于是403拒絕),工程師發(fā)現(xiàn)問題后立刻將所有接收到非法配額的API的配額系統(tǒng)全都繞過了,讓這些API不檢查配額策略直接給用戶服務(wù)。
但是,但是來了,us-central1 地區(qū)的配額數(shù)據(jù)庫過載了 (這里猜測工程師發(fā)…。


