Ottobre 25, 2021

Corriere Locride

Trova le ultime notizie dal mondo da ogni angolo del mondo su Paper Project

Cloudflare mostra come Facebook, WhatsApp e Instagram sono scomparsi da Internet

Dopo più di 6 ore senza Facebook, WhatsApp e Instagrame Bagliore di nuvole È stato il primo a spiegare cosa è successo, e perché una spiegazione così lunga e tecnica, che due ingegneri dell’azienda l’hanno scritta.

La spiegazione dettagliata di questo tipo non è mai molto, che questo problema ha causato una perdita Oltre 1 miliardo di dollari su FacebookChe possiede l’applicazione di messaggistica istantanea WhatsApp e il social network leader nella posizione Instagram.

Oggi alle 16:51 UTC abbiamo aperto un problema interno intitolato “Ricerca DNS di Facebook ripristinata su SERVFAIL” perché eravamo preoccupati che qualcosa potesse essere sbagliato con il risolutore DNS 1.1.1.1. Ma quando stavamo per pubblicare l’incidente sulla nostra pagina Stato pubblico (servizi), ce ne siamo resi conto Che stava succedendo qualcosa di più serio.

I social media sono esplosi rapidamente, riportando ciò che i nostri ingegneri hanno rapidamente confermato. Infatti, Facebook e i suoi servizi affiliati, WhatsApp e Instagram, sono in declino. I loro nomi DNS hanno smesso di risolversi e non è stato possibile raggiungere gli indirizzi IP delle loro infrastrutture. Era come se qualcuno “tirasse i cavi” dai propri data center in una volta e li prendesse disconnesso.

Come è possibile?

Presentazione di BGP

BGP sta per Border Gateway Protocol. È un meccanismo per lo scambio di informazioni di routing tra Autonomous Systems (AS) su Internet. I grandi router che fanno funzionare Internet hanno elenchi enormi e costantemente aggiornati di potenziali metodi che possono essere utilizzati per consegnare ogni pacchetto di rete alle sue destinazioni finali. Senza BGP, i router Internet non saprebbero cosa fare e Internet non funzionerebbe..

Internet è letteralmente una rete di reti, che è connessa al BGP. BGP consente a una rete (ad esempio Facebook) di annunciare la propria presenza su altre reti che compongono Internet. Quando diciamo che Facebook non pubblicizza la sua esistenza, gli ISP e le altre reti non riescono a trovare la rete Facebook e quindi non sarà disponibile.

READ  Android 12 | Questa è la lista dei modelli Samsung che potrebbero avere il sistema operativo | GIOCO SPORTIVO

Ogni rete ha un ASN: un numero di sistema indipendente. Un Autonomous System (AS) è una singola rete con una politica di routing interna unificata. Un AS può creare prefissi (dicendo che controlla un insieme di indirizzi IP), così come prefissi di trasporto (dicendo che sa come accedere a determinati set di indirizzi IP).

L’ASN di Cloudflare è AS13335. Ogni ASN deve dichiarare i propri percorsi di prefisso a Internet utilizzando BGP; Altrimenti nessuno saprà come contattarci e dove trovarci.

L’inizio del caos

Lo abbiamo realizzato alle 16:58 UTC Facebook ha smesso di pubblicizzare i suoi percorsi di prefisso DNS. Ciò significa che almeno i server DNS di Facebook non erano disponibili. Per questo motivo, il risolutore DNS 1.1.1.1 di Cloudflare non può più rispondere alle query che richiedono l’indirizzo IP di facebook.com o instagram.com.

Teniamo traccia di tutti gli aggiornamenti e gli annunci BGP che vediamo sulla nostra rete globale. Sulla nostra scala, i dati che raccogliamo ci danno informazioni su come Internet si connette e dove il traffico dovrebbe fluire da e verso qualsiasi parte del pianeta.

Il messaggio BGP UPDATE informa il router di eventuali modifiche apportate alla dichiarazione del prefisso o alla rimozione completa del prefisso. Possiamo vederlo chiaramente nel numero di aggiornamenti che riceviamo da Facebook quando controlliamo la nostra cronologia dal nostro database BGP temporaneo. Questo grafico è di solito piuttosto tranquillo: Facebook non apporta molte modifiche minuto per minuto alla sua rete.

Ma intorno alle 15:40 UTC, abbiamo visto un improvviso picco nelle modifiche al routing da Facebook. Questo è quando sono iniziati i problemi.

Se i server dei nomi non sono raggiungibili o non rispondono per altri motivi, viene restituito SERVFAIL e il browser invia un errore all’utente.

READ  Energia nucleare sul radar dei minatori di Bitcoin

Da quando Facebook ha smesso di pubblicizzare i suoi percorsi di prefisso DNS tramite BGP, i resolver DNS e chiunque altro non hanno avuto modo di connettersi ai propri server dei nomi. Pertanto, 1.1.1.1, 8.8.8.8 e altri importanti DNS pubblici hanno iniziato a emettere (e memorizzare nella cache): risposte SERVFAIL.

ma, questo non è tutto. Ora il comportamento umano e la logica dell’applicazione entrano in gioco e causano un altro effetto esponenziale. C’è uno tsunami di traffico DNS aggiuntivo. Ora, poiché Facebook e i suoi siti sono così grandi, abbiamo DNS in tutto il mondo.O che gestiscono 30 volte più query del solito, che può causare problemi di latenza e timeout per altre piattaforme (es. rallentamento di Telegram).

Ciò accade in parte perché le app non accettano un errore come risposta e iniziano a riprovare, a volte in modo aggressivo, e in parte perché anche gli utenti finali non accettano un errore come risposta e iniziano a ricaricare le pagine o a terminare e riavviare le loro app. , e talvolta anche fortemente. .