Como é o sistema que deixou vários sites do mundo fora do ar

Amazon, Reddit, The New York Times e página do governo britânico ficaram inacessíveis por cerca de uma hora. Problema foi detectado em empresa que opera rede de entrega de conteúdo

O Nexo é um jornal independente sem publicidade financiado por assinaturas. Este conteúdo é exclusivo para nossos assinantes e está com acesso livre como uma cortesia para você experimentar o jornal digital mais premiado do Brasil. Apoie nosso jornalismo. Conheça nossos planos. Junte-se ao Nexo!

    Na manhã de terça-feira (8), alguns dos principais sites do mundo ficaram fora do ar ao mesmo tempo. Páginas como a loja virtual Amazon, a rede social Reddit, o jornal The New York Times e a plataforma central do governo britânico ficaram inacessíveis por cerca de uma hora, a partir das 7h30 do horário de Brasília.

    Às 9h45, o acesso já estava estabilizado para a maior parte do mundo. A queda se deu por um problema nos sistemas da empresa Fastly, que administra parte da infraestrutura desses sites. Por meio de comunicado oficial enviado à imprensa, a companhia afirmou que já tinha identificado o problema e que estava trabalhando em uma solução rápida.

    Neste texto, o Nexo explica o sistema que causou a falha, as soluções encontradas por veículos de comunicação para publicar informações e por que problemas do tipo estão cada vez mais raros.

    A rede de entrega de conteúdo

    Sempre que você abre um site ou um aplicativo que depende de internet, os computadores que abrigam aquele conteúdo – também chamados de servidores – recebem um pedido de acesso ou envio de determinados dados.

    Ao receber o pedido, esses computadores enviam uma resposta ao usuário, que pode ser o acesso, o envio das informações desejadas ou uma mensagem que diz que elas não podem ser acessadas ou enviadas por algum motivo.

    Essa troca constitui o tráfego de dados na internet. Para que tudo isso funcione, a internet depende de uma estrutura física, que consiste em uma série de cabos e servidores espalhados em cada país.

    Quando a comunicação precisa ser feita com um servidor que está localizado em um país separado do Brasil por um oceano, o tráfego passa por cabos submarinos, instalados a muitos metros de profundidade. Atualmente, o país tem seis cabos submarinos funcionando.

    Para entender o sistema que causou a falha de terça-feira (8), imagine que a estrutura física da internet é uma estrada e que você quer comer um sanduíche em uma rede de fast-food. A primeira unidade dessa rede, aquela que começou tudo, está a 500 km de distância de onde você está.

    Mas há um restaurante franqueado – que serve os mesmos pratos, com os mesmos ingredientes – a 5 km de você. Ir até ele é muito mais rápido.

    O sistema de CDN (sigla em inglês para Rede de Entrega de Conteúdo), origem do problema desta terça, é basicamente o restaurante franqueado.

    O que a Fastly faz com seu serviço de CDN é espalhar cópias dos sites originais em servidores localizados em diferentes países, diminuindo a distância física entre a página e o usuário final, o que garante uma experiência mais rápida e fluida para todos.

    Além disso, usar um serviço de CDN evita que o servidor original do site seja sobrecarregado. Voltando à metáfora da estrada, imagine que nela há um pedágio. Se há muito mais carros tentando passar nele do que cabines disponíveis, um congestionamento será formado.

    Com um serviço de CDN, é como se houvessem dezenas de milhares de estradas paralelas com suas próprias cabines de pedágio espalhadas pelo mundo, todas levando a um mesmo destino, e assim evitando que a rodovia principal fique congestionada.

    Até a manhã de terça-feira (8), a Fastly não tinha explicado publicamente o que exatamente causou a falha no serviço de CDN e nem o que pode ser feito para evitar problemas similares no futuro.

    O canal de TV americano CNN, o jornal britânico The Guardian e as plataformas de streaming Twitch e Hulu também ficaram fora do ar temporariamente.

    Como o problema foi contornado

    Alguns veículos de comunicação buscaram maneiras criativas de contornar o problema para continuarem informando seus respectivos públicos.

    O jornal The Guardian optou por fazer atualizações em tempo real no Twitter, com as informações sendo apresentadas pelo jornalista Alex Hern, editor da seção de tecnologia da publicação.

    O Twitter também foi usado pelo jornal The New York Times, que optou apenas por informar superficialmente aos leitores que havia um problema e que detalhes seriam publicados posteriormente.

    O site de tecnologia The Verge, que também ficou fora do ar, abriu um arquivo de visibilidade pública na plataforma de edição de texto Google Docs, publicando o link com as informações nas redes sociais.

    ‘Baleiou’

    Nas redes sociais, usuários começaram a comentar que “a internet ‘baleiou’”.

    “Baleiar”, um dos muitos neologismos surgidos com a internet, é uma palavra que se refere a momentos em que uma página ou serviço fica fora do ar.

    Sua origem está no fato de que no começo da década de 2010, o desenho de uma baleia era mostrado aos usuários do Twitter quando a plataforma estava fora do ar.

    Apesar da baleia não ser mais usada pelo Twitter desde 2013, o termo “baleiou” continua sendo usado quando situações do tipo se apresentam.

    Um problema cada vez mais raro

    A suspensão massiva de sites e aplicativos por problemas técnicos como o de terça-feira (8) é um problema cada vez mais raro.

    Nos primórdios da internet, serviços fora do ar eram uma realidade cotidiana. Bastava um problema mínimo para que uma página – ou série de páginas – ficasse inacessível.

    A tecnologia avançou com sistemas e técnicas que foram desenvolvidas para garantir que o usuário final consiga acessar um site mesmo quando há um problema.

    Um dos serviços mais usados para isso é o Always Online, da empresa americana Cloudflare, que salva uma versão estática do site para que o conteúdo possa ser acessado mesmo que haja um problema no servidor.

    Apesar da existência e contratação desses sistemas, outros problemas podem vir a ocorrer e fazer com que mesmo assim os sites fiquem inacessíveis ao público. Em julho de 2020, um problema na Cloudflare fez com que 69 páginas e serviços ficassem fora do ar por algumas horas.

    Todos os conteúdos publicados no Nexo têm assinatura de seus autores. Para saber mais sobre eles e o processo de edição dos conteúdos do jornal, consulte as páginas Nossa equipe e Padrões editoriais. Percebeu um erro no conteúdo? Entre em contato. O Nexo faz parte do Trust Project.