cloudflare down

2025-11-18 cloudflare down
cloudflare 인프라를 사용하는 chatgpt, perplexity, cluade...등이 접속이 안된다.
이와중에 자체 인프라를 사용하는 구글의 gemini 는 잘된다.

구글은 자체 인프라가 있지만 나머지는 그렇지 못하다.
작은 회사가 급성장하면서 유명해지고 수십조를 벌었지만 수십년간 쌓아온 구글의 인프라는 짧은 시간에 채워넣을 수 없고 그래서 cloudflare 라는 회사도 같이 클 수 있었다.
어쩌면 당연한 흐름이고 이걸 탓하면 안될것 같다.

이번과 같은 인프라/클라우드로 전세계 패닉 사건은 최근 몇년간 꽤 심심치 않게 본다.


모든 것들이 클라우드로 서비스되면서 아주 커다란 크루즈에 올라탄 공동운명체가 된것 같다.
크루즈는 화려하고 편하고 좋지만 한번 사고나면 생각만해도 끔직하다.
클라우드로 대세화 되는건 거대한 흐름이지만 클라우드는 점점 더 많은 서비스가 생기고 복잡해진다.
20년전인가 암튼 오래전 클라우드라는 단어가 떠오르던 초창기만 하더라도 사내에서 원격 접속해서 사용하는 베어메탈 서버에 사원들이 각자 자기의 계정을 만들어 접속하는 형태였다.
그리고 자신의 계정에서 서비스를 올리는 형태였다.
하지만 virtualmachine, domain, loadbalancer, k8s, db, ai 까지 진짜 비지니스 로직만 신경쓰면 모든걸 클라우드가 해주는 시대가 됐다.
어떤 회사 클라우드를 사용하냐에 따라 그 사용방법을 숙지해야 되고 이것도 스펙이 된다.
이런 거대하고 복잡한 클라우드 서비스를 운영하려면 또 그만큼의 사람이 필요했고 많이 채용됐다.
그런데 코로나,ai시대를 거치면서 인력=비용이라는 문제가 발생했고 특히 북미에서는 빅테크 기업들이 필두로 해고 바람이 불었다.
1년전 쯤인가 cloudflare 직원이 해고되는 영상을 봤다.

aws, microsoft 도 기술직도 포함해 만명단위의 많은 직원을 내보냈다.
이런 기사를 볼때 처음에 아 이렇게 직원이 없어도 회사가 돌아가는 구나.
그 많은 사람들이 잉여 인력이 될 수 있구나하는 생각이 들었다.
그렇게 사람들이 내보내도 한동안 서비스에 문제가 없어 보였다.
그런데 이런 장애를 겪어 보니 어떤 사람을 내보냈고 내보낸 사람의 부재로 이런일이 발생하진 않았나 하는 생각이 든다.
어디서 본것 같은데 사람을 자를때 능력있고 우수한 직원을 내보내는게 아닌 부서단위로 전체를 내보내는 방법을 쓴다고 한다.
돈을 못버는 부서, ai 가 쉽게 대체할 수 있는 부서, 그런데 이들 부서들이 지금 보기엔 필요없을지 모르는데 한달,1년 후에 어떤 사이드 이펙트가 있을지 어떻게 모두 알까?
2025년 10월에 있었던 AWS US-EAST-1 지역 장애는 단순한 기술 결함이 아니라, 핵심 인력 유출로 인한 조직적 약화의 신호로 분석되는 말도 있다.
cloudflare 자르는 것도 그렇고 어떤 기준에 의해서 납득이 될 수 있는 이유가 있어야 하는데 너무 해고를 쉽게 한건 아닐까?
물론 ai 인간을 대체한다고 떠드는 세상이고 언제간 ai가 인간을 대신에 많은걸 대신할것은 분명해 보인다.
그래도 아직 ai가 완벽하지 않은데 잘못된 기준과 판단으로 인재들이 퇴출되고 있지는 않는지 잘 살펴야할것 같다.
해고에 모두를 만족시킬 수 있는 합당한 이유가 있을까만은 지금 천명, 만명등 숫자만 크게 부각돼 질이 아닌 양으로 비용절감만을 목표한다면 이런 전세계 장애가 아니더라도 그 회사 어딘간 탈이나고 또다른 재난의 작은 불씨가 남을것 같다.
비용절감을 위해 대부분 직원은 그냥 소모품으로 보고 ai만 바라보는 리더들은 살을 빼야지 다리는 자르는 대수술이 능사가 아니라는걸 알았으면 좋겠다.
아주 커다란 크루즈는 최첨단 항해 기능과 최신 엔진등으로 항해사, 엔지니어들의 수는 줄일 수 있지만 뛰어난 항해사 엔지니어 없이 현재 수준의 ai 가 모든걸 통제하는 배를 믿고 오를 여행객들이 얼마나 될지 생각해 보자.

comments:

댓글 쓰기