• 대규모 AWS 장애로 인터넷 마비…로블록스, 포트나이트, 줌, 스냅챗 등 모든 서비스 먹통

    지속적인 문제

    article image

    Amazon Web Services(AWS)는 인터넷의 상당 부분을 사용할 수 없게 만든 대규모 문제(장애)가 발생했음을 확인했습니다. AWS는 서비스 장애를 유발한 주요 문제를 식별하고 수정했다고 발표했지만, 영향을 받은 모든 서비스가 정상화되는 데는 시간이 걸릴 수 있다고 전했습니다.

    아마존은 발생 사례가 드문 일이라고 언급하며, 동부 표준시(ET) 기준 오전 3시경 "US-EAST-1 리전의 여러 AWS 서비스에서 오류율 및 지연 시간이 증가"했다고 확인했습니다. 약 90분 후에는 "US-EAST-1 리전의 DynamoDB 엔드포인트로 전송된 요청에 심각한 오류율이 있음을 확인했다"고 추가했습니다.

    AWS는 동부 표준시 기준 오전 5시에 다음과 같이 발표했습니다. "US-EAST-1 리전의 DynamoDB API 오류율에 대한 잠재적인 근본 원인을 식별했습니다. 조사 결과, 이 문제는 US-EAST-1의 DynamoDB API 엔드포인트 DNS 확인(resolution)과 관련이 있는 것으로 보입니다. 저희는 복구를 가속화하기 위해 여러 병렬 경로로 작업하고 있습니다. 이 문제는 US-EAST-1 리전의 다른 AWS 서비스에도 영향을 미칩니다. IAM 업데이트 및 DynamoDB Global tables와 같이 US-EAST-1 엔드포인트를 사용하는 글로벌 서비스나 기능도 문제가 발생할 수 있습니다. 이 기간 동안 고객은 지원 사례(Support Cases)를 생성하거나 업데이트할 수 없습니다. 고객께서는 실패한 요청을 계속 재시도하시기를 권장합니다. 더 많은 정보를 알게 되는 대로 업데이트를 계속 제공하겠습니다."

    AWS는 온라인 세계의 많은 부분을 지탱하는 핵심 인프라입니다. 따라서 이번 장애는 온라인상에서 연쇄적인 문제를 야기하며, 많은 사용자들이 광범위한 서비스에 접근하지 못하고 있습니다.

    article image

    Downdetector를 사용하는 미국 사용자들은 Snapchat, Roblox, Amazon, Alexa, Ring, Robinhood, Max (HBO), Chime, Venmo, Epic Games, McDonald's, Fortnite, Lyft, Hulu, Disney+, Roku, Signal 및 AT&T, Verizon, T-Mobile을 포함한 통신사에서 문제를 보고하고 있습니다. PC 게임 플랫폼인 Steam과 Reddit 같은 온라인 포럼 역시 영향을 받고 있습니다.

    Zoom, Pokémon Go, PlayStation Network 등 인기 은행 앱 및 도구들 또한 어려움을 겪고 있으며, Perplexity와 같은 일부 AI 서비스도 마찬가지입니다.

    AWS는 동부 표준시 기준 오전 5시 20분에 초기 완화 조치를 적용했으며 회복 징후를 관찰하고 있다고 밝혔고, 얼마 후에는 "상당한 회복 징후"를 보인다고 추가했습니다. 하지만 AWS는 처리해야 할 대기 요청(backlog of queued requests)이 많아 사용하려는 서비스가 완전히 회복되는 데는 시간이 걸릴 수 있다고 언급했습니다.

    동부 표준시 기준 오전 6시, AWS는 "영향을 받은 대부분의 AWS 서비스 전반에 걸쳐 회복세가 지속됨을 관찰하고 있습니다. US-EAST-1에 의존하는 글로벌 서비스도 정상화되고 있습니다. 저희는 이 상황을 면밀히 모니터링하고 있습니다."


    본 내용은 원문의 내용을 바탕으로 재구성되었습니다.

    [출처:] https://www.tomshardware.com/tech-industry/colossal-aws-outage-breaks-the-internet-roblox-fortnite-zoom-and-beyond-all-crippled