• OpenAI의 거대 데이터센터, 일론 머스크의 xAI 콜로서스보다도 크다... '세계 최대 300MW AI 데이터센터' 내년까지 최고 기록인 1기가와트 규모로 커지며 전력망 안정성 위협 제기

    세계에서 가장 큰 단일 건물입니다

    article image

    엘론 머스크의 xAI는 20만 개의 GPU를 갖춘 데이터 센터를 건설하며 약 250MW의 전력을 소비하는 것으로 큰 주목을 받았습니다. 그러나 OpenAI는 텍사스에 훨씬 규모가 큰 데이터 센터를 보유하고 있는 것으로 알려졌으며, 이곳은 300MW의 전력을 소비하고 수십만 개의 AI GPU를 수용하지만, 세부 사항은 아직 공개되지 않았습니다. 더 나아가 이 회사는 해당 부지를 확장 중이며, SemiAnalysis에 따르면 2026년 중반까지 기가와트(GW)급 용량에 도달하는 것을 목표로 하고 있습니다. 이처럼 거대한 AI 클러스터는 전력 발전 용량뿐만 아니라 전력망 안정성 측면에서도 전력회사에 심각한 과제를 던지고 있습니다.

    OpenAI가 운영하는 시설은 IT 부하 용량 약 300MW, 최대 전력 용량 약 500MW에 달하는, 세계 최대 규모의 단일 데이터 센터 건물로 설명됩니다. 이 시설에는 210개의 공랭식 변전소와 대규모 현장 전기 변전소가 포함되어 있어 그 거대한 규모를 입증합니다. 더욱이 같은 부지에는 2025년 1월 기준으로 두 번째 동일 건물이 이미 건설 중입니다. 이 확장이 완료되면 캠퍼스의 총 용량은 기록적인 약 1GW에 달하게 됩니다.

    이러한 발전 현황은 전력망 관리를 책임지는 텍사스 전력망 안정 위원회(ERCOT)의 이목을 집중시키고 있습니다. 이는 해당 시설들이 가진 전례 없는 규모와 막대한 에너지 수요 때문입니다. 데이터 센터의 전력 소비 패턴과 급격한 성장은 여러 이유로 에너지 공급 회사들에 중대한 과제를 안겨주고 있습니다.

    위성 이미지는 엘론 머스크의 xAI Colossus 2가 1GW 용량과는 거리가 멀다는 점을 시사합니다. 주장과는 달리, 해당 부지는 350MW의 냉각 용량만을 갖추고 있는 것으로 파악됩니다.

    첫째, 수십만 개의 AI 가속기(Nvidia H100 또는 B200 등)와 서버들은 엄청난 전력을 소모하며 대규모의 지속적인 전력 공급을 필요로 합니다. 그 규모는 종종 중소 규모 도시 전체의 소비 전력량에 비견됩니다. 이러한 부하를 충당하기 위해 전력회사들은 변전소, 송전선, 발전 용량을 평소보다 훨씬 빠르게 건설하거나 업그레이드해야 합니다. 이는 특히 이러한 급격한 성장에 대비할 준비가 되지 않은 지역에서 재정적, 물리적 인프라 계획 모두에 과부하를 초래합니다.

    둘째, 데이터 센터의 전력 사용 패턴은 불안정합니다. 전력을 안정적으로 사용하는 전통적인 공장이나 사무실 건물과 달리, AI 중심 데이터 센터는 순간적으로 최대 부하에서 최소 사용량으로 전력 사용량이 급격히 변동할 수 있습니다. 이러한 변동성은 계통 관리에 막대한 부담을 줍니다. 공급과 수요 사이의 아주 작은 불균형만으로도 전압과 주파수 문제가 발생할 수 있기 때문입니다.

    구체적으로, 전력 생산량이 필요량을 초과할 경우 전압과 주파수가 정상 범위보다 상승하고, 반대로 수요가 공급을 초과할 경우 표준 값 이하로 떨어집니다. 어느 한쪽이라도 10%만 벗어나도 전자 장비가 손상되거나 회로 보호 시스템이 작동할 수 있습니다. 이러한 매개변수를 안전 범위 내로 유지하여 시스템 안정성을 확보하는 것은 계통 운영자의 핵심 책임입니다. 하지만 OpenAI가 사용하는 것과 같은 거대 데이터 센터(또는 여러 대형 데이터 센터)가 전력 사용량을 갑자기 줄일 경우, 나머지 전력망 전체에 충격파를 보내 다른 전력 사용자나 발전기를 가동 중단시키고, 이는 잠재적으로 대규모 연쇄 고장을 유발할 수 있습니다.

    셋째로, 이러한 데이터 센터를 전력망에 통합하려면 지역 계획 당국과의 복잡한 조율이 필요합니다. 이 당국은 일반적으로 송전 안정성에 미치는 영향을 분석하고 다른 그리드 사용자들과의 충돌을 방지하기 위한 연구를 수행합니다. 그러나 이러한 연구는 시간이 오래 걸리며, 종종 데이터 센터가 건설되는 속도를 따라잡지 못하는 경우가 많습니다.

    마지막으로, 전력회사들은 대규모 데이터 센터의 수요를 충족시키기 위해 수십억 달러를 지출해야 할 수도 있다는 경제적 과제가 존재합니다. 그러나 AI 산업의 예측 불가능한 특성상 이러한 투자 대비 수익률을 모델링하기 어렵다는 문제가 따릅니다. 동시에, 전력망이 충분히 빠르게 업그레이드되지 않으면 정전 사태가 발생하거나, 제한된 그리드 용량을 확보하지 못한 산업 고객들이 전력 공급 대상에서 제외될 위험도 있습니다.

    최신 뉴스, 분석 및 리뷰를 피드에서 받아보려면 Google News에서 Tom's Hardware를 팔로우하세요. 팔로우 버튼을 클릭하는 것을 잊지 마세요.

    [출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/openais-gargantuan-data-center-is-even-bigger-than-elon-musks-xai-colossus-worlds-largest-300-mw-ai-data-center-in-texas-could-reach-record-1-gigawatt-scale-by-next-year