ChatGPT, 초보 체스 경기에서 Atari 2600에 '완전히 패배' — OpenAI 최신 모델이 1970년대 논리에 속다

hw_reporter

OpenAI의 최신 최고의 AI 모델이 거의 50년 된 콘솔 게임의 전설에 의해 능가되었다.

예상치 못한 전개로, OpenAI의 ChatGPT가 아타리 체스(Atari Chess)를 플레이하는 과정에서 '초보 수준으로 완패했다'는 주장이 나왔습니다. 이 게임 플레이의 기술적 이상 현상은 시트릭스(Citrix) 아키텍처 및 딜리버리 전문가인 로버트 주니어 카루소(Robert Jr. Caruso)가 주말 동안 발견했습니다. 카루소는 1977년 아타리 2600 콘솔 게임 시스템용 에뮬레이터 내에서 구동되는 1979년 아타리 체스 타이틀을 ChatGPT 4o의 성능에 대결시켰습니다.

미니 컴퓨터 대 체스 역사

컴퓨팅 성능을 체스 실력으로 평가하는 개념은 오랫동안 컴퓨터 애호가들 사이에서 하나의 확고한 전설처럼 자리 잡아 왔습니다. 체스 컴퓨터 게임은 콘솔 및 가정용 컴퓨팅의 초창기부터 인기를 누렸으며, 컴퓨터 및 체스 애호가들은 사용 가능한 체스 엔진의 능력을 '왕들의 게임' 그랜드마스터와 비교하며 큰 노력을 기울여 왔습니다.

IBM의 딥 블루(Deep Blue) 슈퍼컴퓨터는 1997년 당시 세계 체스 챔피언이었던 가리 카스파로프(Garry Kasparov)를 꺾으며 역사를 새로 썼습니다. 딥 블루 승리의 주요 요인은 막대한 연산 능력과 초당 2억 개의 가능한 체스 수를 평가하는 무차별 대입(brute force) 기법이었습니다. 하지만 카스파로프는 예정된 6경기 중 첫 경기를 패배했음에도 불구하고 반격에 성공하여, 최종 점수 4-2로 승리했습니다.

LLM은 AI 전쟁 게임에서 전술 핵무기를 사용했고, 세 차례의 전략적 공격을 개시했다

2025년 기준으로 볼 때, 딥 블루 슈퍼컴퓨터의 약 11.4 GFLOPS 처리 능력은 초보적인 현대 프로세서와 비교해도 매우 초라해 보입니다. 따라서, 거의 48년이 지난 게임 콘솔 에뮬레이션 환경에서 구동되는 아타리 체스가 ChatGPT에게 쉽게 패배할 것이라고 예상할 수 있습니다.

아타리 2600에 무릎 꿇은 ChatGPT

카루소가 자신의 링크드인 게시물에서 지적했듯이, 아타리 2600은 컴퓨팅 성능 자체가 극히 제한적이었습니다. 이 시스템은 1.19 MHz로 구동되는 MOS Technology 6507 프로세서로 구동되었으며, 성능을 GFLOPS가 아닌 KFLOPS로 측정하는 것이 훨씬 적절합니다. 이 시트릭스 엔지니어에 따르면, 아타리 체스의 엔진은 겨우 한두 수 앞을 예측할 정도에 불과합니다.

카루소는 챗봇이 초기 패배의 원인을 추상적이라는 점 탓으로 돌릴 때, 아타리 체스 말 아이콘을 바꿔주면서 ChatGPT가 쉽게 승리하도록 배려했다고 말했습니다. 그럼에도 불구하고, 가능한 한 상황을 명확하게 만들었음에도 ChatGPT는 "3학년 체스 클럽에서 비웃음거리로 전락할 만큼 충분한 실수를 범했습니다"라며 결국 무릎을 꿇었다고 엔지니어는 전했습니다.

하지만 비극적이게도, ChatGPT 4o는 게임 숙련도를 향상시키겠다고 계속 약속했지만, 구형 8비트 플랫폼의 상대가 카루소가 인내를 가지고 있는 한 계속해서 승리했습니다. 게임 세션 내내 직접적인 도움을 받았음에도 불구하고, ChatGPT는 아타리 체스의 '초보' 상대방을 이길 만큼의 지성을 보여주지 못했고, 결국 '항복'했습니다. 이것이 이 링크드인 게시물의 이야기입니다.

인공지능과 관련된 뉴스 흐름은 양극단을 오가는 양상을 보입니다. 때로는 AI가 놀라운 능력을 보여주기도 하지만, 다른 때에는 우스꽝스럽거나 심지어 위험할 정도로 미흡할 수도 있습니다. 이번 이야기는 후자(미흡한 경우)에 명확하게 분류됩니다.

최신 뉴스, 분석, 리뷰를 받아보시려면 구글 뉴스에서 톰스 하드웨어(Tom's Hardware)를 팔로우하세요. 팔로우 버튼을 클릭해 주세요.

[출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/chatgpt-got-absolutely-wrecked-by-atari-2600-in-beginners-chess-match-openais-newest-model-bamboozled-by-1970s-logic