머스크, 전설적인 AI 연구원 카파티에게 Grok 5를 상대로 AI 코딩 대결 도전 — IBM 딥 블루급 대결은 정중한 '거절'을 받다

hw_reporter

머스크, Grok 5를 Deep Blue에 비유하며 코딩 대결을 제안했다.

일론 머스크는 xAI의 Grok 5와 전 OpenAI 연구 책임자 안드레이 카파티(Andrej Karpathy) 사이에 공개 코딩 대회를 열 것을 제안했으며, 이는 가리 카스파로프와 IBM의 Deep Blue 간의 1997년 대결에 빗댄 것입니다. 그러나 카파티는 이를 거절하며, 경쟁하는 것보다 Grok과 협력하는 편을 선호한다고 밝혔습니다.

이러한 도전은 카파티가 최근 Dwarkesh Podcast에 출연한 인터뷰 클립에서 비롯되었는데, 그가 AGI(범용 인공지능)가 아직 10년가량 더 멀었을 가능성이 높다고 주장하며, Grok 5가 GPT-4보다 몇 달 정도 뒤처진 수준이라고 묘사했기 때문입니다.

Grok 5가 AGI에 도달할 확률이 10%이며 상승하고 있다고 밝힌 머스크는 이를 일종의 초대장으로 받아들였습니다. 그는 X에 직접 카파티를 태그하며 "AI 코딩 대회가 어떻겠습니까?"라고 게시했습니다.

[제목: 엘론 머스크, Dojo3 ‘우주’ 슈퍼컴퓨터 프로젝트 재개: AI5 칩 디자인 '순항']

머스크는 "여러분이 제기한 지적들은 정말 많습니다. 특히 아이들이 어릴 때부터 물리 도구를 배우는 것이 중요하다는 점은 그렇고요. 카스파로프 대 Deep Blue와 같은 방식으로, 안드레이와 Grok 5 간의 AI 코딩 대회가 어떠신가요? 원하시는 어떤 종류의 경쟁도 좋습니다. 2025년 10월 18일"이라고 언급했습니다.

이에 대해 카파티는 그러한 매치업에서 자신의 기여도는 "약 0에 수렴할 것"이라고 답하며, 현재의 모델들을 적수(adversaries)라기보다는 협력자(collaborators)로 보는 관점을 강조했습니다.

모델 대 인간의 코딩 대회를 공식적으로 여는 것은 무리가 아닙니다. DeepMind는 올해 초 Gemini 2.5가 ICPC 월드 파이널(ICPC World Finals) 조건의 12문제 중 10문제를 해결하며 금메달 수준의 실력을 보여준 바 있습니다. 더 나아가 OpenAI와 DeepMind는 현재 GPT-4와 GPT-5를 사용하여 동일한 벤치마크에서 완벽한 12/12 점수를 달성했습니다. 이 문제는 대학 수준의 알고리즘 대회에서 출제되며, 정확성과 실행 시간 성능 모두가 평가되고 엄격한 자원 및 시간 제약 조건 하에서 진행됩니다.

더 앞서 올해 초에는 폴란드 출신 프로그래머가 AtCoder World Tour Finals에서 진행된 10시간간의 일대일 결승전에서 OpenAI의 맞춤형 모델을 꺾는 사건이 발생했습니다. 이는 최고 수준에서의 마지막 인간 승리일 수 있다는 추측을 낳았으며, 해당 대회는 엄격히 통제되고 완전히 투명하게 진행되었습니다.

만약 머스크가 Grok 5가 해당 분야에서 진지하게 인정받기를 원한다면, Grok 5를 동일한 조건의 시험대에 올려야 합니다. Deep Blue와의 비교는 경기가 '측정 가능'할 때에만 유효합니다. 즉, 공개된 문제 세트를 활용하는 고정 길이의 대회, 도구 및 컴퓨팅 자원에 대한 동일한 접근성, 그리고 외부 추론이나 인간의 도움을 허용하지 않는 조건이 전제되어야 합니다. 또한 결과는 독립적으로 채점되고 전면적으로 공개되어야 합니다.

카파티가 참여를 거부한 결정은 머신러닝 전문가들이 성능을 논하는 방식 전반의 변화를 반영합니다. 많은 전문가들이 일대일 대결 자체보다는 모델이 인간의 결과물을 얼마나 효과적으로 가속화할 수 있는지에 초점을 맞추고 있기 때문입니다. 하지만 경쟁 프로그래밍은 여전히 명확하고 잘 정의된 벤치마크를 제공합니다. 그리고 현재까지 Grok은 관련 점수를 공개하지 않은 상태입니다.

xAI가 동등성이나 우월성을 입증하고자 한다면, ICPC 수준의 과제로 공식적인 테스트를 진행하는 것이 가장 당연하고 명백한 출발점이 될 것입니다.

[푸터 부분 생략]

[출처:] https://www.tomshardware.com/tech-industry/musk-challenges-kaparthy-to-an-ai-coding-showdown