딥시크(DeepSeek)의 새로운 오픈 소스 AI 추론 모델인 R1이 발표되자 엔비디아(Nvidia) 주가는 급락세를 보였으며, 엔비디아의 소비자 애플리케이션 관련 관심도는 앱스토어 상위권을 기록하며 급등하는 등 거센 반응을 불러왔다.
딥시크는 지난달 약 2,000개의 엔비디아 H800 GPU 데이터 센터를 활용하여 약 550만 달러의 비용으로 불과 두 달 만에 이 모델을 훈련했다고 공개했다. 또한 지난주에는 최신 모델의 성능이 현존하는 최고 수준의 추론 모델들과 대등한 수준임을 입증하는 논문을 발표했다. 현재의 최고 성능 AI 모델들은 엔비디아의 빠르지만 매우 비싼 AI 칩에 수십억 달러를 지출하는 데이터 센터에서 훈련되고 있는 실정이다.
딥시크의 고성능 모델과 저비용 구조에 대한 기술 업계의 반응은 매우 뜨거웠다. 대표적인 예로 Pat Gelsinger는 X에 "DeepSeek 팀에게 감사드립니다(Thank you DeepSeek team.)"라는 글을 올리며 극도의 기쁨을 표현했다.
Gelsinger는 "지혜는 우리가 이미 알고 있다고 생각했던 교훈들을 배우고 있다. DeepSeek은 컴퓨팅 역사에서 얻을 수 있는 세 가지 중요한 교훈을 상기시켜 준다. 첫째, 컴퓨팅은 기체 법칙을 따른다. 비용을 극적으로 낮추는 것이 시장을 확장할 것이다. 시장은 이 본질을 오해하고 있다. 이것이 AI를…."라는 내용의 글을 올리기도 했다. (2025년 1월 27일)
Gelsinger는 전 인텔(Intel) CEO 출신이자 하드웨어 엔지니어이며, 현재 교회용 메시징 및 참여 플랫폼을 개발하는 IPO를 앞둔 스타트업 Gloo의 회장이다. 그는 인텔을 4년간 재직한 후, 엔비디아에 대항하기 위해 개발했던 인텔의 대안 AI GPU인 Gaudi 3 AI 건을 계기로 작년 12월 회사를 떠났다.
그는 DeepSeek이 기술 산업에 던져야 할 세 가지 핵심 교훈이 있다고 강조했다. 즉, 낮은 비용은 폭넓은 채택을 의미하며, 독창성은 제약 조건 하에서 꽃피고, "개방형(Open) 방식이 승리한다. DeepSeek은 점차 폐쇄적인 기반 AI 모델 작업의 세계를 재설정하는 데 도움을 줄 것이다"라고 그는 덧붙였다. (현재 OpenAI와 Anthropic은 모두 비공개(closed source) 방식을 채택하고 있다.)
Gelsinger는 TechCrunch과의 인터뷰에서 R1의 인상적인 성능을 언급하며, Gloo가 이미 OpenAI를 채택하거나 비용을 지불하지 않기로 결정했다고 밝혔다. Gloo는 챗봇 및 기타 서비스를 제공할 AI 서비스 'Kallm'을 구축하고 있다.
그는 "제 Gloo 엔지니어들이 오늘 R1을 구동하고 있습니다. 예전에는 o1을 구동할 수도 있었겠지만, API를 통해서만 o1에 접근할 수 있습니다"라고 말했다.
대신, 그는 2주 안에 Kallm을 "완전히 오픈 소스인 자체 기반 모델로" 처음부터 재구축할 계획이라며 "이것은 정말 흥분되는 일"이라고 말했다.
이어 그는 딥시크 덕분에 AI가 너무 저렴해져서, AI가 단순히 '어디에나 존재하는' 수준을 넘어설 것이라고 전망했다. "저는 제 Oura Ring에 더 나은 AI를 원합니다. 보청기에 더 나은 AI가 필요합니다. 휴대폰에 더 많은 AI를 원합니다. 심지어 EV의 음성 인식 같은 임베디드 기기에 더 나은 AI를 원합니다."
그러나 Gelsinger의 낙관적인 반응은, 추론 기반 모델에 성능이 훨씬 뛰어나면서도 훨씬 저렴한 대안이 등장했다는 사실에 만족감을 느끼지 못하는 다른 전문가들의 의견과 다소 대비되었다. AI 시장은 덜 비싸지기는커녕, 점점 더 높은 비용 구조를 보이고 있었다.
다른 IT 업계 관계자들은 의구심을 표했다. 이들은 DeepMind가 제시한 모델의 규모와 비용 구조에 의문을 제기했다.
반면, DeepMind는 AI 개발의 핵심은 '접근성'에 있다고 반박했다.
결론적으로, DeepMind는 자사 기술의 핵심은 엄청난 자본력이나 막대한 컴퓨팅 파워가 아닌, 개방된 기술을 통해 모든 이가 AI 혁신에 참여할 수 있도록 하는 '개방성'이라고 강조했다.