구글, 자체 ‘추론’ AI 모델 출시

sw_reporter

Google이 새로운 "추론(reasoning)" AI 모델을 출시했다고 밝혔으나, 아직 실험 단계이며 자체 테스트를 통해서도 개선의 여지가 분명합니다.

Gemini 2.0 Flash Thinking Experimental라는 이름의 이 신규 모델은 Google의 AI 프로토타이핑 플랫폼인 AI Studio에서 이용 가능합니다. 모델 카드에 따르면, 해당 모델은 "멀티모달 이해, 추론, 코딩에 가장 적합"하며, 프로그래밍, 수학, 물리학과 같은 분야에서 "가장 복잡한 문제에 대해 추론"할 수 있는 능력을 갖추고 있습니다.

AI Studio의 제품 책임자를 맡은 로건 킬패트릭(Logan Kilpatrick)은 X(구 트위터)에 Gemini 2.0 Flash Thinking Experimental를 "[Google의] 추론 여정의 첫걸음"이라고 언급했습니다. Google의 AI 연구 부문인 Google DeepMind의 수석 과학자 제프 딘(Jeff Dean)은 자신의 게시물을 통해 이 모델이 "사고(thoughts)를 사용하여 추론 능력을 강화하도록 훈련되었다"고 설명했습니다.

딘은 질문을 고려하는 동안 모델을 "실행"하는 데 사용되는 컴퓨팅 양(inference time computation)을 언급하며, "추론 시간 계산을 늘릴 때 유망한 결과를 얻고 있습니다"라고 덧붙였습니다.

이 모델은 아직 초기 버전이지만, 시각적 단서와 텍스트적 단서가 결합된 어려운 퍼즐을 어떻게 처리하는지 다음 자료를 통해 확인할 수 있습니다: (2/3)
pic.twitter.com/JltHeK7Fo7
— Logan Kilpatrick (@OfficialLoganK)
2024년 12월 19일

최근 발표된 Google의 Gemini 2.0 Flash 모델을 기반으로 개발된 Gemini 2.0 Flash Thinking Experimental는 OpenAI 모델이나 다른 소위 추론 모델들의 설계와 유사해 보입니다. 대부분의 AI와 달리, 추론 모델은 자체적으로 효과적인 사실 확인이 가능하여 일반적으로 AI 모델의 오류를 유발하는 몇 가지 함정을 회피하는 데 도움을 줍니다.

다만 단점도 존재합니다. 추론 모델은 해결책에 도달하는 데 시간이 더 오래 걸리는 경향이 있습니다. 일반적으로 몇 초에서 몇 분까지 시간이 추가 소요됩니다.

Gemini 2.0 Flash Thinking Experimental는 프롬프트를 받으면 즉시 답변하지 않고, 여러 관련 프롬프트를 고려하며 추론 과정을 거쳐 답변하는 과정을 "설명"합니다. 충분한 시간이 흐른 후, 모델은 스스로 판단한 가장 정확한 답을 요약하여 제시합니다.

물론 이 과정이 정상적으로 작동할 때를 전제로 합니다. 실제로 이 모델에게 "strawberry"라는 단어에 R이 몇 개인지 물었더니, "두 개"라고 답하는 문제가 발생했습니다.

Google의 이 새로운 추론 모델은 가끔 단어의 글자 수를 세는 것조차 어려워합니다.

사용 환경에 따라 그 성능은 다를 수 있습니다.

오1(o1)의 출시 이후, Google뿐만 아니라 경쟁사 AI 연구소들로부터 추론 모델이 폭발적으로 쏟아져 나오고 있습니다. 11월 초, 퀀트 트레이더가 자금을 지원하는 AI 연구 회사 DeepSeek은 첫 추론 모델인 DeepSeek-R1의 미리보기 버전을 출시했습니다. 같은 달에는 알리바바의 Qwen 팀도 o1에 대항하는 최초의 '오픈' 경쟁 모델이라 주장하며 제품을 공개하기도 했습니다.

과거에는 구글이 여러 팀을 운영하며 추론 모델을 개발하고 있었다는 보도가 있었으며, 이후 The Information의 보도에 따르면 구글은 이 기술에만 최소 200명의 연구원을 투입하고 있는 것으로 알려졌습니다.

이러한 추론 모델 홍수는 무엇 때문에 시작되었을까요? 첫째, 생성형 AI를 개선하기 위한 새로운 접근 방식 탐색 덕분입니다. 동료 맥스 제프(Max Zeff)의 최근 보도에 따르면, 모델을 확장하기 위한 기존의 '무차별 대입(brute force)' 기법만으로는 예전만큼의 성능 개선을 기대하기 어렵다는 것입니다.

모두가 추론 모델이 최적의 경로라고 확신하는 것은 아닙니다. 운영하는 데 필요한 막대한 컴퓨팅 파워 때문에 비용이 많이 드는 경향이 있습니다. 또한, 지금까지 벤치마크에서 좋은 성능을 보였다 하더라도, 추론 모델이 이러한 발전 속도를 계속 유지할 수 있을지는 불분명합니다.

매주 수요일에 받은 편지함으로 [TechCrunch]의 AI 전문 뉴스레터가 도착합니다.

[출처:] https://techcrunch.com/2024/12/19/google-releases-its-own-reasoning-ai-model