
OpenAI는 목요일, 최신 소형 인공지능 모델인 GPT-4o mini를 공개했습니다. 이 회사에 따르면, GPT-4o mini는 기존의 최첨단 AI 모델보다 빠르고 저렴하여, 오늘부터 개발자들에게 공개되며 ChatGPT 웹 및 모바일 앱을 통해 일반 사용자들도 이용할 수 있습니다. 기업 사용자들은 다음 주부터 접근이 가능할 예정입니다.
OpenAI는 GPT-4o mini가 텍스트 및 비전 관련 추론 작업에서 업계 최고 수준의 소형 AI 모델보다 우수한 성능을 보인다고 밝혔습니다. 소형 AI 모델의 성능이 향상됨에 따라, 대형 모델(예: GPT-4 Omni, Claude 3.5 Sonnet) 대비 속도와 비용 효율성 측면에서 개발자들 사이에서 인기가 높아지고 있습니다. 특히, 개발자들이 반복적으로 AI 모델을 호출해야 하는 고빈도, 단순 작업에 유용한 옵션으로 평가됩니다.
GPT-4o mini는 OpenAI가 제공하는 가장 작은 모델 라인업의 핵심 모델로, 기존의 GPT-3.5 Turbo를 대체합니다. 회사는 이 신규 AI 모델이 추론 능력을 측정하는 벤치마크인 MMLU에서 82%의 점수를 기록하여, Gemini 1.5 Flash의 79%, Claude 3 Haiku의 75%와 비교된다고 주장했습니다. 또한, 수학 추론을 측정하는 MGSM에서는 GPT-4o mini가 87%를 기록해 Flash의 78%, Haiku의 72%를 능가했습니다.
(첨부된 차트는 Artificial Analysis가 제공하는 소형 AI 모델 비교 자료이며, 제시된 가격은 입력 및 출력 토큰을 합산한 것입니다.)
나아가 OpenAI는 GPT-4o mini가 이전 세대의 플래그십 모델보다 운영 비용이 현저히 낮으며, GPT-3.5 Turbo 대비 60% 이상 저렴하다고 설명했습니다. 현재 API를 통해 텍스트와 비전을 지원하며, 향후에는 비디오 및 오디오 기능까지 지원할 것이라고 밝혔습니다.
OpenAI Product API 책임자인 올리비에 고데몽(Olivier Godement)은 TechCrunch와의 인터뷰에서 "전 세계 모든 영역이 AI의 혜택을 누리려면 모델 접근성을 대폭 개선해야 합니다. GPT-4o mini는 이 방향에서 매우 큰 진전이라고 생각합니다"라고 말했습니다.
OpenAI API를 활용하는 개발자들에게 GPT-4o mini는 입력 토큰당 백만 개가 15센트, 출력 토큰당 백만 개가 60센트로 책정됩니다. 이 모델은 책 한 권 분량에 해당하는 128,000 토큰의 컨텍스트 창을 갖추고 있으며, 지식 차단 시점은 2023년 10월입니다.

OpenAI는 GPT-4o mini의 정확한 크기는 공개하지 않았으나, Llama 3 8b, Claude Haiku, Gemini 1.5 Flash 등 다른 소형 AI 모델들과 비슷한 등급에 속한다고 언급했습니다. 다만, 회사는 LMSYS.org 챗봇 아레나에서 진행된 사전 출시 테스트를 기반으로, GPT-4o mini가 업계를 선도하는 소형 모델들보다 빠르고, 비용 효율적이며, 지능적이라고 주장했습니다. 초기 독립 테스트 결과 또한 이를 뒷받침하는 것으로 보입니다.
Artificial Analysis의 공동 창업자인 조지 카메론(George Cameron)은 TechCrunch에 전한 이메일에서 "GPT-4o mini는 비교 가능한 모델 대비 평균 출력 속도가 초당 202토큰으로 매우 빠릅니다. 이는 GPT-4o와 GPT-3.5 Turbo보다 2배 이상 빨라, 많은 소비자 애플리케이션이나 LLM을 활용하는 에이전트 기반 작업 등 속도 의존적인 사용 사례에 강력한 솔루션을 제공합니다"라고 강조했습니다.
OpenAI의 ChatGPT Enterprise용 신규 도구 공개
한편, OpenAI는 목요일 기업 고객들을 위한 새로운 도구도 발표했습니다.
한 블로그 게시물을 통해 OpenAI는 금융, 의료, 법률 서비스, 정부 등 규제가 엄격한 산업군 기업들이 로깅 및 감사 요건을 준수하도록 돕는 'Enterprise Compliance API'를 발표했습니다.
이 도구들은 관리자가 ChatGPT Enterprise 데이터에 대한 감사 및 조치를 취할 수 있게 합니다. 해당 API를 이용하면 대화 내용, 업로드된 파일, 워크스페이스 사용자 정보 등을 포함하는 타임스탬프 기록을 제공받을 수 있습니다.
또한 OpenAI는 특정 비즈니스 사용 사례를 위해 커스터마이징된 ChatGPT 버전인 '워크스페이스 GPT'에 대해 관리자에게 더욱 세분화된(granular) 제어 권한을 부여했습니다. 기존에는 관리자가 워크스페이스에서 생성된 GPT 작업을 전면적으로 허용하거나 차단하는 것만 가능했지만, 이제 워크스페이스 소유자는 GPT가 상호작용할 수 있는 도메인의 승인 목록을 직접 생성할 수 있게 되었습니다.
[출처:] https://techcrunch.com/2024/07/18/openai-unveils-gpt-4o-mini-a-small-ai-model-powering-chatgpt