
구글이 효율성에 초점을 맞추면서도 강력한 성능을 제공하는 새로운 AI 모델을 출시합니다.
이 모델인 Gemini 2.5 Flash는 곧 구글의 AI 개발 플랫폼인 Vertex AI에서 공개될 예정입니다. 구글에 따르면, 이 모델은 "동적이며 제어 가능한(dynamic and controllable)" 컴퓨팅 방식을 제공하여, 개발자가 쿼리 복잡도에 따라 처리 시간을 능동적으로 조절할 수 있게 합니다.
구글은 TechCrunch에 제공한 블로그 게시물에서 "사용자의 특정 요구에 맞춰 속도, 정확도, 비용의 균형을 조절할 수 있습니다. 이러한 유연성은 대용량(high-volume)이며 비용에 민감한 애플리케이션에서 Flash 모델의 성능을 최적화하는 핵심 요소입니다."라고 설명했습니다.
Gemini 2.5 Flash가 등장한 시점은 플래그십 AI 모델의 비용이 지속적으로 상승하는 추세에 대응하기 위함입니다. 2.5 Flash와 같이 비용 효율적이면서도 성능이 우수한 모델은, 일부 정확도의 손실을 감수하더라도 고가(高價)의 최고급 옵션에 매력적인 대안을 제시합니다.
Gemini 2.5 Flash는 OpenAI의 o3-mini 및 DeepSeek의 모델과 유사한 "추론(reasoning)" 모델에 속합니다. 이는 자체적으로 사실 확인(fact-check) 과정을 거치기 때문에 질문에 답변하는 데 다소 시간이 더 소요된다는 의미입니다.
구글은 2.5 Flash가 고객 서비스나 문서 파싱(document parsing)과 같은 "대용량" 및 "실시간" 애플리케이션에 특히 이상적이라고 밝혔습니다.
구글은 블로그 게시물에서 "이 작업용(workhorse) 모델은 낮은 지연 시간(low latency)과 비용 절감에 맞춰 특별히 최적화되었습니다. 효율성이 중요한 반응형 가상 비서나 실시간 요약 도구에 이상적인 엔진입니다."라고 언급했습니다.
현재 구글은 Gemini 2.5 Flash에 대한 안전성 또는 기술 보고서를 공개하지 않아, 이 모델의 강점과 약점을 명확히 파악하기 어렵습니다. 구글은 이전에 TechCrunch를 통해 "실험적(experimental)"으로 간주되는 모델의 경우 보고서를 공개하지 않는다고 밝힌 바 있습니다.
한편, 구글은 수요일에 2.5 Flash와 같은 Gemini 모델을 3분기부터 온프레미스(on-premises) 환경으로 확장할 계획이라고 발표했습니다. 구글의 Gemini 모델은 엄격한 데이터 거버넌스 요구 사항을 갖춘 고객을 위한 온프레미스 솔루션인 Google Distributed Cloud(GDC)를 통해 사용할 수 있습니다. 구글에 따르면, 회사는 고객이 구글 또는 선호하는 채널을 통해 구매할 수 있는 GDC 호환 Nvidia Blackwell 시스템으로 Gemini 모델을 가져오기 위해 엔비디아(Nvidia)와 협력하고 있습니다.
[출처:] https://techcrunch.com/2025/04/09/googles-newest-gemini-ai-model-focuses-on-efficiency