
Google DeepMind가 가장 진보된 AI 추론 모델인 Gemini 2.5 Deep Think를 공개했습니다. 회사 측에 따르면, 이 모델은 여러 아이디어를 동시에 탐색하고 고찰한 후, 그 결과를 바탕으로 최적의 답을 도출해낼 수 있습니다.
Google의 월 250달러 구독 서비스 가입자는 오는 금요일부터 Gemini 앱을 통해 Gemini 2.5 Deep Think에 접근할 수 있습니다.
2025년 5월 Google I/O에서 처음 공개된 Gemini 2.5 Deep Think는 Google이 선보인 최초의 멀티 에이전트 모델입니다. 이 시스템은 질문을 해결하기 위해 여러 AI 에이전트를 병렬로 가동하는데, 단일 에이전트 방식보다 훨씬 많은 컴퓨팅 자원을 사용하지만, 결과적으로 더 높은 답변 품질을 보여주는 경향이 있습니다.
Google은 올해 국제 수학 올림피아드(IMO)에서 금메달을 획득하는 데 Gemini 2.5 Deep Think의 파생 모델을 사용했습니다.
회사 측은 이와 함께 IMO에 사용된 모델을 소수의 수학자 및 학계 종사자에게도 공개한다고 밝혔습니다. Google에 따르면, 이 AI 모델은 일반 소비자용 AI 모델들이 몇 분 또는 몇 초 만에 응답하는 것과 달리, 답변을 도출하는 과정 자체가 '몇 시간'이 소요된다고 합니다. 회사는 IMO 모델을 활용해 연구 역량을 강화하고, 학술적 사용 사례에 필요한 멀티 에이전트 시스템 개선 피드백을 얻는 것을 목표로 합니다.
Google은 Gemini 2.5 Deep Think 모델이 I/O에서 발표된 버전보다 상당한 성능 향상을 이루었다고 언급했습니다. 또한, 모델이 추론 경로를 더욱 효과적으로 활용하도록 유도하는 "새로운 강화 학습 기법(novel reinforcement learning techniques)"을 개발했다고 주장합니다.
Google은 TechCrunch에 공유한 블로그 게시물에서 "Deep Think는 창의성, 전략적 계획, 단계별 개선이 필요한 문제 해결에 도움을 줄 수 있다"고 설명했습니다.
회사는 Gemini 2.5 Deep Think가 인류의 마지막 시험(Humanity’s Final Exam)에서 뛰어난 성능을 보였습니다. 이 시험은 과학, 수학, 역사, 논리 등 다양한 영역의 문제로 구성되어 있으며, Gemini는 최고 점수를 기록했습니다.
🧪 주요 테스트 결과
- 과학: 최고점 기록
- 수학: 최고점 기록
- 역사: 최고점 기록
- 논리: 최고점 기록
테스트 하이라이트
Gemini는 이 시험에서 복합적인 추론 능력을 선보였으며, 특히 인간 전문가 수준의 심층적 사고와 문제 해결 능력을 입증했습니다.
️ 추가 기능
- 코드 실행: 사용자가 제공하는 코드를 실행하고 오류를 수정할 수 있습니다.
- 실시간 정보: 최신 정보를 바탕으로 답변합니다.
- 멀티모달 기능: 이미지와 텍스트를 동시에 처리합니다.