
마이크로소프트는 수요일에 여러 개의 새로운 "오픈" AI 모델들을 출시했으며, 이 중 최고 성능의 모델은 적어도 하나의 벤치마크에서 OpenAI의 o3-mini와 경쟁할 수 있는 수준입니다.
이번에 새롭게 배포된 모든 모델(Phi 4 mini reasoning, Phi 4 reasoning, Phi 4 reasoning plus)은 "추론(reasoning)" 모델입니다. 즉, 복잡한 문제에 대한 해결책을 도출하는 과정에서 사실 확인에 더 많은 시간을 할애할 수 있다는 것을 의미합니다. 이 모델들은 회사가 1년 전 출시하여 엣지 환경에서 애플리케이션을 구축하는 AI 개발자들을 위한 기반을 제공했던 마이크로소프트의 Phi "소형 모델"군을 확장한 것입니다.
마이크로소프트에 따르면, Phi 4 mini reasoning은 중국 AI 스타트업 DeepSeek의 R1 reasoning 모델이 생성한 약 1백만 개의 합성 수학 문제로 훈련되었습니다. 약 38억 개의 매개변수를 가진 Phi 4 mini reasoning은 경량 장치에서 구현하는 "임베디드 튜터링"과 같은 교육용 애플리케이션에 적합하도록 설계되었습니다.
참고로, 매개변수(Parameters)는 모델의 문제 해결 능력과 어느 정도 관련이 깊으며, 일반적으로 매개변수가 많을수록 성능이 우수합니다.
140억 개의 매개변수를 가진 Phi 4 reasoning은 "고품질" 웹 데이터와 더불어 OpenAI의 앞서 언급된 o3-mini에서 추출한 "엄선된 데모 시연(curated demonstrations)"을 활용해 훈련되었습니다. 마이크로소프트는 이 모델이 수학, 과학, 코딩 애플리케이션 분야에 가장 최적화되어 있다고 밝혔습니다.
Phi 4 reasoning plus는 마이크로소프트가 이전에 출시했던 Phi 4 모델을 특정 작업에 대한 정확도를 높이도록 재가공한 추론 모델입니다. 마이크로소프트는 Phi 4 reasoning plus가 훨씬 더 많은 매개변수(6,710억 개)를 보유한 DeepSeek R1에 근접한 성능 수준을 달성했다고 주장합니다. 또한, 회사 내부 벤치마킹 결과에 따르면, Phi 4 reasoning plus는 수학 능력 테스트인 OmniMath에서 o3-mini와 동일한 수준의 성능을 보였습니다.
Phi 4 mini reasoning, Phi 4 reasoning, Phi 4 reasoning plus 모델과 각 모델의 상세 기술 보고서는 AI 개발 플랫폼인 Hugging Face에서 확인할 수 있습니다.
마이크로소프트는 공식 블로그 게시물에서 "증류(distillation), 강화 학습(reinforcement learning), 그리고 고품질 데이터를 결합하여, 이 [새로운] 모델들은 크기와 성능의 완벽한 균형을 이뤘습니다. 이 모델들은 저지연(low-latency) 환경에 충분히 작으면서도 훨씬 더 큰 모델들과 경쟁할 만한 강력한 추론 능력을 유지합니다. 이러한 결합을 통해 자원이 제한적인 장치조차도 복잡한 추론 작업을 효율적으로 수행할 수 있게 합니다."라고 설명했습니다.