프랑스의 AI 스타트업 미스트랄(Mistral)이 개발자와 기업들이 특정 사용 사례에 맞춰 자사 생성형 모델을 미세 조정(fine-tune)할 수 있도록 유료 플랜을 포함한 새로운 AI 모델 커스터마이징 옵션을 도입했습니다.
가장 먼저 제시된 방식은 셀프 서비스(self-service) 방식입니다. 미스트랄은 워크스테이션, 서버 및 소규모 데이터센터 노드에서 모델을 미세 조정할 수 있는 소프트웨어 개발 키트(SDK)인 Mistral-Finetune을 출시했습니다.
미스트랄은 SDK의 GitHub 저장소 README를 통해, 이 SDK가 멀티 GPU 환경에 최적화되어 있지만, Mistral 7B와 같은 소형 모델을 미세 조정하는 경우에는 단일 Nvidia A100 또는 H100 GPU까지 스케일다운하여 사용할 수 있다고 밝혔습니다. 실제로 미스트랄에 따르면, OpenAI의 ChatGPT를 기반으로 한 140만 개의 대화 모음인 UltraChat과 같은 데이터셋을 Mistral-Finetune을 사용해 8대의 H100으로 미세 조정하는 데는 약 30분가량 소요됩니다.
한편, 더 관리형 솔루션(managed solution)을 선호하는 개발자 및 기업을 위해서는 회사 API를 통해 미스트랄의 신규 미세 조정 서비스가 제공됩니다. 미스트랄에 따르면, 현재는 Mistral Small과 앞서 언급된 Mistral 7B 두 모델과 호환되며, 향후 몇 주 내에 더 많은 모델에 대한 지원이 추가될 예정입니다.
마지막으로, 미스트랄은 현재 소수 고객에게만 제공되는 맞춤형 훈련 서비스를 처음 선보입니다. 이 서비스를 이용하면 기업은 자사 데이터를 활용하여 모든 Mistral 모델을 조직의 애플리케이션에 맞게 미세 조정할 수 있습니다. 회사는 공식 블로그 포스트를 통해 "이 접근 방식은 특정 도메인에 고도로 전문화되고 최적화된 모델을 만들 수 있도록 합니다"라고 설명했습니다.
참고로, 미스트랄은 2023년 9월 첫 생성형 모델을 공개한 이후 코드 생성 모델을 포함하여 여러 모델을 추가 출시하고 유료 API도 배포했습니다. 하지만 사용자 수나 매출 규모에 대해서는 공개하지 않았습니다.
동료 인그리드 룬덴(Ingrid Lunden)의 최근 보도에 따르면, 미스트랄은 DST, General Catalyst, Lightspeed Venture Partners 등 투자자들로부터 60억 달러의 기업 가치로 약 6억 달러를 유치하는 것을 목표로 하고 있으며, 생성형 AI 분야에서 거대하고 증가하는 경쟁에 직면하며 수익 성장에 집중하고 있는 것으로 보입니다.