• 미스트랄, 아랍어 언어 및 문화 특화 지역 모델 공개

    article image

    거대 언어 모델(LLMs)의 다음 개척지는 생성형 AI 도구 붐의 핵심 기술 중 하나인 지리적 영역일 수 있다. 파리 기반의 AI 스타트업인 [회사 이름 생략됨]은 월요일, 미국 기반의 Anthropic이나 OpenAI 등과 경쟁하겠다는 야심 찬 목표 아래, 기존의 LLM과는 다소 차별화된 모델을 출시한다고 밝혔다.

    미스트랄 사바(Mistral Saba)라는 이름의 이 새로운 커스텀 트레이닝 모델은 아랍어권 국가라는 특정 지리적 영역을 겨냥해 설계되었다. 미스트랄 사바의 주요 목표는 아랍어 상호작용 분야에서 탁월한 성능을 발휘하는 것이다.

    미스트랄 사바는 매개변수(parameters) 240억 개를 가진 비교적 소형 모델이다. 참고로, 일반적으로 매개변수가 적을수록 지연 시간이 짧고 더 나은 성능을 보여주는 경향이 있다. 하지만 매개변수가 많을수록 더 지능적인 답변을 제공하는 경향이 있어, 성능과 매개변수 간의 상관관계가 항상 선형적이지는 않다.

    미스트랄 사바는 미스트랄의 범용 소형 모델인 Mistral Small 3과 비슷한 크기이다. 그러나 미스트랄 자체 테스트에 따르면, 미스트랄 사바가 아랍어 콘텐츠 처리 능력에서 Mistral Small 3보다 훨씬 뛰어난 성능을 보인다고 한다.

    흥미롭게도, 중동과 남아시아 간의 문화적 교류 덕분에, 미스트랄에 따르면 사바는 인도계 언어와도 매우 잘 작동하며, 특히 타밀어, 말라얄람어와 같은 남인도계 언어에서 강점을 보인다.

    이 신규 모델은 프랑스 AI 기업의 전략적 행보로, 중동 시장에 대한 깊이 있는 관심을 보여준다. 미스트랄은 이 모델이 해당 지역 고객들 사이에서 입지를 다지는 데 도움을 줄 것으로 기대한다고 밝혔다.

    article image

    미스트랄 사바는 기성품 모델(off-the-shelf model)로서, 아랍어로 더욱 자연스럽고 맥락에 맞는 대화형 지원이나 콘텐츠 생성에 즉시 사용될 수 있다. 또한, 회사는 이 모델을 활용하여 내부 사용 사례를 위한 파인튜닝 모델의 기반으로도 사용할 수 있다고 설명했다.

    지난주, 미스트랄은 AI 액션 서밋(AI Action Summit)을 통해 비즈니스에 진지하게 임하고 있음을 입증했다. 이 회사는 이미 국제 투자자들로부터 거액의 자금을 유치했지만, 그 외국인 백커 중 다수는 Lightspeed Venture Partners, Andreessen Horowitz, Salesforce Ventures 등 미국에 기반을 둔 투자자들이었다.

    지정학적 환경의 변화에 따라, 미스트랄은 다가오는 자금 조달 라운드에서 중동 지역 투자자들을 잠재적으로 영입할 수 있다. 이는 기술적 차원에서 AI 경쟁력을 유지하기 위해 자금을 확보하는 동시에, 미국 및 중국 AI 기업에 대한 국제적인 대안으로 입지를 다지려는 전략이다. 따라서 최신 모델인 사바는 이러한 잠재적 자금 조달 노력에 기여할 수 있다.

    미스트랄 사바는 미스트랄의 API를 통해 접근 가능하며, 온프레미스(on-premise) 배포도 가능하다. 이는 에너지, 금융, 헬스케어와 같이 민감한 산업 분야의 기업들에게 강력한 판매 포인트가 될 수 있다.

    유럽 기반 회사라는 특성상, 미스트랄은 초기 오픈 웨이트 모델인 Mistral 7B 출시 이후부터 다국어 지원의 중요성을 지속적으로 강조해왔다. 사바의 출시는 이러한 기업의 포지셔닝을 이어가는 것이다. 미스트랄은 나아가 향후 다른 지역 언어에도 관심을 확장할 것이라고 밝혔다.

    [출처:] https://techcrunch.com/2025/02/17/mistral-releases-regional-model-focused-on-arabic-language-and-culture