미스트랄의 Large 2, Meta와 OpenAI의 최신 모델에 대한 대응작으로 주목

sw_reporter

최전선 AI 모델 시장은 경쟁이 매우 치열합니다. Mistral은 수요일에 새로운 플래그십 모델인 Large 2를 출시했으며, 이는 코드 생성, 수학, 추론 능력을 포함해 OpenAI의 최신 최고 수준 모델들과 견줄 만하다고 주장했습니다.

Mistral Large 2의 발표는 Meta가 최신 오픈 소스 모델인 Llama 3.1 405B를 공개한 지 불과 하루 만에 이루어졌습니다. Mistral에 따르면 Large 2는 오픈 모델의 성능과 비용 기준을 높이며, 이를 입증하는 여러 벤치마크를 제시했습니다.

Large 2는 코드 생성 및 수학 성능 부문에서 Llama 3.1 405B를 능가하는 것으로 나타났으며, 특히 파라미터 수가 1,230억 개에 불과해 Llama보다 3분의 1 수준에 그칩니다.

Mistral은 보도 자료를 통해 Large 2의 핵심 훈련 목표 중 하나가 모델의 환각(hallucination) 현상을 최소화하는 것이었다고 밝혔습니다. 이 회사는 Large 2가 자신이 모르는 것을 지어내기보다, 응답할 때 더욱 신중함을 기하도록 훈련되었다고 설명했습니다.

이 파리 기반 AI 스타트업은 최근 일반 촉매(General Catalyst)가 주도한 시리즈 B 펀딩 라운드에서 60억 달러의 기업 가치를 인정받아 6억 4천만 달러를 유치했습니다. Mistral은 AI 분야의 비교적 신생 기업임에도 불구하고, 최첨단 AI 모델을 빠르게 시장에 선보이고 있습니다.

다만, Mistral의 모델은 대부분의 모델과 마찬가지로 전통적인 의미의 '오픈 소스'는 아니라는 점에 유의해야 합니다. 해당 모델을 상업적으로 사용하려면 유료 라이선스가 필요합니다. 또한, GPT-4o와 같은 모델에 비해서는 개방적이지만, 이처럼 거대한 규모의 모델을 실제로 구현할 전문 지식과 인프라를 갖춘 곳은 전 세계적으로 매우 드뭅니다. (특히 Llama의 4,050억 개 파라미터는 더욱 그렇습니다.)

Mistral Large 2와 어제 Meta가 공개한 Llama 3.1에서 공통적으로 부족한 기능은 멀티모달(multimodal) 기능입니다. OpenAI는 이미지와 텍스트를 동시에 처리할 수 있는 멀티모달 AI 시스템 분야에서 경쟁사 대비 압도적인 우위를 점하고 있으며, 이는 많은 스타트업들이 핵심적으로 구축하려는 기능입니다.

Large 2는 128,000 토큰의 컨텍스트 윈도우를 제공하여, 단일 프롬프트로 방대한 양의 데이터를 처리할 수 있습니다 (128,000 토큰은 약 300페이지 분량의 책에 해당). 또한, Mistral의 새로운 모델은 향상된 다국어 지원을 갖추고 있습니다. Large 2는 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어, 한국어를 이해하며 80개 코딩 언어를 지원합니다. 특히, Mistral은 Large 2가 기존 선도 AI 모델들이 보여주는 장황한 답변 경향보다 더욱 간결한 응답을 생성한다고 강조했습니다.

Mistral Large 2는 Google Vertex AI, Amazon Bedrock, Azure AI Studio, IBM watsonx.ai 등에서 사용할 수 있습니다. 또한 Mistral의 La Plateforme에서는 "mistral-large-2407"이라는 이름으로 사용 가능하며, 해당 스타트업의 ChatGPT 경쟁 제품인 Le Chat에서 무료로 테스트해 볼 수 있습니다.

[출처:] https://techcrunch.com/2024/07/24/mistral-releases-large-2-meta-openai-ai-models