• 미스트랄, 자사 최초 멀티모달 모델 Pixtral 12B 출시

    프랑스의 AI 스타트업이 텍스트 처리 기능뿐 아니라 이미지를 처리할 수 있는 최초의 모델을 출시했습니다.

    Pixtral 12B라는 이름을 가진 이 모델은 120억 개의 파라미터를 보유했으며 크기는 약 24GB에 달합니다. 파라미터 수는 모델의 문제 해결 능력과 근사적으로 비례하며, 일반적으로 파라미터가 많을수록 성능이 우수한 경향이 있습니다.

    Mistral의 텍스트 모델인 Nemo 12B를 기반으로 구축된 Pixtral 12B는 URL 또는 이진-텍스트 인코딩 방식인 base64를 이용해 인코딩된 이미지를 통해 임의의 개수와 크기를 가진 이미지에 대한 질문에 답변할 수 있습니다. Anthropic의 Claude 계열이나 OpenAI의 GPT-4o와 같은 기존 멀티모달 모델들과 유사하게, Pixtral 12B 역시 최소한 이론적으로는 이미지 캡셔닝이나 사진 속 객체 개수 세기 등의 작업을 수행할 수 있을 것으로 기대됩니다.

    GitHub와 AI 및 머신러닝 개발 플랫폼에서 토렌트 링크를 통해 이용 가능한 Pixtral 12B는 Apache 2.0 라이선스 하에 제한 없이 다운로드, 미세 조정 및 활용이 가능합니다. (Mistral 측 대변인은 이메일을 통해 Pixtral 12B에 Apache 2.0 라이선스가 적용되었음을 확인했습니다.)

    아쉽게도 필자는 기사 작성 시점에는 작동하는 웹 데모가 없어 Pixtral 12B를 직접 테스트할 수는 없었습니다. 다만, Mistral 개발자 관계 책임자인 Sophia Yang이 X(구 트위터)를 통해 Pixtral 12B가 곧 Mistral의 챗봇 및 API 서비스 플랫폼인 Le Chat과 Le Plateforme에서 테스트용으로 제공될 예정이라고 밝혔습니다.

    Mistral이 Pixtral 12B 개발에 사용한 특정 이미지 데이터에 대해서는 아직 알려진 바가 없습니다.

    Mistral의 다른 모델을 포함하여 대부분의 생성형 AI 모델은 종종 웹상의 방대한 양의 공개 데이터를 기반으로 훈련되는데, 이러한 데이터는 저작권이 걸려있는 경우가 많습니다. 일부 모델 공급업체는 '공정 이용(fair use)' 권리가 모든 공개 데이터 수집을 허용한다고 주장하지만, 많은 저작권 보유자들은 이에 동의하지 않으며 OpenAI나 Midjourney 같은 대형 공급업체를 상대로 소송을 제기하며 이 관행의 중단을 요구하고 있습니다.

    Pixtral 12B의 공개는 Mistral이 General Catalyst가 주도한 6억 4,500만 달러 규모의 펀딩 라운드에 성공적으로 참여하며 회사 기업 가치를 60억 달러로 평가받은 직후 이루어졌습니다. 설립된 지 1년이 채 되지 않은 Mistral은 마이크로소프트가 소수 지분을 보유하고 있는 상태로, AI 업계에서는 종종 '유럽의 OpenAI'로 평가받고 있습니다. 이 젊은 회사는 지금까지 무료 '오픈' 모델을 출시하고, 해당 모델의 관리형 버전에 비용을 부과하며, 기업 고객에게 컨설팅 서비스를 제공하는 전략을 펼쳐왔습니다.

    태평양 시간 오전 9월 11일 8:11분 업데이트: Pixtral 12B가 상업적 사용에 특정 제한이 따르는 Mistral의 표준 개발 라이선스가 아닌, Apache 2.0 라이선스로 제공된다는 점을 명확히 했습니다.

    [출처:] https://techcrunch.com/2024/09/11/mistral-releases-pixtral-its-first-multimodal-model