• 코히어, 오픈 다국어 모델군 출시

    article image

    엔터프라이즈 AI 기업 코히어(Cohere)가 진행 중인 인도 AI 서밋을 계기로 새로운 다국어 모델군인 타이니 아야(Tiny Aya)를 출시했습니다. 이 모델군은 오픈 웨이트(open-weight) 방식이어서 기본 코드가 누구나 사용하고 수정할 수 있도록 공개되며, 70개 이상의 언어를 지원하고 인터넷 연결 없이도 노트북 같은 일상적인 기기에서 구동할 수 있다는 특징을 가집니다.

    코히어의 연구 부문인 코히어 랩스(Cohere Labs)가 출시한 이 모델은 벵골어, 힌디어, 펀자브어, 우르두어, 구자라트어, 타밀어, 텔루구어, 마라티어 등 남아시아 언어를 지원합니다.

    기반 모델은 크기와 복잡성을 측정하는 단위인 33억 5천만 개의 매개변수(parameters)를 포함하고 있습니다. 코히어는 광범위한 언어 지원이 필요한 애플리케이션을 위해 사용자 명령을 더 잘 따르도록 미세 조정된 버전인 TinyAya-Global도 함께 출시했습니다. 또한, 지역별 특화 변형 모델들이 이 모델군을 완성합니다. 아프리카 언어를 위한 TinyAya-Earth, 남아시아 언어를 위한 TinyAya-Fire, 그리고 아시아 태평양, 서아시아 및 유럽을 위한 TinyAya-Water가 그 계열에 속합니다.

    article image

    회사는 성명을 통해 "이러한 접근 방식은 각 모델이 더 강력한 언어적 기반과 문화적 뉘앙스를 갖추도록 개발할 수 있게 하여, 해당 커뮤니티에 더욱 자연스럽고 신뢰도 높은 시스템을 구축합니다. 동시에 모든 Tiny Aya 모델은 폭넓은 다국어 지원을 유지하여, 추가적인 적응 및 연구를 위한 유연한 출발점을 제공합니다."라고 밝혔습니다.

    코히어는 이 모델들이 비교적 적은 컴퓨팅 자원을 사용하여 단일 클러스터의 64개 H100 GPU(엔비디아의 고성능 칩)에서 훈련되었다며, 모국어 사용자들을 위한 앱을 개발하는 연구원과 개발자들에게 이상적이라고 설명했습니다. 이 모델들은 기기 자체에서 직접 실행 가능하므로, 개발자들은 이를 활용해 오프라인 번역 기능을 구현할 수 있습니다. 또한, 회사는 온디바이스 사용에 맞춰 자체 기반 소프트웨어를 구축하여, 대부분의 유사 모델보다 낮은 컴퓨팅 파워를 요구한다고 덧붙였습니다.

    article image

    인도처럼 언어적 다양성이 높은 국가의 경우, 이러한 오프라인 친화적 기능은 지속적인 인터넷 접속이 필요 없이 다양한 애플리케이션과 사용 사례를 개척할 수 있게 합니다.

    이 모델들은 AI 모델 공유 및 테스트의 인기 플랫폼인 허깅페이스(HuggingFace)와 코히어 플랫폼(Cohere Platform)에서 이용 가능합니다. 개발자들은 로컬 배포를 위해 허깅페이스, 캐글(Kaggle), 올라마(Ollama) 등에서 다운로드할 수 있습니다. 또한, 회사는 허깅페이스에 훈련 및 평가 데이터셋을 공개하고 있으며, 훈련 방법론을 상세히 담은 기술 보고서도 공개할 계획입니다.

    한편, 이 스타트업의 CEO인 에이다나 고메즈(Aidan Gomez)는 지난해 회사가 "곧" 상장할 계획이라고 밝힌 바 있습니다. CNBC에 따르면, 이 회사는 2025년 연간 반복 매출(ARR)로 2억 4천만 달러를 기록하며 성공적으로 한 해를 마무리했으며, 연중 내내 분기별로 50%의 성장률을 달성했습니다.

    [출처:] https://techcrunch.com/2026/02/17/cohere-launches-a-family-of-open-multilingual-models