JetBrains, '오픈' AI 코딩 모델 Mellum 출시

sw_reporter

인기 앱 개발 도구군을 제공하는 회사인 JetBrains가 코딩을 위한 첫 '오픈(open)' AI 모델을 출시했습니다.

젯브레인은 수요일, 지난해 여러 소프트웨어 개발 스위트에 도입했던 코드 생성 모델인 Mellum을 AI 개발 플랫폼 Hugging Face에 오픈소스로 공개했습니다. 4조 개 이상의 토큰으로 훈련된 Mellum은 40억 개의 파라미터를 가지고 있으며, 특히 코드 완성(즉, 주변 컨텍스트를 기반으로 코드 스니펫을 완성하는 기능)에 최적화된 모델입니다.

파라미터는 모델의 문제 해결 능력과 대략적으로 비례하며, 토큰은 모델이 처리하는 원시 데이터 단위입니다. 참고로 백만 개 토큰은 약 3만 줄의 코드에 해당합니다.

젯브레인은 기술 보고서에서 "Mellum은 전문 개발자 도구 통합(예: IDE 내 지능형 코드 제안), AI 기반 코딩 보조 도구, 코드 이해 및 생성을 위한 연구 등 다양한 목적에 설계되었으며, 교육용 애플리케이션 및 미세 조정(fine-tuning) 실험에도 적합합니다"라고 설명했습니다.

젯브레인에 따르면, Apache 2.0 라이선스가 적용된 Mellum은 GitHub의 공개 라이선스 코드와 영어 위키피디아 기사를 포함한 다양한 데이터셋 컬렉션을 기반으로 훈련되었습니다. 이 훈련 과정은 256개의 H200 Nvidia GPU 클러스터를 사용하여 약 20일 동안 진행되었습니다.

Mellum은 즉시 사용하기 위해서는 사전 작업이 필요합니다. 기본 모델은 '바로 사용(out of box)' 할 수 없으며, 반드시 미세 조정 단계를 거쳐야 합니다. 젯브레인이 Python용으로 미세 조정된 몇몇 Mellum 모델을 제공하고 있지만, 회사는 이 모델들이 "잠재적 역량을 추정하는 목적"일 뿐 "실제 프로덕션 환경에 배포하기 위한 것"이 아니라고 경고했습니다.

AI가 생성한 코드가 소프트웨어 구축 방식을 변화시키는 것은 분명하지만, 새로운 보안 문제 또한 야기하고 있습니다. 개발자 보안 플랫폼 Snyk가 2023년 말에 실시한 설문조사에 따르면, 조직의 50% 이상이 AI가 생성한 코드와 관련된 보안 문제를 때때로 또는 자주 겪는다고 합니다.

실제로 젯브레인은 Mellum이 "공개 코드베이스에 내재된 편향을 반영할 수 있다"(예: 오픈 소스 레포지토리와 유사한 스타일의 코드를 생성하는 경우)는 점과, 그 코드 제안이 반드시 "안전하거나 취약점으로부터 자유롭지 않을 수 있다"는 점을 지적했습니다.

젯브레인은 블로그 게시물을 통해 "이것은 시작에 불과합니다. 저희는 일반성을 추구하는 것이 아니라 초점을 맞추고 있습니다. 만약 Mellum이 단 하나의 의미 있는 실험, 기여, 또는 협업이라도 촉발할 수 있다면, 그것만으로도 큰 성공이라고 간주할 것입니다"라고 밝혔습니다.

[출처:] https://techcrunch.com/2025/04/30/jetbrains-releases-mellum-an-open-ai-coding-model