• 메타, 더 효율적인 새로운 Llama 모델 공개

    article image

    메타는 자사의 생성형 AI 모델 제품군에 새로운 모델인 Llama 3.3 70B를 발표했다.

    메타의 생성형 AI 부문 부사장인 아흐마드 알-달레(Ahmad Al-Dahle)는 X 게시물을 통해 텍스트 전용 모델인 Llama 3.3 70B가 메타의 가장 큰 모델인 Llama 3.1 405B와 동등한 성능을 훨씬 낮은 비용으로 제공한다고 밝혔다.

    알-달레는 "최신 파인튜닝(post-training) 기술 발전을 활용함으로써, 이 모델은 핵심 성능을 상당히 낮은 비용으로 개선했습니다"라고 언급했다.

    알-달레는 Llama 3.3 70B가 MMLU(언어 이해 능력을 평가하는 벤치마크)를 포함한 여러 산업 벤치마크에서 Google의 Gemini 1.5 Pro, OpenAI의 GPT-4o, 그리고 Amazon이 새롭게 출시한 Nova Pro보다 우수한 성능을 보이는 차트를 공개했다. 한편, 메타 대변인은 이메일을 통해 해당 모델이 수학, 일반 지식, 지침 준수, 애플리케이션 사용 등의 영역에서 성능 개선을 보여줄 것으로 기대한다고 전했다.

    Llama 3.3을 소개합니다. 당사의 405B 모델 성능을 제공하면서도 구동이 더 쉽고 비용 효율적인 새로운 70B 모델입니다. 온라인 선호도 최적화(online preference optimization)를 포함한 최신 파인튜닝 기술 발전을 활용하여, 이 모델은 핵심 성능을...

    — Ahmad Al-Dahle (@Ahmad_Al_Dahle)

    2024년 12월 6일

    AI 개발 플랫폼 허깅페이스(Hugging Face)와 공식 Llama 웹사이트 등 여러 출처를 통해 다운로드가 가능한 Llama 3.3 70B는, 메타가 광범위한 애플리케이션에 사용하고 상업화할 수 있는 '오픈' 모델을 통해 AI 분야의 주도권을 확보하려는 최신 전략의 일환이다.

    메타의 약관상 특정 개발자가 Llama 모델을 사용하는 데 제약이 따르며, 월간 사용자 수가 7억 명을 초과하는 플랫폼은 특별 라이선스를 요청해야 한다. 하지만 많은 전문가들은 Llama 모델이 엄밀한 의미의 '완전 오픈'은 아니더라도 실제 사용상 큰 문제가 없다고 지적한다. 실제로 메타에 따르면 Llama는 6억 5천만 건 이상의 다운로드를 기록하며 폭발적인 사용자 기반을 입증했다.

    메타는 내부적으로도 Llama를 활용해 왔다. 회사의 AI 비서인 Meta AI는 Llama 모델만을 전적으로 구동하며 현재 약 6억 명의 월간 활성 사용자 수를 기록하고 있다고 메타 CEO 마크 저커버그는 밝혔다. 저커버그는 Meta AI가 세계에서 가장 많이 사용되는 AI 비서가 될 궤도에 있다고 자신감을 내비쳤다.

    메타에게 Llama의 개방성은 축복이자 도전 과제였다. 지난 11월에는 한 보고서가 중국 군사 연구원들이 Llama 모델을 이용해 방어 챗봇을 개발했다고 주장하며 논란을 일으켰고, 이에 메타는 자사 Llama 모델을 미국 국방 계약업체에 제공하며 대응했다.

    한편, 메타는 AI 규제 프레임워크를 정립한 EU 법인 AI Act 준수 여부에 대한 우려를 표명하며, 이 법의 시행이 업계에 지나치게 많은 제약을 가할 수 있다고 주장해왔다.

    이러한 배경 속에서, 메타는 데이터를 기반으로 한 AI 모델의 안정적 활용을 강조하고 있다.

    (※ 요약: 기술적인 내용이므로, 'AI 모델의 안정적 활용'에 대한 간결한 내용을 추가하거나, 문맥상 자연스러운 연결고리를 만들어 주는 것이 좋습니다. 여기서는 논문/기사처럼 읽히도록 문장 흐름을 다듬었습니다.)

    최종 검토 및 다듬기 (추천)

    이 경우, "AI 모델의 안정적 활용" 같은 요약 문장보다는, 각 섹션의 전환을 매끄럽게 하는 것이 좋습니다.

    (예시): ...이러한 배경 속에서, 메타는 자사의 통제 하에 안정적으로 AI 모델을 구축하고 활용하는 방안에 더욱 집중하며 업계를 주도하고 있다.

    [출처:] https://techcrunch.com/2024/12/06/meta-unveils-a-new-more-efficient-llama-model