최신 Google Gemma AI 모델, 이제 휴대폰에서 구동 가능

sw_reporter

구글의 개방형(open) AI 모델 제품군인 Gemma가 확장하고 있습니다.

Google I/O 2025

구글은 화요일, 휴대폰, 노트북, 태블릿 등 다양한 기기에서 "원활하게" 구동되도록 설계된 모델인 Gemma 3n을 공개했습니다. 구글에 따르면, Gemma 3n은 화요일부터 미리보기(preview)가 가능하며, 오디오, 텍스트, 이미지, 비디오 등 다양한 모드를 처리할 수 있습니다.

최근 몇 년 동안, 오프라인에서도 실행할 수 있고 클라우드 컴퓨팅 자원이 필요 없는 효율적인 모델들이 AI 커뮤니티의 큰 관심을 받고 있습니다. 이러한 모델들은 대규모 모델에 비해 사용 비용이 저렴할 뿐만 아니라, 데이터를 원격 데이터 센터로 전송할 필요가 없어 개인정보 보호 측면에서도 강점을 갖습니다.

I/O 기조연설에서 Gemma 제품 관리자 거스 마틴스(Gus Martins)는 Gemma 3n이 RAM 용량이 2GB 미만인 장치에서도 구동될 수 있다고 밝혔습니다. 그는 "Gemma 3n은 [특정 모델]과 동일한 아키텍처를 공유하며, 놀라운 성능을 발휘하도록 설계되었습니다"라고 덧붙였습니다.

Gemma 3n 외에도 구글은 'Health AI Developer Foundations program'을 통해 MedGemma를 출시합니다. 회사에 따르면, MedGemma는 건강 관련 텍스트 및 이미지를 분석하는 데 가장 강력한 오픈 모델입니다.

마틴스는 "MedGemma는 멀티모달(multimodal) 건강 텍스트 및 이미지 이해를 위한 오픈 모델 컬렉션입니다. MedGemma는 다양한 이미지 및 텍스트 애플리케이션에서 탁월하게 작동하기 때문에, 개발자들이 자체 건강 앱을 위해 모델을 맞춤 조정할 수 있습니다"라고 설명했습니다.

또한, 출시가 기대되는 모델로 SignGemma가 있습니다. 이는 수화 언어 신호를 구어체 텍스트로 번역하는 오픈 모델입니다. 구글은 SignGemma를 통해 개발자들이 청각 장애인 및 난청 사용자를 위한 새로운 앱과 통합 기능을 개발할 수 있게 될 것이라고 밝혔습니다.

마틴스는 "SignGemma는 수화 신호를 구어체 텍스트로 변환하도록 훈련된 새로운 모델군이지만, 미국 수화(ASL)와 영어에 가장 최적화되어 있습니다. 이는 역사상 가장 뛰어난 수화 이해 모델이며, 저희는 개발자들과 청각 장애인 및 난청 커뮤니티가 이 기반을 활용해 창조해 나갈 것을 기대합니다"라고 말했습니다.

한편, Gemma는 자체적인 비표준 라이선스 조건으로 인해 비판을 받아왔으며, 일부 개발자들은 이러한 조건 때문에 상업적 활용이 위험할 수 있다고 지적했습니다. 그럼에도 불구하고 개발자들이 Gemma 모델을 집계적으로 수천만 건 다운로드한 역사는 이 모델의 높은 잠재력을 입증하고 있습니다.

[출처:] https://techcrunch.com/2025/05/20/the-newest-google-gemma-ai-model-can-run-on-phones