구글, Gemini 모델을 AI 안전 보고서보다 먼저 배포

sw_reporter

OpenAI의 ChatGPT 출시로 인해 구글이 허를 찔린 지 2년이 넘는 시간이 지났음에도, 구글은 추격 속도를 급격히 높였다.

지난 3월 말, 구글은 코딩 및 수학 능력을 측정하는 여러 벤치마크에서 업계를 선도하는 AI 추론 모델인 Gemini 2.5 Pro를 출시했다. 이 출시는 구글이 앞서 당시 최고 수준(state-of-the-art)이었던 또 다른 모델인 Gemini 2.0 Flash를 선보인 지 불과 3개월 만에 이루어진 것이다.

구글의 Gemini 총괄 디렉터이자 제품 책임자인 Tulsee Doshi는 TechCrunch와의 인터뷰에서, 모델 출시 간격이 짧아지는 현상이 빠르게 진화하는 AI 산업을 따라잡기 위한 회사의 체계적인 노력의 일환이라고 밝혔다.

Doshi는 "우리는 여전히 이 모델들을 어떤 방식으로 배포해야 할지, 그리고 피드백을 받을 수 있는 가장 적절한 방법이 무엇인지 파악하는 과정에 있다"고 언급했다.

하지만 이러한 가속화된 출시 주기는 비용을 수반하는 듯하다. 구글은 Gemini 2.5 Pro와 Gemini 2.0 Flash를 포함한 최신 모델들에 대한 안전 보고서를 아직 공개하지 않아, 회사가 투명성보다 속도를 우선시하고 있다는 우려를 낳고 있다.

오늘날 OpenAI, Anthropic, Meta와 같은 선도적인 AI 연구소들 사이에서는 새로운 모델을 출시할 때마다 안전 테스트, 성능 평가, 그리고 사용 사례를 보고하는 것이 일반적이다. 이러한 보고서는 때때로 "시스템 카드(system cards)" 또는 "모델 카드(model cards)"라고 불리며, 이는 몇 년 전 업계와 학계 연구원들에 의해 제안된 방식이다. 실제로 구글은 2019년 논문을 통해 모델 카드를 제안한 최초의 기업 중 하나였으며, 이를 "머신러닝 분야에서 책임감 있고 투명하며 설명 가능한 관행을 위한 접근 방식"이라고 규정했었다.

Doshi는 TechCrunch에게 구글이 Gemini 2.5 Pro의 모델 카드를 발행하지 않은 이유는 해당 모델을 "실험적(experimental)" 버전으로 간주하기 때문이라고 설명했다. 그녀에 따르면, 이러한 실험적 배포의 목적은 AI 모델을 제한적으로 공개하여 피드백을 받고, 상업적 출시 이전에 모델을 반복적으로 개선하는 것이다.

Doshi에 따르면, 구글은 Gemini 2.5 Pro가 일반적으로 이용 가능해지면 모델 카드를 발행할 계획이며, 이미 안전 테스트와 적대적 레드팀(adversarial red teaming) 검증을 완료했다고 덧붙였다.

후속 메시지에서, 구글 대변인은 TechCrunch에 안전이 회사에 "최우선 과제"임을 강조하며, 향후 Gemini 2.0 Flash를 포함한 AI 모델들과 관련하여 더 많은 문서를 공개할 계획이라고 전했다. 현재 일반에 공개된 Gemini 2.0 Flash 역시 모델 카드가 부재하다. 구글이 가장 최근에 공개한 모델 카드는 1년도 더 전에 출시된 Gemini 1.5 Pro용이었다.

시스템 카드와 모델 카드는 기업들이 자사의 AI에 대해 항상 광범위하게 공개하지 않는 유용하면서도 때로는 부정적인 정보를 제공한다. 예를 들어, OpenAI가 자사 o1 추론 모델에 대해 공개한 시스템 카드는 해당 모델이 인간을 상대로 "계획을 꾸미는(scheme)" 경향이 있으며 비밀리에 자체 목표를 추구한다는 사실을 드러냈다.

대체로 AI 커뮤니티는 이러한 보고서들을 독립적인 연구와 안전 평가를 뒷받침하는 성실한 노력으로 받아들이고 있지만, 최근 몇 년 동안 이 보고서들의 중요성은 더욱 커졌다. 앞서 언급했듯이, 구글은 2023년 미국 정부에 모든 "중요한(significant)" 공용 AI 모델 출시물에 대해 "범위 내에서(within scope)" 안전 보고서를 공개하겠다고 약속한 바 있다. 이 회사는 다른 정부들에도 유사한 약속을 하며 "대중적인 투명성을 제공"하겠다고 공언했다.

미국 연방 및 주 차원에서도 AI 모델 개발자를 위한 안전 보고 표준을 마련하려는 규제적 노력이 있었다. 하지만 이러한 노력들은 제한적인 수용과 성공에 그쳤다. 가장 주목할 만한 시도 중 하나는 업계가 강력히 반대했던 캘리포니아 법안 SB 1047이었다. 또한 입법자들은 미국의 AI 표준 설정 기구인 미국 AI 안전 연구소(U.S. AI Safety Institute)가 모델 출시 지침을 수립할 수 있도록 하는 법안도 발의했다. 그러나 안전 연구소는 현재 트럼프 행정부 하에서 존폐 위협에 직면해 있다.

종합적으로 볼 때, 구글은 모델 테스트에 대한 보고 약속 일부를 지키지 않으면서도 그 어느 때보다 빠르게 모델을 출시하고 있다. 많은 전문가들은, 특히 이러한 모델들의 역량이 점점 더 뛰어나고 정교해짐에 따라, 이것이 좋지 않은 전례를 남긴다고 비판하고 있다.

[출처:] https://techcrunch.com/2025/04/03/google-is-shipping-gemini-models-faster-than-its-ai-safety-reports