OpenAI, 안전 보고서 없이 GPT-4.1 배포

sw_reporter

월요일, OpenAI는 새로운 AI 모델군인 GPT-4.1을 출시했습니다. 회사는 이 모델이 특히 프로그래밍 벤치마크 등 특정 테스트에서 기존 모델 일부를 능가했다고 밝혔습니다. 그러나 GPT-4.1은 OpenAI 모델 출시 시 통상적으로 함께 제공되는 '모델 카드' 또는 '시스템 카드'라 불리는 안전 보고서와 함께 출하되지 않았습니다.

화요일 오전까지 OpenAI는 GPT-4.1에 대한 안전 보고서를 공개하지 않았으며, 발표할 계획도 없는 것으로 보입니다. OpenAI 대변인 샤오키 암도(Shaokyi Amdo)는 TechCrunch에 전한 성명에서 "GPT-4.1은 프론티어 모델이 아니기 때문에 별도의 시스템 카드는 발표되지 않을 것"이라고 말했습니다.

AI 연구소들이 자체적으로나 제3자 파트너와 함께 수행한 다양한 테스트 유형을 보여주는 안전 보고서를 발표하는 것은 일반적인 관례입니다. 이러한 보고서에는 때때로 모델이 인간을 오도할 가능성이 있거나, 혹은 위험할 정도로 설득력이 있다는 등의 부정적인 정보가 포함되기도 합니다. 전반적으로 AI 커뮤니티는 이러한 보고서들을 AI 연구소들이 독립 연구와 적대적 테스트(red teaming)를 지원하기 위한 선의의 노력으로 인식합니다.

하지만 지난 몇 달 동안 주요 AI 연구소들은 안전 보고 기준을 완화하는 추세를 보여 안전 연구자들 사이에서 비판을 받고 있습니다. 일부는 안전 보고서 공개를 지연하는 반면, 다른 곳은 통상적인 상세함이 부족한 보고서를 게재하기도 했습니다.

OpenAI의 최근 행보 또한 예외적이지 않습니다. 지난해 12월, 이 회사는 실제 서비스에 배포한 버전과 다른 모델의 벤치마크 결과를 담은 안전 보고서를 발표하여 비판을 받기도 했습니다. 지난달에는 OpenAI가 모델 'deep research'를 출시한 이후, 해당 모델의 시스템 카드를 발표하기 몇 주가 지난 시점에 모델을 출시하는 경향을 보였습니다.

전 OpenAI 안전 연구원 출신인 스티븐 애들러(Steven Adler)는 TechCrunch에 안전 보고서는 어떠한 법률이나 규정으로도 의무화된 것이 아니며 자발적이라고 지적했습니다. 그럼에도 불구하고 OpenAI는 자사 모델의 투명성을 높이기 위해 정부에 여러 차례 약속을 했습니다. 2023년 영국 AI 안전 정상회의를 앞두고 OpenAI는 블로그 게시물에서 시스템 카드를 책임성 확보를 위한 "핵심 부분"이라고 언급했으며, 2025년 파리 AI 행동 정상회의를 앞두고도 시스템 카드가 모델의 위험성에 대한 귀중한 통찰력을 제공한다고 밝힌 바 있습니다. 애들러는 TechCrunch에 보낸 이메일에서 "시스템 카드는 AI 업계의 투명성 확보와 안전 테스트 수행 내용을 설명하는 주요 도구입니다. 오늘날의 투명성 규범과 약속은 궁극적으로 자발적인 것이므로, 특정 모델에 대해 시스템 카드를 발표할지 여부는 각 AI 회사에 달린 문제입니다"라고 말했습니다.

GPT-4.1은 현재와 전직 직원들이 OpenAI의 안전 관행에 의문을 제기하고 있는 시기에 시스템 카드 없이 출하되고 있습니다. 지난주 애들러와 다른 전 OpenAI 직원 11명은 OpenAI를 상대로 제기된 일론 머스크(Elon Musk) 사건 관련 아미커스 브리프(amicus brief)를 제출하며, 영리 목적으로 운영되는 OpenAI가 안전 작업에서 비용을 절감할 수 있다고 주장했습니다. The Financial Times는 최근 경쟁 압박으로 인해 ChatGPT를 개발하는 회사가 안전 테스터에게 할당하는 시간과 자원을 대폭 줄인 것으로 보도했습니다.

GPT-4.1이 OpenAI 라인업 중 가장 높은 성능을 가진 모델은 아니지만, 효율성 및 지연 시간(latency) 부문에서는 상당한 성능 향상을 보입니다. Secure AI Project의 공동 창립자이자 정책 분석가인 토마스 우드사이드(Thomas Woodside)는 TechCrunch와의 인터뷰에서 이러한 성능 개선이 안전 보고서의 중요성을 더욱 높인다고 말했습니다. 그는 모델이 더 정교할수록 잠재적 위험도 함께 커진다고 지적했습니다.

많은 AI 연구소들은 안전 보고 의무화 요건을 법제화하려는 시도들을 반대하거나 좌절시켜 왔습니다. 예를 들어, OpenAI는 많은 AI 개발자들이 공개하는 모델에 대해 안전 평가를 감사하고 발표하도록 요구하는 캘리포니아의 SB 1047에 반대 입장을 표명했습니다.

[출처:] https://techcrunch.com/2025/04/15/openai-ships-gpt-4-1-without-a-safety-report