OpenAI, Operator 에이전트에 탑재된(구동하는) AI 모델 업그레이드

sw_reporter

OpenAI는 사용자의 요청을 처리하기 위해 웹을 자율적으로 탐색하고 클라우드 기반 가상 머신(VM) 내의 특정 소프트웨어를 사용할 수 있는 AI 에이전트인 Operator의 구동 AI 모델을 업데이트하고 있습니다.

조만간 Operator는 OpenAI의 '추론(reasoning)' 모델인 o 시리즈 중 하나인 o3를 기반으로 작동하게 됩니다. 기존에는 Operator가 GPT-4o의 사용자 지정 버전을 사용했습니다.

벤치마크 결과에 따르면, o3는 특히 수학 및 추론 관련 작업에서 훨씬 진보한 모델입니다.

OpenAI는 블로그 게시물을 통해 "Operator의 기존 GPT-4o 기반 모델을 OpenAI o3 기반 버전으로 교체한다"고 밝혔습니다. 다만, "Operator의 API 버전은 4o를 기반으로 유지될 것"이라고 덧붙였습니다.

Operator는 최근 몇 달 동안 AI 기업들이 출시한 다수의 에이전트 도구 중 하나입니다. 기업들은 감독 없이도 업무를 안정적으로 처리할 수 있는 고도로 정교한 에이전트를 개발하는 데 경쟁하고 있습니다.

한편, 구글은 Gemini API를 통해 웹 탐색 및 사용자 대리 작업 수행이 가능한 '컴퓨터 사용 에이전트'를 제공하며, 사용자 친화적인 별도 서비스도 출시했습니다. Anthropic의 모델들 역시 파일을 열거나 웹 페이지를 탐색하는 등 컴퓨터 작업을 수행할 수 있습니다.

OpenAI에 따르면, 새로운 Operator 모델인 o3 Operator는 "컴퓨터 사용에 대한 추가 안전 데이터로 미세 조정되었으며," 여기에는 "모델이 확인(confirmation) 및 거부(refusal)에 대한 결정 경계를 학습할 수 있도록 설계된" 데이터 세트가 포함되었습니다.

OpenAI는 o3 Operator가 특정 안전 평가에서 보여준 성능을 담은 기술 보고서를 공개했습니다. 이 보고서에 따르면, o3 Operator는 GPT-4o Operator 모델과 비교했을 때, "불법적인" 활동을 수행하는 것을 거부하거나 민감한 개인 데이터를 검색할 가능성이 더 낮고, 프롬프트 주입(prompt injection)이라는 AI 공격 유형에 대한 취약성도 낮습니다.

OpenAI는 블로그 게시물에서 "o3 Operator는 4o 버전의 Operator에 적용했던 것과 동일한 다층적 안전 접근 방식을 사용합니다. o3 Operator는 o3가 가진 코딩 역량을 계승하지만, 코딩 환경이나 터미널에 대한 네이티브 접근 권한은 없습니다."라고 명시했습니다.

[출처:] https://techcrunch.com/2025/05/23/openai-upgrades-the-ai-model-powering-its-operator-agent