
OpenAI의 에이전트 도구인 Operator가 조만간 공개될 가능성이 높습니다. ChatGPT의 코드베이스 변경 사항을 분석한 결과, Operator는 $200 Pro 구독 플랜 사용자에게 ‘조기 연구 미리보기(early research preview)’ 형태로 제공될 예정입니다.
이러한 변경 사항은 아직 대중에게 공개되지 않았지만, X 사용자 한 명이 ChatGPT의 클라이언트 측 코드에서 해당 업데이트를 포착했습니다. TechCrunch 또한 OpenAI 웹사이트에서 Operator 관련 참조가 확인되었다고 별도로 보도했습니다.
저희가 포착한 흥미로운 세 가지 세부 내용은 다음과 같습니다.
- Operator 관련 URL 참조: Operator 관련 참조가 여러 곳에 발견되었으며, 해당 URL은 현재 메인 chatgpt.com 웹 페이지로 리디렉션되는 것을 확인할 수 있습니다.
- 업그레이드 필요 팝업: Operator를 이용하기 위해 플랜 업그레이드를 요구하는 새로운 팝업창이 생성될 예정입니다. 이 팝업창에는 "Operator는 현재 Pro 사용자에게만 조기 연구 미리보기로 제공됩니다"라고 명시되어 있습니다.
- Pro 플랜 혜택 추가: Plus 및 Pro 플랜 목록 페이지에서 OpenAI는 Pro 플랜의 혜택 중 하나로 "Operator 연구 미리보기 액세스" 항목을 추가할 계획입니다.
TechCrunch와 Bloomberg는 이전에 OpenAI가 사용자를 대신하여 웹 브라우저에서 작업을 수행할 수 있는 범용 에이전트를 개발하고 있다고 보도한 바 있습니다.
이 내용이 다소 추상적으로 들릴 수 있지만, 사용자가 웹 브라우저에서 일상적으로 수행하는 모든 종류의 클릭 기반 작업들을 상상해 보십시오. 예를 들어, 링크드인에서 누군가를 팔로우하거나, Concur에 경비 항목을 추가하거나, Asana에서 담당자에게 작업을 할당하거나, Salesforce에서 잠재 고객의 상태를 변경하는 등의 작업입니다. 에이전트는 이러한 다단계 작업을 일련의 지침 세트(instruction set)를 기반으로 수행할 수 있습니다.
더 최근에는 The Information이 OpenAI가 이번 주 중으로 Operator를 출시할 수 있다고 보도했습니다. 오늘 확인된 변경 사항들을 종합해 볼 때, 대중 출시 준비가 완료된 것으로 보입니다.
참고로, Anthropic은 "컴퓨터 사용(Computer Use)" API와 마우스 및 키보드를 제어하는 로컬 도구를 활용하여 PC를 제어할 수 있는 AI 모델을 출시했습니다. 이 기능은 현재 개발자들을 대상으로 베타 기능으로 이용 가능합니다.
Operator의 경우, ChatGPT 웹사이트 내에서 작동할 것으로 예상됩니다. 즉, 사용자의 로컬 컴퓨터와 상호작용하기보다는, OpenAI 자체 서버에서 웹 브라우저를 구동하여 작업을 수행하는 방식일 가능성이 높습니다.
그럼에도 불구하고, 이는 OpenAI의 컴퓨터 상호작용 능력이 크게 진전하고 있음을 시사합니다. Operator는 회사의 근본적인 에이전트 프레임워크가 구현된 특정 샌드박스 환경입니다. OpenAI가 Operator를 구동하는 기술의 세부 사항에 대해 추가 정보를 공유할 수 있는지 지켜보는 것은 주목할 만한 부분입니다.