• 아마존, 웹 브라우저를 제어하는 AI 에이전트 '노바 액트' 공개

    article image

    아마존은 월요일, 웹 브라우저를 제어하고 간단한 작업들을 독립적으로 수행할 수 있는 범용 AI 에이전트인 Nova Act를 공개했습니다. 이 새로운 에이전트 AI 모델과 함께, 아마존은 개발자들이 Nova Act를 활용하여 에이전트 프로토타입을 구축할 수 있도록 지원하는 툴킷인 Nova Act SDK도 출시합니다.

    아마존이 최근 개설한 샌프란시스코 소재 AGI 연구소(AGI lab)에서 개발된 Nova Act는 아마존의 인기 음성 비서인 생성형 AI 기반의 개선판 차세대 비서인 'Alexa+'의 핵심 기능을 구동하는 데도 사용될 예정입니다. 다만, 현재 공개된 버전의 Nova Act는 아직 완성도가 높지 않아, 아마존은 이를 '연구 프리뷰(research preview)'로 부르고 있습니다.

    개발자들은 nova.amazon.com이라는 새로운 웹사이트에서 Nova Act 툴킷에 접근할 수 있으며, 이 사이트는 아마존의 다양한 Nova 기반 모델을 선보이는 쇼케이스 역할도 겸합니다.

    Nova Act는 아마존이 자체적인 범용 AI 에이전트 기술을 바탕으로 OpenAI의 Operator와 Anthropic의 Computer Use 같은 경쟁 모델에 맞서 시장에 진출하려는 시도로 해석됩니다. 여러 주요 기술 기업들은 사용자를 대신해 웹을 탐색할 수 있는 AI 에이전트가 현존하는 AI 챗봇을 훨씬 더 유용하게 만들 것이라고 보고 있습니다.

    비록 아마존이 이러한 에이전트 기술을 개발한 최초의 기업은 아닐지라도, Alexa+를 통해 가장 폭넓은 사용자 도달 범위를 확보할 수 있을 것으로 기대됩니다.

    아마존에 따르면, Nova Act SDK를 이용해 개발하는 개발자들은 Sweetgreen에서 샐러드를 주문하거나 저녁 식사 예약을 하는 등 사용자 대신 기본적인 작업을 자동화할 수 있습니다. Nova Act 툴킷을 사용하면, 개발자들은 AI 에이전트가 웹페이지를 탐색하거나, 양식을 작성하거나, 캘린더에서 특정 날짜를 선택할 수 있도록 여러 도구를 결합할 수 있습니다.

    아마존은 Nova Act가 자체 내부 테스트에서 OpenAI나 Anthropic의 에이전트보다 우수하다고 주장합니다. 예를 들어, AI 에이전트가 화면의 텍스트와 상호 작용하는 방식을 측정하는 ScreenSpot Web Text 테스트에서 Nova Act는 94%를 기록하여, OpenAI의 CUA(88%)와 Anthropic의 Claude 3.7 Sonnet(90%)보다 높은 점수를 받았습니다.

    다만, 아마존은 WebVoyager와 같은 보다 일반적인 에이전트 평가 기준으로는 Nova Act를 벤치마크하지 않았습니다.

    Nova Act는 아마존이 앞서 언급한 AGI 연구소의 최초 공개 산출물입니다. 이 연구소는 전 OpenAI 연구원인 데이비드 루안(David Luan)과 피터 앱빌(Pieter Abbeel)이 공동으로 이끈 이니셔티브입니다. 두 사람 모두 이전에 각각(루안은 [회사 이름]을, 앱빌은 [회사 이름]을) 창업한 경험이 있으며, 작년에 아마존에 영입되어 AI 에이전트 역량을 주도하고 있습니다.

    AGI 연구소에서 샐러드를 주문하는 AI 에이전트를 개발한다는 것이 다소 이질적으로 느껴질 수 있지만, 루안은 TechCrunch과의 인터뷰에서 에이전트를 초지능 AI 시스템을 구현하기 위한 핵심 단계로 보고 있다고 밝혔습니다. 루안은 AGI를 "인간이 컴퓨터를 통해 할 수 있는 모든 작업을 돕는 AI 시스템"으로 정의합니다.

    루안은 자신의 팀이 Nova Act SDK를 단기간에 단순한 작업을 안정적으로 자동화하고, 개발자가 에이전트 워크플로우 과정에서 인간의 개입이 필요한 시점을 정밀하게 정의할 수 있는 도구를 제공하도록 설계했다고 전했습니다. 그는 이것이 비록 완전히 자율적이지는 않더라도, 개발자들이 더욱 신뢰성 높은 에이전트 애플리케이션을 구축할 수 있게 할 것이라고 기대합니다.

    아마존은 치열한 시장에 첫 범용 AI 에이전트를 출시하는 것이지만, 이는 회사에게 매우 중요한 기술입니다. Nova Act의 초기 테스트 결과는 오랫동안 기대되어 온 Alexa+의 일부 역량을 엿볼 수 있게 해줄 것이며, 이는 아마존의 AI 노력에 있어 성패를 가를 중대한 순간이 될 것입니다.

    한편, OpenAI, Google, Anthropic 등에서 개발한 초기 AI 에이전트들의 주요 문제점은 여러 영역에 걸친 신뢰성 문제입니다. TechCrunch의 테스트에 따르면, 해당 시스템들은 속도가 느리고 장기간 독립적으로 작동하는 데 어려움을 겪으며, 사람이 실수하지 않을 만한 유형의 오류에 취약합니다. 아마존이 이 난제를 해결했는지, 아니면 경쟁사와 마찬가지로 비슷한 결함에 시달리는지는 조만간 판가름 날 것입니다.

    [출처:] https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser