• 허깅 페이스, 무료 '오퍼레이터형' 에이전트 AI 도구 출시

    허깅 페이스(Hugging Face)의 한 팀이 자유롭게 사용할 수 있는 클라우드 기반의 컴퓨터 사용 AI "에이전트(agent)"를 출시했습니다. 다만, 미리 알려드리자면 성능이 다소 느리고 때때로 오류를 일으킵니다.

    허깅 페이스의 에이전트인 [명칭 누락]은 웹을 통해 접근 가능하며, Firefox를 포함한 여러 애플리케이션이 미리 로드된 Linux 가상 머신을 활용할 수 있습니다. OpenAI의 Operator와 유사하게, 사용자는 Open Computer Agent에게 "구글 지도를 사용하여 파리에 있는 허깅 페이스 본사를 찾아줘"와 같은 작업을 요청할 수 있으며, 에이전트가 필요한 프로그램을 열고 필요한 단계들을 스스로 파악하는 과정을 지켜보기만 하면 됩니다.

    Open Computer Agent는 비교적 단순한 요청은 어느 정도 처리할 수 있습니다. 그러나 TechCrunch의 테스트 결과에 따르면, 비행기 표 검색과 같은 더 복잡한 작업에서는 난관을 겪었습니다. 또한, Open Computer Agent는 풀지 못하는 CAPTCHA 테스트에 자주 직면하기도 합니다.

    더욱이 Open Computer Agent를 사용하려면 가상 대기열에서 기다려야 하는데, 대기 시간은 수요에 따라 몇 초에서 몇 분까지 걸릴 수 있습니다.

    저희가 smolagents에 Computer Use 기능을 출시합니다! 🥳

    -> 비전 모델의 능력이 향상됨에 따라, 복잡한 에이전트 워크플로우를 구동할 수 있게 되었습니다. 특히 Qwen-VL 모델처럼 내장 그라운딩(grounding) 기능을 지원하여, 즉 이미지 내 모든 요소를 좌표로 위치시킬 수 있는 모델은…

    pic.twitter.com/mI8MuWZkIS

    — m_ric (@AymericRoucher)

    2025년 5월 6일

    물론 허깅 페이스 팀의 목표가 최첨단 컴퓨터 사용 에이전트를 구축하는 것은 아니었습니다. 오히려 오픈 AI 모델이 더욱 발전하여 클라우드 인프라에서 운영 비용이 절감 가능하다는 점을 시연하는 것이 주된 목적이었습니다.

    허깅 페이스의 에이전트 팀원 Aymeric Roucher는 X에 올린 게시물에서 "비전 모델의 능력이 높아지면서 복잡한 에이전트 워크플로우를 구동할 수 있게 되었다"고 밝혔습니다. "[이들 중 일부 모델]는 내장 그라운딩, 즉 이미지 내 모든 요소를 좌표로 위치시킬 수 있는 능력을 지원하며, 따라서 가상 머신 내의 어떤 항목이든 클릭할 수 있습니다."

    아직 완벽한 단계는 아니지만, 기업들이 생산성 향상을 위해 에이전트 기술 도입을 모색하면서 이 분야에 대한 투자는 증가하고 있습니다.

    최근 KPMG의 조사에 따르면, 기업의 65%가 AI 에이전트 실험을 진행하고 있습니다.

    Markets and Markets에 따르면, AI 에이전트 부문 규모는 2025년 78억 4천만 달러에서 2030년 526억 2천만 달러로 성장할 것으로 예상됩니다.

    [출처:] https://techcrunch.com/2025/05/06/hugging-face-releases-a-free-operator-like-agentic-ai-tool