AI 개발 플랫폼 허깅 페이스(Hugging Face)의 공동 설립자이자 수석 과학자인 토마스 울프(Thomas Wolf)를 포함한 개발자 그룹은 '오픈(open)' 버전의 딥 리서치(Deep Research) 도구를 개발했다고 밝혔습니다.
딥 리서치는 OpenAI가 일요일 이벤트에서 공개한 기능으로, 웹을 크롤링하여 모든 주제에 대한 연구 보고서를 컴파일합니다. 이 기능은 인상적이지만, 현재는 OpenAI의 유료 구독 모델인 ChatGPT Pro(월 200달러) 사용자에게만 제한적인 미리보기로 제공됩니다.
허깅 페이스 팀이 'Open Deep Research'라고 명명한 이 프로젝트는 AI 모델과, 이 모델이 분석 계획을 수립하고 검색 엔진과 같은 외부 도구를 활용하도록 안내하는 오픈 소스 '에이전틱 프레임워크(agentic framework)'로 구성되어 있습니다. 자체 모델인 o1은 독점 모델(즉, 유료 API를 통해서만 접근 가능)이지만, 팀에 따르면 o1은 DeepSeek의 R1 같은 오픈 모델보다 더 나은 성능을 보여주었습니다.
연구원들은 24시간도 안 되는 짧은 시간에 o1을 활용하여 단순 텍스트 기반 브라우저와 '텍스트 검사기(text inspector)' 툴킷을 결합해 웹상의 파일을 읽는 데 성공했습니다. 팀은 Open Deep Research가 웹을 자율적으로 탐색하며 페이지를 스크롤하고, 파일을 조작하며, 심지어 데이터 계산까지 수행할 수 있다고 설명했습니다.
일반 AI 비서 성능을 측정하는 벤치마크인 GAIA에서, Open Deep Research는 54%의 점수를 기록했습니다. 이는 OpenAI의 딥 리서치가 기록한 67.36%와 비교되는 수치입니다.
제가 직접 사용해 본 공개 시연에서도 Open Deep Research는 작동하지 않았습니다. 게시 시점에 페이지에 부하가 매우 컸던 탓인지, 10분 만에 오류 메시지가 출력되었습니다.
하지만 연구진은 사용자 경험 개선에 전념하고 있으며, 이에 대한 검토와 피드백을 위해 소스 코드를 GitHub에 공개했습니다.
주목할 점은 웹상에 오픈AI 딥 리서치를 '재현'한 사례가 다수 존재하는 반면, 이들 중 일부는 오픈 모델과 도구에 의존한다는 것입니다. 이들—그리고 Open Deep Research 역시—가 부족한 핵심 구성 요소는 딥 리서치의 근간을 이루는 o3 모델입니다.
복잡한 질문 답변 및 정보 수집과 관련된 벤치마크 측면에서 o3에 필적하는 오픈 모델은 거의 없다고 전해집니다. 따라서 o3에 버금가는 오픈 모델이 없는 한, 딥 리서치 대체재들은 실제 기능에 미치지 못할 수 있습니다.
(TechCrunch는 AI 중심 뉴스레터를 제공합니다! 매주 수요일에 받아보시려면 여기서 가입하세요.)