• 엔트로픽과 구글, OpenAI 지원 하비(Harvey)를 사용자로 확보하며 승리 거둬

    article image

    선도적인 법률 AI 도구인 하비(Harvey)가 Anthropic과 Google의 최신 파운데이션 모델을 활용하며, 기존의 OpenAI 모델에만 국한되지 않는 방향으로 진화한다고 하비가 화요일 블로그 게시물을 통해 발표했습니다.

    이는 주목할 만한 변화입니다. 하비는 OpenAI Startup Fund가 지원한 가장 성공적인 초기 투자 포트폴리오 회사 중 하나이기 때문입니다. OpenAI Startup Fund는 주로 OpenAI 자체 기술을 기반으로 제품을 개발하는 기업들을 지원하는, OpenAI와 연관된 펀드입니다. 하비는 OpenAI를 포기하는 것이 아니라, 단순히 모델과 클라우드 옵션을 확장하는 것뿐이라고 설명했지만, 이는 여전히 OpenAI의 주요 경쟁사들에게는 큰 전략적 승리로 해석됩니다.

    하비는 2022년 12월, OpenAI Startup Fund가 지원한 최초의 4개 스타트업 중 하나였다고 밝힌 바 있습니다. 당시에는 샘 알트먼(Sam Altman) OpenAI CEO가 직접 이 펀드를 운영하고 있었습니다. (같은 첫 코호트에 포함된 다른 기업으로는 Descript, Mem, Speak 등이 있습니다.)

    이후 엄청난 성장을 이룬 하비는, 2월에 세쿼이아(Sequoia)가 주도하고 코트우(Coatue), 클라이너 퍼킨스(Kleiner Perkins), OpenAI Fund 등 여러 주요 기관이 참여한 3억 달러 규모의 Series D 투자 유치를 발표하며 현재 기업가치 30억 달러의 스타트업이 되었다고 언급했습니다.

    흥미롭게도, 구글의 모회사 알파벳(Alphabet)의 벤처 자회사인 GV가 2024년 7월 하비의 1억 달러 규모 Series C 투자를 이끌기도 했습니다 (이 라운드에도 OpenAI Fund가 참여했습니다). 하지만 하비는 GV가 구글의 기업 벤처 회사를 자본금 표(cap table)에 올린 후, 즉시 구글의 AI 모델을 도입하지 않았습니다. (참고로 GV는 하비의 Series D에도 참여했습니다.)

    그렇다면 무엇이 하비를 OpenAI 모델을 넘어서도록 설득했을까요? 이 스타트업이 자체 개발한 벤치마크인 ‘BigLaw’에 따르면, 광범위하고 다양한 파운데이션 모델들이 여러 법률 업무에 걸쳐 점차 높은 숙련도를 보이고 있으며, 특정 업무에서는 모델별로 강점이 다르다는 것이 밝혀졌습니다.

    하비는 모델 훈련 자체에 자원을 투입하는 대신, 다른 공급업체(예: 아마존 클라우드를 통한 Google 및 Anthropic)가 제공하는 고성능 추론 파운데이션 모델들을 받아 법률 시장에 맞춰 파인튜닝하는 것이 더 효율적이라고 판단했습니다.

    회사는 다양한 모델을 활용하는 것이 AI 에이전트 개발에 큰 도움이 될 것이라고 덧붙였습니다.

    하비는 블로그 게시물에서 "1년도 채 되지 않아, 7개의 모델(비 OAI 모델 3개 포함)이 원래 벤치마킹되었던 Harvey 시스템보다 BigLaw 벤치에서 더 뛰어난 성능을 보여주고 있습니다"라고 전했습니다.

    하비의 벤치마크는 또한 파운데이션 모델별로 특정 법률 업무의 적합도가 다름을 보여주었습니다. 예를 들어, Google의 Gemini 2.5 Pro는 법률 초안 작성(legal drafting) 분야에서는 "뛰어나지만," 모델이 "미란다 원칙과 같은 복잡한 증거 규칙"을 완전히 이해하지 못하여 구두 변론(oral arguments) 작성과 같은 재판 전 업무에는 "어려움을 겪습니다."

    하비의 테스트에 따르면, OpenAI의 o3가 이러한 재판 전 업무를 가장 잘 수행했으며, Anthropic의 Claude 3.7 Sonnet이 근접한 성능을 보였습니다.

    [하비의 내부 벤치마킹 결과 요약]

    하비는 블로그 게시물을 통해 앞으로 공적인 모델 벤치마크 성능 순위표에 참여할 것임을 밝혔습니다. 이 순위표에서는 주요 추론 모델들이 법률 업무를 얼마나 잘 수행하는지 평가할 예정입니다. 하비는 단순한 단일 점수만으로 순위를 매기는 것이 아니라, "최고의 변호사들이 단일 점수 벤치마크로는 포착할 수 없는 미묘한 통찰력을 제공하는 리서치"도 함께 발표할 계획입니다.

    결과적으로, OpenAI의 지원을 받는 하비가 경쟁사 모델을 도입하는 것을 넘어, 자체적으로 업계의 기준을 높이는 플레이를 하며 투자자들(구글 포함)에게 지속적인 검증을 요구하고 있는 셈입니다. 비록 AI 벤치마킹 자체가 복잡하고 어느 정도 정치적인 영역으로 변모하고 있지만, 이 분야에서는 여전히 OpenAI의 위상이 확고합니다.

    하비의 윈스턴 와인버그(Winston Weinberg) CEO는 테크크런치(TechCrunch)에 보낸 성명에서 "오픈AI가 하비의 투자자이자 제품의 핵심 협력사로 참여하게 되어 매우 영광입니다"라고 밝혔습니다. 이어 "전 세계 고객의 요구에 지속적으로 대응하면서 고객들에게 제공할 수 있는 옵션의 폭을 넓힐 수 있게 되어 매우 기대가 큽니다"라고 덧붙였습니다.

    [출처:] https://techcrunch.com/2025/05/13/anthropic-google-score-win-by-nabbing-openai-backed-harvey-as-a-user