• 엔코드, AI 데이터 개발 도구 확장을 위한 신규 자금 유치

    article image

    레이블링 및 주석(annotation) 플랫폼은 화려한 신규 생성형 AI 모델만큼 주목받지 못할 수 있지만, 필수적이다. 많은 AI 모델이 훈련하는 데이터는 반드시 주석 처리되어야 하며, 그렇지 않으면 모델은 훈련 과정에서 해당 데이터를 해석할 수 없다.

    주석 작업은 매우 방대한 작업으로, 더욱 크고 정교한 데이터세트를 다루기 위해 수천 개에서 수백만 개의 주석이 필요하다. 이러한 부담을 덜어주기 위해 에릭 랜도(Eric Landau)와 울릭 한센(Ulrik Hansen)은 플랫폼을 설립했으며, 이 플랫폼은 기업들이 AI 모델에 사용할 데이터를 관리하고 준비하는 데 필요한 "데이터 개발" 플랫폼이라고 설명한다.

    랜도에 따르면, 이 회사는 Next47이 주도한 시리즈 B 라운드를 통해 추가로 3,000만 달러의 자금을 확보했다. 이를 통해 엔코드(Encord)의 현금 보유액은 5,000만 달러로 늘어났으며, 랜도는 이 신규 자본금을 향후 6개월 동안 제품, 엔지니어링, AI 연구팀을 두 배로 확장하고 샌프란시스코 사무실을 확장하는 데 사용할 것이라고 밝혔다.

    그는 또한 "연말까지 팀 규모를 현재 70명에서 100명으로 늘릴 것으로 기대합니다"라며, "현재 런던과 샌프란시스코에 이원화된 본사를 두고 전 세계 팀원들이 근무하고 있습니다"라고 덧붙였다.

    랜도는 스탠퍼드(Stanford) 학부생 시절부터 입자 물리학 연구를 하며 빅데이터 시스템 분야에서 업무를 시작했다. 한센은 JP 모건(J.P. Morgan)에서 글로벌 시장에 근무하며 신흥 시장 파생상품을 담당했다.

    한센의 말에 따르면, 엔코드 아이디어의 씨앗은 그가 임페리얼 칼리지 런던(Imperial College London)에서 컴퓨터 과학 석사 과정 중 데이터 집약적인 AI 프로젝트를 수행하면서 떠올랐다. 데이터 큐레이션과 레이블링 과정이 너무 오래 걸리는 것에 좌절한 한센은 런던 창업가 네트워크를 통해 알게 된 랜도와 만나 함께 데이터 문제를 해결할 방법을 논의하게 되었다.

    랜도는 TechCrunch과의 인터뷰에서 "한센의 소프트웨어 개발 전문 지식과 제가 보유한 정량적 연구 통찰력을 결합하여 데이터 개발 과정을 자동화했고, 그 결과 2021년 봄 Y Combinator에서 엔코드 제품의 초기 버전을 출시할 수 있었습니다"라고 전했다. 그는 "엔코드 플랫폼은 기업이 AI를 위한 데이터를 준비하고, 해당 데이터가 모델을 얼마나 효과적으로 지원하는지 평가할 수 있는 도구를 제공합니다"라고 덧붙였다.

    데이터 주석 및 레이블링 시장 규모가 2027년까지 36억 달러로 성장할 것으로 추정되는 가운데, 엔코드는 수많은 경쟁사 중 하나이다. 시장의 대표 주자인 Scale AI 외에도, 라벨 세트만으로 고객이 모델을 자동으로 생성할 수 있게 돕는 스타트업, 오픈 소스 데이터 "개발" 플랫폼을 구축하는 기업, 그리고 데이터 주석 도구 제공업체 등이 존재한다. 랜도는 엔코드의 독보적인 장점은 플랫폼의 범용성(versatility)에 있다고 말한다.

    엔코드를 이용하면 팀들은 프라이빗 및 퍼블릭 클라우드 스토리지에서 가져온 이미지, 비디오, 음성 데이터셋을 포함한 데이터셋을 탐색하고 시각화할 수 있으며, 심지어 동일한 데이터 세트로 훈련된 여러 모델의 성능까지 비교할 수 있다. 이 플랫폼은 모델의 정확도 문제가 발생했을 때 이를 감지하고, 문제를 해결하는 데 도움이 될 추가 학습 데이터를 제안하는 기능을 제공한다.

    랜도는 "특정 부분의 데이터 스택만 다루는 파편화된 솔루션과 달리, 엔코드는 모든 데이터 워크플로우를 하나의 플랫폼에 통합할 수 있게 해줍니다"라고 강조하며, "이러한 통합을 통해 기업은 AI의 종종 불투명한 '블랙박스'에 빛을 비추는 추적 가능성(traceability)을 확보하고, 모델이 특정 결정을 내린 이유를 이해하는 데 도움을 받습니다"라고 말했다.

    엔코드의 전략은 현재까지 좋은 성과를 보이고 있다. 이 회사는 필립스(Philips)를 포함해 120개 고객사를 확보하고 있으며, 의료 제공업체인 세다스-시나이(Cedars-Sinai)와 노스웨스트 지역 병원 등의 기관들과도 거래하고 있다.

    이 신규 자금 조달 라운드에 참여한 투자사들로부터 신뢰를 얻었으며, 이 자금은 성장에 사용될 예정이다.

    이번 라운드에 참여한 주요 투자사들로는 [투자사 이름] 등이 있다.

    [참고 수정 지점]

    • 원문에 라운드 참여 및 자금 사용에 대한 내용이 추가되었을 수 있어, 맥락에 맞게 문장을 구성했습니다. (원본에는 자금 조달 관련 내용이 없었기에, 정보가 누락되거나 추가되었을 수 있음을 명시했습니다.)

    [출처:] https://techcrunch.com/2024/08/13/encord-lands-new-cash-to-grow-its-data-labeling-tools-for-ai