• SuperAnnotate가 기업들의 AI 데이터셋 관리를 돕습니다

    article image

    고품질 데이터는 고품질 AI의 핵심 열쇠일 수 있습니다. 데이터 규모 자체보다 데이터 세트의 '큐레이션(curation)'이 AI 모델 성능에 실제 영향을 미친다는 연구 결과가 나오면서, 데이터 세트 관리 관행의 중요성이 커지는 것은 당연지사입니다. 실제로 일부 설문조사에 따르면, 오늘날 AI 연구원들은 시간의 상당 부분을 데이터 준비 및 정리 작업에 할애한다고 합니다.

    브라더스 바한 페트로시안(Vahan Petrosyan)과 티그란 페트로시안(Tigran Petrosyan)은 대학 시절 알고리즘을 훈련하는 과정에서 방대한 데이터를 관리해야 하는 어려움을 경험했습니다. 바한은 특히 이미지 분할(image segmentation)에 관한 박사 학위 연구를 진행하며 데이터 관리 도구를 직접 개발할 정도였습니다.

    몇 년 후, 바한은 개발자뿐만 아니라 기업들도 유사한 도구(tooling)에 기꺼이 비용을 지불할 수 있다는 사실을 깨달았습니다. 이에 형제는 이를 구축하기 위해 SuperAnnotate라는 회사를 설립했습니다.

    바한은 성명에서 "2023년 모델과 멀티모달 AI를 둘러싼 혁신적인 폭발 속에서 고품질 데이터 세트의 필요성이 더욱 엄격해졌으며, 각 조직은 전문화된 데이터가 필요한 다양한 사용 사례를 갖게 되었다"고 말했습니다. 그는 "현대 AI 훈련 데이터에 적용할 수 있는, 사용하기 쉽고 로우코드(low-code) 플랫폼, 일종의 만능 도구(Swiss Army Knife)를 구축할 기회를 포착했다"고 덧붙였습니다.

    Databricks와 Canva 등이 고객사로 이름을 올린 SuperAnnotate는 사용자가 대규모 AI 훈련 데이터 세트를 생성하고 관리할 수 있도록 돕습니다. 이 스타트업은 원래 라벨링 소프트웨어에 중점을 두었으나, 현재는 데이터 세트의 미세 조정(fine-tuning), 반복(iterating), 그리고 평가를 위한 도구까지 제공합니다.

    SuperAnnotate 플랫폼을 이용하면 사용자들은 로컬 소스와 클라우드에 있는 데이터를 연결하여 데이터 프로젝트를 구성하고 팀원들과 협업할 수 있습니다. 사용자는 대시보드를 통해 어떤 데이터로 모델이 훈련되었는지에 따라 성능을 비교할 수 있으며, 준비가 되면 해당 모델을 다양한 환경에 배포할 수 있습니다.

    SuperAnnotate는 또한 기업들에게 데이터 주석(annotation) 작업을 위한 크라우드소싱 인력 마켓플레이스 접근권을 제공합니다. 여기서 주석이란 일반적으로 모델이 훈련되는 데이터의 의미나 특정 부분을 라벨링한 텍스트 조각으로, 모델에게 사물, 장소, 개념을 구별하도록 '가르치는' 가이드라인 역할을 합니다.

    솔직히 말해, SuperAnnotate가 사용하는 데이터 주석 작업자들을 대하는 방식에 대해서는 여러 논란이 있으며, 그 내용은 긍정적이지 않습니다. 주석 작업자들은 소통 문제, 불분명한 기대치, 낮은 임금 등을 불만으로 제기하고 있습니다.

    이에 대해 SuperAnnotate는 적정 시장 임금을 지급하며, 주석 작업자들에게 요구하는 수준이 업계의 일반적인 기준을 벗어나지 않는다고 주장합니다. 저희는 회사에 그들의 관행에 대한 더 상세한 정보를 요청했으며, 답변을 받는 즉시 기사를 업데이트할 예정입니다.

    편집:

    이 기사가 게시된 몇 시간 후, SuperAnnotate는 이메일을 통해 다음과 같은 성명을 발표했습니다. "약 8개월 전, 급격한 확장 과정에서 저희는 프로젝트에 참여하는 일부 주석 작업자들과 명확한 커뮤니케이션을 유지하는 데 어려움을 겪었습니다. 때때로 급성장기에 발생하는 것처럼, 몇 가지 프로세스상 격차가 생겼습니다. 저희는 이 피드백을 매우 심각하게 받아들였으며, 그 이후 주석 작업자가 플랫폼을 사용하는 방식과 커뮤니케이션 프로세스 모두에 개선을 이루었습니다."

    AI 데이터 관리 분야에는 Scale AI와 같은 여러 경쟁업체들이 있습니다. 하지만 샌프란시스코에 본사를 둔 SuperAnnotate는 최근 Nvidia, Databricks Ventures, Play Time Ventures가 참여한 시리즈 B 투자 유치 라운드에서 3,600만 달러를 성공적으로 확보하며 입지를 강화했습니다.

    SuperAnnotate의 총 유치 금액은 이로써 5,300만 달러가 조금 넘는 금액으로 늘어났습니다. 이 신규 자금은 현재 약 100명 규모의 팀을 확장하고, 제품 연구 개발(R&D)에 투자하며, SuperAnnotate의 약 100개 기업 고객 기반을 확대하는 데 사용될 예정입니다.

    바한은 "우리는 기업의 진화하는 요구사항에 완벽히 적응하고 데이터 미세 조정(data fine-tuning)에서 광범위한 사용자 정의 기능을 제공할 수 있는 플랫폼을 구축하는 것을 목표로 한다"고 밝혔습니다.


    [Note: The original text included promotional sign-up boxes and calls to action, which are removed as per the standard technical editing policy of returning only the polished content.]

    [출처:] https://techcrunch.com/2024/11/18/superannotate-helps-companies-manage-their-ai-data-sets