
창업자인 사미 시두(Sammy Sidhu)와 제이 치아(Jay Chia)는 라이프(Lyft)의 자율주행차 프로그램에서 소프트웨어 엔지니어로 근무하면서, 인공지능(AI)의 부상과 함께 규모가 커지는 데이터 인프라 문제에 직면했습니다.
자율주행차는 3D 스캔, 사진부터 텍스트, 오디오에 이르기까지 막대한 양의 비정형 데이터를 생성합니다. 당시 라이프의 엔지니어들은 이 모든 유형의 데이터를 동시에, 그리고 단일한 시스템 내에서 이해하고 처리할 수 있는 도구가 전무했습니다. 그 결과, 엔지니어들은 신뢰성에 문제가 있는 오픈 소스 도구들을 조합하는 지난한 과정을 거쳐야만 했습니다.
이벤트루얼(Eventual)의 CEO인 시두는 최근 TechCrunch 인터뷰에서 "우리에게는 업계 전반에 걸쳐 뛰어난 박사들과 인재들이 자율주행차 분야에 집중하고 있지만, 핵심 애플리케이션을 구축하기보다는 인프라 구축에 시간의 80%를 할애하고 있습니다"라며, "이들이 직면했던 문제의 대부분이 데이터 인프라와 관련되어 있었습니다"라고 지적했습니다.
시두와 치아는 라이프를 위해 내부적으로 멀티모달 데이터 처리 도구를 구축하는 데 참여했습니다. 이후 시두가 다른 회사에 지원하는 과정에서, 면접관들은 반복적으로 자신들의 회사에도 유사한 데이터 솔루션을 구축할 가능성을 질문했고, 이 아이디어가 이벤트루얼의 탄생 계기가 되었습니다.
이벤트루얼은 텍스트에서 오디오, 비디오에 이르기까지 다양한 모달리티(modality) 간에 신속하게 작동하도록 설계된 Python 네이티브 오픈 소스 데이터 처리 엔진인 다프트(Daft)를 개발했습니다. 시두에 따르면, 다프트의 목표는 과거 SQL이 테이블형 데이터셋에 혁신적이었던 것처럼, 비정형 데이터 인프라 전반에 걸쳐 근본적인 변화를 일으키는 것입니다.
이 회사는 ChatGPT가 출시되기 거의 1년 전인 2022년 초에 설립되었으며, 당시에는 이러한 데이터 인프라 격차에 대해 대중이 크게 인지하지 못하고 있었습니다. 그들은 2022년에 다프트의 첫 오픈 소스 버전을 출시했으며, 현재 3분기에는 상업용 제품 출시를 준비하고 있습니다.
시두는 "ChatGPT의 폭발적인 성장을 겪으며, 많은 사람들이 다양한 모달리티를 활용한 AI 애플리케이션을 구축하고 있다는 것을 알게 되었습니다"라며, "이제 모두가 애플리케이션에 이미지, 문서, 비디오 등을 사용하기 시작했고, 그 결과 사용량이 급격히 증가했습니다"라고 설명했습니다.
비록 다프트의 초창기 구상이 자율주행차 분야에서 시작되었지만, 로보틱스, 리테일 테크, 헬스케어 등 멀티모달 데이터를 처리하는 수많은 다른 산업 분야에서 활용되고 있습니다. 이벤트루얼은 현재 아마존(Amazon), 클라우드키친스(CloudKitchens), 투게더 AI(Together AI) 등을 주요 고객사로 보유하고 있습니다.
이벤트루얼은 최근 8개월 동안 두 차례의 투자를 성공적으로 유치했습니다. 첫 투자는 CRV가 주도한 750만 달러 규모의 시드 라운드였으며, 가장 최근에는 마이크로소프트의 M12와 시티(Citi)가 참여한 2,000만 달러 규모의 시리즈 A 라운드를 유치했습니다.
이번 최신 투자금은 이벤트루얼의 오픈 소스 제공 범위 확대는 물론, 고객들이 처리된 데이터를 기반으로 AI 애플리케이션을 구축할 수 있는 상업용 제품 개발에 사용될 예정입니다.
펠리시스(Felicis)의 어소시에이트 파트너인 아스타시아 마이어스(Astasia Myers)는 TechCrunch와의 인터뷰에서, 자신이 이벤트루얼을 알게 된 계기는 증가하는 멀티모달 AI 모델을 지원할 수 있는 데이터 인프라를 찾던 시장 조사 과정 덕분이었다고 밝혔습니다.
마이어스는 이벤트루얼이 이 분야의 최초 선도자(first mover)라는 점—그리고 이 시장은 더욱 혼잡해질 것으로 예상됨—과 더불어, 창업자들이 이 데이터 처리 문제를 직접 경험하며 해결책을 찾아왔다는 점에 주목하며 높이 평가했습니다. 그녀는 또한 이벤트루얼이 현재 업계의 성장하는 문제(a growing problem)를 해결하고 있다고 덧붙였습니다.
시장 조사 컨설팅 회사인 MarketsandMarkets에 따르면, 멀티모달 AI 산업은 2023년과 2028년 사이에 연평균 복합 성장률(compound annual growth rate)을 기록할 것으로 전망됩니다.
한편, 마이어스 신임지는 다음과 같이 설명했습니다. "이러한 추세 속에서 데이터의 생성과 활용 방식은 빠르게 변화하고 있으며, 이는 데이터 인프라에 새로운 요구를 던지고 있습니다."