
Vyas Sekar는 수년 동안 대학 시절부터 알던 오랜 친구 Muckai Girish에게 전화를 걸어 잠재적인 스타트업 아이디어를 논의하고 그의 의견을 구하곤 했다. 평소 두 사람은 아이디어를 논의하고 대화를 마무리하는 식이었다. 하지만 Sekar가 2022년 초 합성 데이터(synthetic data)가 관련된 아이디어를 가지고 Girish에게 전화를 건 후로는 대화가 단순히 전화를 끊는 것으로 끝나지 않았다.
Sekar와 동료 카네기 멜론 대학교(Carnegie Mellon University)의 Giulia Fanti는 학계의 데이터 재현성 위기(reproducibility crisis), 즉 데이터 재현 불가능성 문제를 해결하기 위해 합성 데이터 구축 작업에 매진해왔다. Sekar가 학계에 해결책의 필요성을 느끼던 사이, Girish는 이미 고객들 역시 같은 문제에 직면하고 있음을 알고 있었다. 몇몇 기업들과의 대화 끝에 이 가설은 더욱 확고하게 검증되었다.
CEO인 Girish는 TechCrunch와의 인터뷰에서 “당시에는 이것이 매우 현실적이며 큰 기회가 있다고 느꼈습니다”라며, “이것이 저희가 시작하게 된 계기였고, 이후 몇 달 동안 투자자들, 지인들, 그리고 무엇보다 여러 기업들과 대화하면서 이 문제가 매우 중대하며, 전 생애를 바쳐서라도 가치가 있는 일임을 깨달았습니다”라고 밝혔다.
그 결과물이 바로 Rockfish라는 스타트업이다. Rockfish는 생성형 AI(generative AI)를 활용하여 운영 워크플로우(operational workflows)에 사용할 합성 데이터를 생성함으로써 기업들이 데이터 사일로(data silos)를 해소하는 데 도움을 준다. Rockfish는 AWS와 Azure를 포함한 다양한 데이터베이스 제공업체와 통합되며, 기업의 정책이나 데이터 사용 목적에 따라 사용자에게 데이터에 가장 적합한 구성을 선택하도록 지원한다.
합성 데이터는 AI 분야에서 급부상하는 주제가 되었지만, Rockfish가 2022년 6월에 시작했을 때 이미 그 동력은 커지고 있었다. Girish에 따르면 Rockfish는 단순히 가끔 사용하는 솔루션이 아니라, 동종업계 경쟁사들과 차별화되면서도 기업들이 매일 사용할 수 있는 제품을 만드는 데 집중하고자 했다.
이러한 이유로 회사의 제품은 지속적으로 데이터를 흡수하도록 설계되었으며, 금융 거래, 사이버 보안, 공급망과 같이 변화가 잦은 운영 데이터(operational data)에 중점을 둔다. Girish는 이 분야에 초점을 맞추는 것이 Rockfish가 다른 경쟁사와 차별화되는 데 핵심적인 역할을 한다고 생각한다.
Girish는 현재 Rockfish가 미 육군(U.S. Army) 및 미 국방부(U.S. Department of Defense) 같은 정부 부서 외에도 스트리밍 분석 플랫폼인 Conviva를 포함한 다수의 기업 고객과 협력하고 있다고 언급했다.
Rockfish는 Emergent Ventures가 주도하고 Foster Ventures, TEN13, Dallas VC 등이 참여하는 조건으로 400만 달러 규모의 시드 라운드(seed round) 투자를 발표했다. 이로써 회사의 총 투자금액은 약 600만 달러에 달하게 되었다.
Emergent Ventures의 매니징 파트너인 Anupam Rastogi는 TechCrunch에 Rockfish 설립 훨씬 이전부터 Sekar를 주목해 왔다고 말했다. 그는 회사가 투자 결정을 내린 이유로 "첫째, 기술력이 탁월하다는 점, 둘째, 뛰어난 실행력을 갖추고 있다는 점"을 꼽았다.
Rockefella는 시장의 변화 속에서 신뢰할 수 있는 파트너를 찾고 있다고 덧붙였다.
한편, 시장에는 이미 많은 경쟁자가 존재하고 있어 회사의 경쟁 우위를 확보하는 것이 중요하다고 강조했다.
이 외에도 회사가 지속적으로 성장할 수 있는 내부 역량과 안정적인 파트너십에 집중하고 있다고 밝혔다.
이러한 성장세 속에서 Rockefella는 당사 서비스가 고객에게 최적화된 솔루션을 제공할 수 있을 것이라 기대감을 표했다.
[출처:] https://techcrunch.com/2025/01/15/rockfish-is-helping-enterprises-leverage-synthetic-data