
AI 코딩 도구가 매달 수십억 줄의 코드를 생성하면서, 이제는 소프트웨어가 의도대로 작동하는지 보장하는 것이 새로운 병목 지점(bottleneck)으로 떠오르고 있습니다.
코드 검토, 테스트, 거버넌스를 위한 AI 에이전트를 구축하는 스타트업인 Qodo는 코드를 '검증(verification)'하는 과정이야말로 소프트웨어 개발의 다음 단계를 정의할 것이라고 베팅하고 있습니다.
뉴욕에 본사를 둔 이 스타트업은 Qumra Capital이 주도하는 시리즈 B 라운드에서 7,000만 달러를 유치하며, 누적 투자금액을 1억 2,000만 달러로 늘렸습니다. Maor Ventures, Phoenix Venture Partners, S Ventures, Square Peg, Susa Ventures, TLV Partners, Vine Ventures, 그리고 Peter Welinder(OpenAI), Clara Shih(Meta) 등도 이번 라운드에 참여했습니다.
Qodo는 기업들이 OpenClaw나 Claude Code 같은 도구 채택을 가속화함에 따라, AI 생성 코드에 대한 신뢰도를 높이는 레이어 역할을 목표로 합니다. 실제로 많은 기업들은 코드가 빠르다고 해서 반드시 신뢰성 있거나 안전한 소프트웨어로 이어지는 것은 아니라는 점을 발견하고 있습니다.
대부분의 AI 검토 도구가 '무엇이 변경되었는지'에 초점을 맞추는 반면, Qodo는 조직 표준, 역사적 맥락, 위험 허용도 등을 종합적으로 고려하여, 코드 변경이 전체 시스템에 어떤 영향을 미치는지에 초점을 맞춥니다. 이를 통해 기업들이 AI 생성 코드를 더욱 자신 있게 관리할 수 있도록 돕습니다.
이전에 Alibaba에서 기계 비전 사업부를 공동 창립하고 이끈 경험이 있는 이타마르 프리드먼은 2022년 Qodo를 설립했습니다. 그는 TechCrunch과의 인터뷰에서, 자신의 경력에서 가장 중요한 순간 두 가지, 즉 나중에 Nvidia에 인수된 Mellanox에서의 경험과 Visualead 구축 과정이 ChatGPT 출시 몇 달 전 Qodo를 시작하게 된 영감의 원천이었다고 전했습니다.
Mellanox에서 머신러닝을 이용해 하드웨어 검증 자동화를 수행하며 그는 "시스템을 생성하는 것과 시스템을 검증하는 것은 근본적으로 다른 접근 방식(다른 도구, 다른 사고방식)을 필요로 한다"는 사실을 깨달았습니다. 나중에 Alibaba의 Damo Academy에서는 AI가 인간 언어에 기반하여 추론하는 시스템으로 진화하는 것을 목격했습니다. 2021년~2022년, GPT-3.5 출시 직전에는 AI가 전 세계 콘텐츠, 특히 코드의 상당 부분을 생성할 것이라는 점이 분명해지면서, 코드 생성과 검증에는 완전히 다른 시스템이 필요하다는 그의 확신은 더욱 강해졌습니다.
최근 설문조사에 따르면, 개발자의 95%가 AI 생성 코드를 전적으로 신뢰하지 않지만, 실제로 커밋(commit)하기 전에 일관되게 코드를 검토하는 개발자는 48%에 불과하여 인지(awareness)와 실제 실행(practice) 사이에 큰 간극이 있음을 보여줍니다.
프리드먼은 "코드 생성 기업들은 대부분 LLM을 중심으로 구축되어 있습니다. 하지만 코드 품질과 거버넌스를 위해서는 LLM만으로는 충분치 않습니다"라며, "품질은 주관적입니다. 조직 표준, 과거 결정, 그리고 노하우가 반영됩니다. LLM은 이러한 복합적인 맥락을 완전히 이해하지 못합니다. 마치 어느 회사의 뛰어난 엔지니어를 다른 회사에 보내 코드 검토를 부탁하는 것과 같습니다. 그들은 내부적인 맥락이 부족합니다"라고 설명했습니다.
그는 OpenAI나 Anthropic 같은 회사들이 코드 검토와 같은 인접 영역을 포함해 전반적인 AI 생태계를 형성하는 데 기여하고는 있지만, 주로 기능을(feature) 구축하는 데 초점을 맞추고 있을 뿐, 완전한 엔드투엔드 솔루션 제공에는 중점을 두고 있지 않다고 지적했습니다. 그는 이 분야에 다른 스타트업들도 존재하지만, 많은 곳이 여전히 초기 단계에 머물러 있어 광범위한 기업 도입 단계에 이르지 못했다고 덧붙였습니다.
Qodo는 이러한 혼잡한 시장에서 성능 우위(performance)를 통해 차별화를 꾀하고 있습니다. 이 스타트업은 최근 Martian’s Code Review Benchmark에서 1위를 기록하며 64.3점을 획득했는데, 이는 차순위 경쟁사보다 10점 이상, Claude Code Review보다 25점 이상 높은 점수입니다. 이 벤치마크는 Qodo가 개발자들에게 불필요한 혼란을 주지 않으면서도 높은 수준의 검증 능력을 갖추고 있음을 입증합니다.
Q사는 "우리는 이전 단계와는 완전히 다른 영역을 개척하고 있다"고 강조하며, "우리는 현존하는 모델의 한계까지 확장하는 역할을 하고 있다"고 언급했습니다.
[출처:] https://techcrunch.com/2026/03/30/qodo-bets-on-code-verification-as-ai-coding-scales-raises-70m