
소프트웨어 엔지니어를 위한 인기 AI 도구를 개발하는 스타트업 Windsurf는 목요일, 자사의 첫 AI 소프트웨어 엔지니어링 모델군인 SWE-1의 출시를 발표했습니다. 이 스타트업은 새롭게 개발한 AI 모델군인 SWE-1, SWE-1-lite, SWE-1-mini를 단순 코딩을 넘어 "전체 소프트웨어 엔지니어링 프로세스"에 최적화하도록 훈련했다고 밝혔습니다.
OpenAI가 Windsurf 인수를 위해 30억 달러 규모의 계약을 체결했다는 보도가 나온 상황에서, 이번 사내 AI 모델 출시는 일부 관계자들에게 충격적일 수 있습니다. 그러나 이러한 모델 출시는 Windsurf가 단순 애플리케이션 개발에 그치지 않고, 해당 애플리케이션 구동에 필요한 모델 자체 개발 영역으로 확장하고 있음을 시사합니다.
Windsurf에 따르면, 이 중 가장 크고 성능이 뛰어난 AI 모델인 SWE-1은 내부 프로그래밍 벤치마크에서 Claude 3.5 Sonnet, GPT-4.1, Gemini 2.5 Pro 등과 경쟁할 만한 성능을 보였습니다. 하지만 소프트웨어 엔지니어링 작업 면에서는 Claude 3.7 Sonnet과 같은 최첨단 AI 모델에 미치지 못하는 것으로 나타났습니다.
Windsurf는 자사 SWE-1-lite와 SWE-1-mini 모델은 플랫폼 사용자 모두에게 유료 및 무료로 제공될 것이라고 밝히면서도, SWE-1 모델은 유료 사용자에게만 제공된다고 안내했습니다. Windsurf는 SWE-1 모델에 대한 구체적인 가격은 즉시 발표하지 않았으나, Claude 3.5 Sonnet 대비 서비스 제공 비용이 더 저렴하다고 주장했습니다.
Windsurf는 AI 챗봇과의 대화를 통해 코드 작성 및 편집이 가능한 도구로 가장 잘 알려져 있으며, 이 방식을 "바이브 코딩(vibe coding)"이라 부릅니다. 다른 인기 있는 바이브 코딩 스타트업으로는 이 분야 최대 규모인 Cursor와 Lovable 등이 있습니다. Windsurf를 포함한 대다수의 스타트업들은 전통적으로 OpenAI, Anthropic, Google의 AI 모델에 의존하여 서비스를 구동해 왔습니다.
SWE 모델 발표 영상에서 Windsurf의 연구 책임자 Nicholas Moy가 언급한 코멘트는 Windsurf가 차별화된 접근 방식을 시도하고 있음을 강조합니다. 모이는 "오늘날의 최첨단 모델들은 코딩에 최적화되어 있으며, 지난 몇 년간 엄청난 발전을 이루었다"면서도, "하지만 우리에게는 그것만으로는 충분하지 않습니다. 코딩이 소프트웨어 엔지니어링 그 자체는 아닙니다"라고 말했습니다.
Windsurf는 블로그 게시물을 통해 다른 모델들이 코드를 작성하는 데는 능하지만, 프로그래머가 종종 수행하는 터미널, IDE, 인터넷 등 여러 작업 영역(multiple surfaces) 사이를 오가며 작업하는 데 어려움을 겪는다고 지적했습니다. 이 스타트업은 SWE-1이 새로운 데이터 모델과 "불완전한 상태, 장기 실행 작업, 그리고 여러 표면을 포괄하는 훈련 레시피"를 통해 훈련되었다고 설명했습니다.
Windsurf는 SWE-1을 "최초의 개념 증명(initial proof of concept)"으로 규정하며, 향후 더 많은 AI 모델을 출시할 가능성을 시사했습니다.
[출처:] https://techcrunch.com/2025/05/15/vibe-coding-startup-windsurf-launches-in-house-ai-models