
파운데이션 모델의 중요성은 과연 어느 정도일까?
이 질문은 다소 엉뚱하게 들릴 수 있지만, AI 스타트업들과 나눈 대화에서 빈번하게 나오는 주제입니다. 요즘 스타트업들은 이전에 "GPT 래퍼(GPT wrappers)"로 치부되던 비즈니스나 ChatGPT와 같이 기존 AI 모델 위에 인터페이스를 구축하는 회사들에 대해서도 점차 자신감을 얻고 있습니다.
최근 스타트업 팀들은 특정 작업과 인터페이스 개발에 맞게 AI 모델을 커스터마이징하는 데 집중하며, 파운데이션 모델 자체를 필요할 때 교체할 수 있는 단순한 '상품(commodity)'으로 간주하고 있습니다. 이러한 접근 방식은 특히 지난주 BoxWorks 컨퍼런스에서 명확히 드러났는데, 해당 컨퍼런스는 AI 모델 기반의 사용자 대면(user-facing) 소프트웨어에만 전적으로 초점을 맞춘 듯했습니다.
이러한 변화의 배경에는 사전 학습(pre-training)의 확장성(scaling benefits)이 둔화되고 있다는 요인이 있습니다. 사전 학습이란 AI 모델을 방대한 데이터셋으로 훈련하는 초기 과정이며, 이는 오직 파운데이션 모델의 영역입니다. 이것이 AI 기술 발전이 멈췄다는 의미는 아니지만, 초거대 파운데이션 모델의 초기 이점이 수확 체감 구간(diminishing returns)에 접어들었음을 의미합니다.
나아가, 스타트업들은 핵심 로직에 집중하고, 그 기반 위에서 모델을 활용하는 데 주력하고 있습니다.
이러한 추세는 모델을 API 형태로 활용하여 자체 서비스에 통합하는 방식으로 나타나고 있습니다.
따라서, 서비스의 핵심 경쟁력은 모델 자체의 크기나 학습 데이터의 양이 아니라, 이 모델을 어떻게 창의적으로 조합하고 사용자 경험을 설계하는지에 집중되고 있습니다.
결과적으로, 모델 자체가 아닌 서비스 레이어의 가치가 중요해지면서, 경쟁은 모델 자체의 성능을 넘어 사용 편의성과 비즈니스 워크플로우에 깊숙이 통합되는 경험으로 이동하고 있습니다.
이러한 변화는 클라우드 서비스 제공업체들이 더욱 범용적인 모델을 제공하고, 개발자들이 쉽게 조합할 수 있는 API 환경을 구축하는 추세를 더욱 가속화하고 있습니다.