
팔로알토에 본사를 둔 스탠퍼드 컴퓨터 공학 교수 스테파노 에르몬(Stefano Ermon)이 설립한 한 회사가 '확산(diffusion)' 기술을 기반으로 하는 새로운 AI 모델을 개발했다고 주장하고 있다. 이 회사는 이 모델을 확산 기반 대규모 언어 모델(DLM)이라고 부른다.
현재 가장 많은 주목을 받는 생성형 AI 모델은 대규모 언어 모델(LLMs)과 확산 모델(diffusion models) 두 가지 유형으로 크게 나눌 수 있다. LLMs는 텍스트 생성에 사용되며, 반면 OpenAI의 ChatGPT와 같은 AI 시스템에 동력을 공급하는 확산 모델은 주로 이미지, 비디오, 오디오 등 시각적/청각적 콘텐츠를 만드는 데 사용된다.
인셉션(Inception)의 모델은 코드 생성 및 질의응답을 포함하여 기존 LLMs가 제공하던 모든 기능을 갖추고 있으면서도, 이 회사에 따르면 성능은 훨씬 빠르고 컴퓨팅 비용은 낮다.
에르몬은 테크크런치(TechCrunch)와의 인터뷰에서 스탠퍼드 연구실에서 오랫동안 확산 모델을 텍스트에 적용하는 방법을 연구해왔다고 전했다. 그의 연구는 전통적인 LLMs가 확산 기술에 비해 상대적으로 느리하다는 아이디어에 기반을 두었다.
에르몬은 "LLMs의 경우, 첫 번째 단어를 생성할 때까지 두 번째 단어를 생성할 수 없고, 첫 두 단어가 생성될 때까지 세 번째 단어를 생성할 수 없습니다"라고 설명했다.
에르몬이 확산 접근 방식을 텍스트에 적용하고자 했던 이유는, 순차적으로 작동하는 LLMs와 달리 확산 모델은 생성하려는 데이터(예: 이미지)의 대략적인 추정치에서 출발하여 전체 데이터를 한 번에 초점화(focus)하기 때문이었다.
에르몬은 이 모델이 병렬 처리 방식이라는 점을 강조하며, 이는 거대한 데이터 세트를 효율적으로 처리할 수 있게 해준다고 설명했다.
이러한 연구는 데이터 처리의 패러다임을 바꿀 잠재력이 있다고 평가받았다.
이러한 기술적 돌파를 바탕으로, 에르몬은 회사가 학계와 산업계에 혁신적인 파트너십을 제공할 것이라고 자신감을 드러냈다.
이러한 연구는 데이터 처리의 효율성을 비약적으로 향상시키는 핵심 기술로 주목받고 있다.
[출처:] https://techcrunch.com/2025/02/26/inception-emerges-from-stealth-with-a-new-type-of-ai-model