
신생 기업인 [회사 이름]이 '추론(reasoning)' 모드와 비추론(non-reasoning) 모드 간 전환이 가능한 오픈 AI 모델군을 공개하며 베일에 싸인 모습을 벗었습니다.
OpenAI의 모델에서 볼 수 있듯이, 추론 모델은 복잡한 문제를 단계별로 풀어가며 스스로 효과적으로 사실 확인을 할 수 있는 능력 덕분에 수학 및 물리학과 같은 분야에서 큰 잠재력을 보여왔습니다. 하지만 이러한 추론 기능은 비용(cost)을 수반합니다. 바로 높은 컴퓨팅 자원 소모와 지연 시간(latency) 증가입니다. 이러한 이유로 Anthropic과 같은 연구소들은 추론 구성 요소와 표준 비추론 요소를 결합한 '하이브리드' 모델 아키텍처를 개발하고 있습니다. 하이브리드 모델은 간단한 질문에는 빠르게 답하면서도, 더 어려운 질의에 대해서는 충분한 시간을 할애하여 심층적으로 고려할 수 있습니다.
Deep Cogito의 모든 모델은 Cogito 1이라는 이름의 하이브리드 모델입니다. Cogito는 이 모델들이 Meta와 중국 AI 스타트업 DeepSeek을 포함하여 같은 크기의 최고 오픈 모델들보다 성능이 우수하다고 주장합니다. 이 회사는 블로그 게시물을 통해 "각 모델은 직접 답변하거나, 추론 모델처럼 답변 전에 자체 반성을 거칠 수 있습니다"라고 설명했습니다. 또한 "[모든 모델은] 약 75일 만에 소규모 팀에 의해 개발되었습니다."
Cogito 1 모델은 30억 개에서 700억 개에 이르는 파라미터 규모를 갖추고 있으며, Cogito는 향후 몇 주에서 몇 달 동안 최대 6,710억 개 파라미터에 이르는 모델들이 추가될 것이라고 밝혔습니다. 파라미터는 모델의 문제 해결 능력을 대략적으로 나타내며, 일반적으로 파라미터 수가 많을수록 성능이 좋음을 의미합니다.
명확히 하자면, Cogito 1은 기성 모델을 처음부터 개발한 것이 아닙니다. Deep Cogito는 Meta의 오픈 Llama 모델과 Alibaba의 Qwen 모델을 기반으로 자체 모델을 구축했습니다. 이 회사는 기본 모델의 성능을 향상시키고 토글 가능한 추론 기능을 구현하기 위해 새로운 훈련 접근 방식을 적용했다고 전했습니다.
Cogito의 자체 벤치마킹 결과에 따르면, 가장 큰 Cogito 1 모델인 추론 기능이 활성화된 Cogito 70B는 일부 수학 및 언어 평가에서 DeepSeek의 R1 추론 모델보다 우수한 성능을 기록했습니다. 더욱이 추론 기능이 비활성화된 Cogito 70B는 범용 AI 테스트인 LiveBench에서 Meta가 최근 출시한 Llama 4 Scout 모델을 능가하는 성능을 보였습니다.
모든 Cogito 1 모델은 Fireworks AI와 Together AI와 같은 클라우드 제공업체에서 다운로드하거나 API를 통해 사용할 수 있습니다.
[타사 오픈 AI 모델과의 성능 비교]
Cogito는 블로그 게시물에서 "현재 우리는 전통적인 대규모 언어 모델의 사후/지속 훈련을 위해 일반적으로 할당되는 컴퓨팅 자원의 극히 일부만을 사용했기 때문에, 여전히 [성능] 스케일링 곡선의 초기 단계에 있습니다. 향후에도 자기 개선을 위한 보완적인 사후 훈련 방식을 연구하고 있습니다."라고 밝혔습니다.
캘리포니아 주에 제출된 서류에 따르면, 샌프란시스코에 본사를 둔 Deep Cogito는 2024년 6월에 설립되었습니다. 이 회사의 LinkedIn 페이지에는 공동 창립자 두 명인 Drishan Arora와 Dhruv Malhotra가 명시되어 있습니다. Malhotra는 이전에 Google AI lab DeepMind에서 생성형 검색 기술을 담당했던 프로덕트 매니저였으며, Arora는 Google의 선임 소프트웨어 엔지니어였습니다.
PitchBook에 따르면, South Park Commons 등이 후원하는 Deep Cogito는 "범용 초지능(general superintelligence)"을 구축하는 것을 야심차게 목표하고 있습니다. 창립자들은 이 문구를 '대부분의 인간보다 작업을 더 잘 수행하고 우리가 아직 상상하지 못한 완전히 새로운 능력을 발견할 수 있는 AI'로 해석하고 있습니다.
[출처:] https://techcrunch.com/2025/04/08/deep-cogito-emerges-from-stealth-with-hybrid-ai-reasoning-models