딥시크(DeepSeek)의 새로운 AI 모델, 왜 ChatGPT라고 착각했을까

sw_reporter

이번 주 초, 자금력이 풍부한 중국 AI 기업 DeepSeek이 다수의 경쟁사들을 상대로 인기 벤치마크에서 뛰어난 성능을 보여준 '오픈' AI 모델을 출시했습니다. 이 모델인 DeepSeek V3는 크면서도 효율적이며, 코딩이나 에세이 작성 같은 텍스트 기반 작업들을 수월하게 처리합니다.

더 놀라운 점은, 이 모델이 마치 ChatGPT인 것처럼 행동한다는 것입니다. TechCrunch의 자체 테스트 결과에서도 DeepSeek V3는 자신을 OpenAI의 AI 기반 챗봇 플랫폼인 ChatGPT로 인식합니다. 심지어 상세히 설명해 달라고 요청받았을 때도, DeepSeek V3는 자신이 2023년에 출시된 OpenAI의 GPT-4 모델 버전이라고 주장합니다.

이러한 현상은 오늘날에도 반복적으로 관찰됩니다. DeepSeek V3는 8번의 생성 시도 중 5번에서 자신이 ChatGPT(v4)라고 주장하며, DeepSeek V3 자신으로만 자신을 명확하게 주장한 횟수는 3번에 불과했습니다.

(훈련 데이터 분포에 대한 대략적인 아이디어를 얻을 수 있습니다.)

https://t.co/Zk1KUppBQM

pic.twitter.com/xxxxx

AI가 기반이 되는 텍스트입니다.

또 다른 부분에서는, 사용자가 자연스러운 설명을 추가하는 방식으로 이용할 수 있습니다.

DeepMind의 연구원들은 "이러한 현상은 AI의 본질적인 작동 방식에 대한 논의를 자극하는 것 같습니다."라고 언급했습니다.

이러한 패턴은 모델이 학습한 데이터의 특징을 반영하며, 때로는 의도치 않은 방식으로 작동할 수 있습니다.

결론적으로, 이러한 패턴은 모델이 학습한 데이터의 특징을 반영하며, 때로는 의도치 않은 방식으로 작동할 수 있습니다.

[출처:] https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt