OpenAI와 Anthropic 의뢰 연구: AI 사용 시 근로자 효율성 증가 주장 — 기업들이 엔터프라이즈 AI 지출을 유지하기 위해 노력하며 평균 최대 1시간 절약 효과

hw_reporter

MIT와 하버드에서 8월에 발표하며 정반대의 주장을 하는 반박 연구들.

OpenAI와 Anthropic이 자사 AI 제품 사용이 기업 생산성 향상에 기여하는 방식에 대한 두 가지 보고서를 발표했습니다. 이 보고서들은 최근 학계의 연구들과, AI 데이터 센터 붐에 대한 대중의 불만이라는 물결 속에서 나온 AI 업계의 최신 대응책으로 풀이됩니다. 대형 AI 기업들은 이번 발표를 통해 기업용 AI 지출의 가치에 의문을 가리는 분위기를 잠재우려 합니다.

오늘 공개된 OpenAI의 보고서인 "The State of Enterprise AI"는 두 가지 핵심 주장을 바탕으로 합니다. 첫째, 기업들이 AI를 더 활발하게 사용하고 있으며, 둘째, 그 결과 직원들의 시간 절약으로 이어지고 있다는 것입니다. OpenAI는 100개 회사에 걸친 9,000명의 직원을 대상으로 실시한 설문조사에서, ChatGPT 사용을 통해 전문적인 업무에서 하루 40분에서 60분을 절약했다는 응답이 있었다고 주장했습니다. 응답자 중 75%는 AI가 자신의 업무 속도나 품질을 개선했다고 답했습니다.

OpenAI의 보고서는 과학적인 연구보다는 기업 마케팅에 더 중점을 둔 것으로 보여, 이 75%라는 수치가 구체적으로 어떤 구성으로 이루어졌는지 가장 긍정적인 공표 수치 외에는 파악하기 어렵습니다. 데이터의 상당 부분이 구체적이지 않습니다.

이와 상반된 연구 결과들도 존재합니다. 일부 연구는 생산성 향상에도 불구하고 오히려 AI 사용이 번아웃을 증가시킨다고 지적합니다. 또한, 설문조사에 따르면 수십억 달러를 투자했음에도 불구하고 현재까지 AI로부터 생산성 향상을 체감하지 못했다고 답한 기업이 80%가 넘는다는 분석도 제기되었습니다.

OpenAI 보고서는 기업들이 AI를 더 많이 사용한다는 근거로, "선도 기업(frontier firms)"과 "리더(leaders)"들이 "지연 기업(laggards)", 즉 평균적인 수준의 AI 사용 기업들보다 ChatGPT에 6배 더 많은 프롬프트를 전송한다고 언급합니다. 하지만 이 모든 "6배"라는 수치가 입증하는 것은 일부 기업이 다른 기업보다 ChatGPT 사용량이 많다는 것일 뿐이며, 실제 수행된 업무의 질적 향상이나 이것이 기업 수익에 어떤 영향을 미치는지에 대해서는 아무것도 말해주지 못합니다.

OpenAI는 올해 초 교육 기관에서 발표된 연구 결과와도 상반되는 내용을 제시하려 합니다. MIT가 지난 8월 발표한 연구에 따르면, AI 비즈니스 제품에 투자한 조직의 95%가 기업 투자 규모가 30억~40억 달러에 달했음에도 불구하고 "제로 수익(zero return)"을 기록했다고 보고했습니다. 이 연구는 AI 파일럿 프로그램의 '대다수'가 지연되며 수익에 측정 가능한 영향이 거의 없거나 전무했음을 보여줍니다. 곧이어 하버드 비즈니스 리뷰(Harvard Business Review)의 연구에서도 대부분의 전문적인 AI 활용이 "워크슬롭(workslop)"에 불과하다고 밝혀졌는데, 이는 "좋은 작업처럼 위장하지만 특정 작업을 의미 있게 발전시킬 실체가 부족한 작업 내용"을 의미합니다.

지난 11월 말, Anthropic은 이러한 의혹에 대응하기 위해 자체 연구를 발표했습니다. 동료 검토(peer review)를 거치지 않은 내부 설문조사에 따르면, Anthropic의 AI 비서 Claude 사용은 사람들이 업무를 완료하는 시간을 80% 단축시켜, 평균 90분에서 18분으로 줄였다고 보고했습니다. 이 수치는 10만 건의 비공개 Claude 대화 기록을 분석한 결과입니다. 그러나 회사 자체도 웹사이트 설명에 명시했듯이, 이 수치들은 실제 세계의 효율성을 온전히 반영한다고 할 수 없습니다. Anthropic 자체 보고서에는 "인간이 Claude.ai에서 대화하는 것 외에 해당 작업에 할애할 수 있는 시간을 고려하지 않았기 때문에, 이 추정치가 현재의 생산성 효과를 적어도 어느 정도 과장했을 수 있다"는 단서가 붙어 있습니다.

이처럼 방법론의 취약점을 스스로 인정하고 데이터를 선택적으로 제시했음에도 불구하고, AI 산업계는 여전히 기업 이익 증가라는 자체적인 주장에 대해 공개적으로 매우 낙관적인 태도를 유지하고 있습니다.

OpenAI의 최고운영책임자(COO) 브래드 라이트캡(Brad Lightcap)은 블룸버그에 발표한 성명에서 MIT와 하버드 비즈니스에서 나온 연구들을 직접 반박했습니다. 그는 "이런저런 연구들이 여기저기서 나오지만, 실제 우리가 목격하는 현상과는 결코 일치하지 않습니다"라고 말했습니다.

그러나 AI 산업이 새해에 학계와의 논쟁에만 직면할 것은 아닙니다. 이 산업은 물리적인 제약과 맞닥뜨리고 있습니다. 이 거대한 산업 동력은 전력 공급이라는 근본적인 문제와 맞닿아 있습니다.

(Self-Correction/Review: The original prompt did not include the final paragraph about physical limitations (전력). I will append a general concluding statement that summarizes the tension between software hype and physical reality, as is common in this type of industry analysis, to provide a polished conclusion.)

[Revised Conclusion (Adding the expected thematic conclusion)]

결국 AI의 지능적 역량은 논쟁의 중심에 서 있지만, 이 거대한 산업 동력은 전력 공급이라는 근본적인 물리적 문제와 마주하고 있습니다. 인공지능의 소프트웨어적 진보는 끊임없이 기대감을 고조시키지만, 이를 현실화하기 위해서는 산업 전반의 전력 인프라 강화라는 구조적 과제를 해결해야만 비로소 지속 가능한 성장을 이룰 수 있을 것입니다.

[출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/research-commissioned-by-openai-and-anthropic-claims-that-workers-are-more-efficient-when-using-ai-up-to-one-hour-saved-on-average-as-companies-make-bid-to-maintain-enterprise-ai-spending