엔비디아, AI가 10개월에 걸쳐 8명의 엔지니어가 수행하는 GPU 설계 작업을 하룻밤 작업으로 단축했다고 밝혀 — 회사는 아직 인간의 입력 없이 칩을 설계하는 AI와는 '아직 멀었다'

hw_reporter

엔비디아, AI가 칩 설계 프로세스를 가속화하는 방법 공개.

엔비디아는 인공지능(AI)을 칩 설계 프로세스의 모든 단계에 도입하여 개발 시간을 획기적으로 단축하고 있다고 밝히고 있습니다. 특히 주목할 만한 점은, 과거 8명의 엔지니어가 10개월에 걸쳐 완료해야 했던 표준 셀 라이브러리 포팅 작업이 이제 단일 GPU만으로 하룻밤 만에 끝낼 수 있게 되었다는 것입니다. 다만, 회사의 최고 과학자인 윌리엄 달리(William Dally)는 AI가 아직 프로세서 전체를 완전히 설계할 단계에는 이르지 못했다고 덧붙였습니다.

데스크톱 로드맵
엔터프라이즈 로드맵
루빈 심층 분석

달리는 구글의 제프 딘(Jeff Dean)에게 "저희는 디자인 프로세스 전반에 걸쳐 AI를 활용하려고 노력하고 있습니다. '새로운 GPU를 설계해 줘'라고 단순히 지시할 수 있는 엔드투엔드(end-to-end) 단계가 있으면 좋겠지만, 아직은 갈 길이 멉니다"라고 말했습니다.

달리에 따르면, 엔비디아는 이미 회로 수준의 최적화부터 시스템 수준의 탐색에 이르기까지 칩 설계의 여러 단계에서 AI를 활용하고 있으며, 그 결과 생산성이 수 배 증가했으며, 일부 영역에서는 인간의 역량을 뛰어넘는 결과까지 달성했다고 합니다.

엔비디아는 AI 덕분에 이전에 비해 3배 많은 양의 코드를 생산하고 있습니다.
엔비디아는 AI 발전 덕분에 패스 트레이싱(path tracing) 성능이 100만 배 향상될 것이라고 약속했습니다.

가장 기초적인 수준에서 AI는 이미 신규 제조 공정으로 전환할 때 가장 많은 시간이 소요되는 단계 중 하나인 표준 셀 개발 분야에 혁신을 가져왔습니다. 달리는 약 2,500~3,000개 셀로 구성된 표준 셀 라이브러리를 포팅하는 작업은 이전에 8명의 엔지니어가 약 10개월 동안 수행해야 했습니다. 하지만 엔비디아는 이 작업을 NB-Cell이라는 강화 학습(reinforcement learning) 시스템으로 대체했으며, 이제 이 시스템은 단일 GPU로 동일한 작업을 하룻밤 만에 완료할 수 있습니다.

한층 높은 수준에서는 엔비디아가 자체 개발한 모든 GPU를 아우르는 독점 아키텍처 문서를 기반으로 훈련된 내부 대규모 언어 모델(LLM)인 칩 네모(Chip Nemo)와 버그 네모(Bug Nemo)를 개발했습니다. 이 LLM들은 주니어 설계자들에게 복잡한 하드웨어 블록의 작동 원리를 설명해 주는 엔지니어링 비서 역할을 수행할 수 있게 했습니다. 그 결과, 엔비디아는 과거에는 LLM이 처리할 수 없는 일이라 생각하여 선임 엔지니어들에게 의존할 필요가 없어졌습니다.

달리는 "저희는 칩 네모와 버그 네모라는 일련의 LLM을 갖고 있었습니다. 저희는 일반적인 LLM을 가져와 엔비디아의 독점 디자인 문서 전체를 입력하여 미세 조정(fine-tuned)했습니다"라며, "따라서 이 내용은 외부에서는 구할 수 없습니다. 모든 RTL(Register-Transfer Level), 하드웨어 설계 문서, 엔비디아가 제작한 모든 GPU의 RTL, 그리고 그 아키텍처 사양 등이 포함되어 있습니다. 이제 GPU 설계에 매우 능통한 LLM을 갖게 된 것입니다. 주니어 설계자가 칩 네모에게 질문하면, 칩 네모가 [GPU가 어떻게 작동하는지] 설명해 줍니다. 이는 생산성을 향상시키는 방법이며, 매우 인내심 있는 멘토인 셈입니다"라고 말했습니다.

셀 라이브러리 작업과 엔지니어링 지원을 넘어, 엔비디아는 고전적인 회로 설계 문제에도 강화 학습을 적용하고 있습니다. 예를 들어, RL 기반 시스템은 시행착오를 거치며 설계 옵션을 탐색하고, 이러한 접근법을 통해 면적, 전력, 성능 면에서 인간이 달성하는 결과를 뛰어넘는 칩 설계를 인간보다 빠르게 만들어내는 데 도움을 줍니다.

달리는 "인간이 상상할 수 없는 완전히 기발한 설계를 제시하지만, 실제로는 인간이 만든 설계보다 20% 또는 30% 더 우수합니다"라고 언급했습니다.

또한, 엔비디아는 배치 및 라우팅(place and route) 작업에 AI를 활용하는 것 외에도 아키텍처 설계 탐색에 AI를 사용합니다.

특히 엔비디아의 에이전트 기반 시스템은 방대한 실험을 수행하고, 다양한 설계 방향을 평가하며, 실제로 실현 가능한 구성을 좁혀 나갑니다. 이는 엔지니어들이 여러 아키텍처적 트레이드오프 사이에서 결정해야 하는 칩 개발 주기 초기 단계의 의사 결정을 크게 가속화합니다.

마지막으로, 엔비디아는 칩 개발 주기에서 가장 긴 단계 중 하나인 설계 검증(design verification)에도 AI를 활용합니다. 그럼에도 불구하고 AI가 전체 검증 과정을 전적으로 책임질 수는 없기 때문에, 엔비디아는 자신의 설계를 시뮬레이션하고 실제 실험을 진행하여 모든 것이 정상적으로 작동하는지 확인해야 합니다.

달리는 "저희는 '설계 검증'이라는 매우 긴 병목 구간을 줄이고 싶습니다"라며, "특히 AI를 활용하여 설계가 더 빠르고 확실하게 작동함을 증명하는 방법을 모색하고 있습니다"라고 말했습니다.

장기적으로 엔비디아의 수석 과학자는 칩 개발이 전문화된 AI 시스템들이 마치 인간 팀처럼 설계의 여러 부분을 분담하는 다중 에이전트 모델(multi-agent model)로 전환될 것으로 예상합니다. 현재로서는 AI가 엔지니어의 작업을 보조하고 설계 품질을 인간이 달성할 수 있는 수준을 뛰어넘게 함으로써 개발 시간을 단축시키는 역할을 하며, 이는 결과적으로 엔지니어들이 이전보다 훨씬 더 많은 설계 옵션을 탐색할 수 있도록 합니다.

최신 뉴스와 분석, 리뷰를 받아보려면 구글 뉴스에서 Tom's Hardware를 팔로우하거나 즐겨찾는 출처로 추가하세요.

[출처:] https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-says-ai-cuts-10-month-eight-engineer-gpu-design-task-to-overnight-job-company-is-still-a-long-way-from-ai-designing-chips-without-human-input