XDNA 2 NPU용 오프라인 이미지 생성기.

AMD는 Stability AI와의 협력을 통해, 자사의 XDNA 2 NPU에 맞춰 개발된 업계 최초의 Stable Diffusion 3.0 Medium AI 모델을 공개했습니다. 이 모델은 BF16 형식으로 데이터를 처리하며, AMD의 Ryzen AI 기반 노트북에서 로컬 구동이 가능하도록 설계되었으며, 현재 Amuse 3.1을 통해 사용 가능합니다.
해당 모델은 Stable Diffusion 3.0 Medium을 기반으로 하는 텍스트-이미지 생성기입니다. BF16 정밀도에 최적화되어 XDNA 2 NPU를 탑재한 장치에서 로컬로 실행되도록 설계되었으며, 맞춤형 스톡 수준의 비주얼을 생성하는 데 적합하여 디자인 및 마케팅 애플리케이션에 활용할 수 있습니다. 모델은 작성된 프롬프트를 해석하여 1024×1024 크기의 이미지를 생성한 후, 내장 NPU 파이프라인을 사용하여 이를 2048×2048 해상도로 업스케일링함으로써 4MP 출력물을 제공합니다. AMD는 이 출력이 인쇄 및 전문적인 용도에 적합하다고 강조합니다.
이 모델을 사용하려면 AMD Ryzen AI 300 시리즈 또는 Ryzen AI MAX+ 프로세서, 최소 50 TOPS 이상의 XDNA 2 NPU, 그리고 최소 24GB의 시스템 RAM을 갖춘 PC가 필수입니다. 이는 모델 자체만 생성 과정에서 9GB의 메모리를 사용하기 때문입니다.
이 모델의 가장 큰 장점은 전적으로 온디바이스(On-device)로 구동된다는 점입니다. 별도의 인터넷 연결이나 클라우드 서비스 없이 빠르고 오프라인으로 이미지 생성이 가능합니다. 본 모델은 맞춤형 이미지가 필요한 콘텐츠 크리에이터와 디자이너를 주요 사용 대상으로 하며, 이미지 구도에 대한 정밀한 제어를 지원하는 고급 프롬프팅 기능이 지원됩니다. AMD는 예시를 제공하며, 투칸을 위한 프롬프트는 다음과 같습니다.
"Close up, award-winning wildlife photography, vibrant and exotic face of a toucan against a black background, focusing on the colorful beak, vibrant color, best shot, 8k, photography, high res."
모델 사용을 위해서는 최신 AMD Adrenalin Edition 드라이버와 Tensorstack의 Amuse 3.1 Beta 소프트웨어를 설치해야 합니다. 설치 후, 사용자는 Amuse를 열고 EZ Mode로 전환한 뒤, 슬라이더를 HQ로 이동시키고 'XDNA 2 Stable Diffusion Offload' 옵션을 활성화해야 합니다.
이 모델의 사용은 Stability AI Community License의 적용을 받습니다. 개인 및 연간 매출 100만 달러 미만 소규모 기업에게는 무료로 제공되지만, 라이선스 약관은 추후 변경될 수 있습니다. 사용에 참고하실 점은 Amuse가 아직 베타 버전이라는 점이므로, 안정성이나 성능은 다소 차이가 있을 수 있다는 것입니다.
최신 뉴스, 분석 및 리뷰를 위해 Tom's Hardware를 Google News에서 팔로우하시고, '팔로우' 버튼을 클릭해 주시기 바랍니다.