구글은 화요일 Google I/O 2025 행사에서 저지연(low latency) 멀티모달 AI 경험인 'Project Astra'가 구글 검색(Search), Gemini AI 앱, 그리고 서드파티 개발사 제품 전반에 걸쳐 다양한 사용자 경험을 제공할 것이라고 발표했습니다.
특히 Project Astra는 구글 검색의 새로운 'Search Live' 기능에 핵심 기술로 사용됩니다. 사용자는 AI 기반 검색 기능인 'AI Mode'나 시각 검색 기능인 'Lens'를 이용할 때 'Live' 버튼을 클릭하여 스마트폰 카메라로 포착한 사물에 대해 질문할 수 있습니다. Project Astra는 실시간 비디오 및 오디오 데이터를 AI 모델로 스트리밍하여, 사용자의 질문에 대해 지연을 최소화한 답변을 제공합니다.
Project Astra는 Google I/O 2024에서 화제가 된 스마트 글래스 시연을 통해 처음 공개되었으며, 거의 실시간의 멀티모달 AI 기능을 선보이기 위해 Google DeepMind에서 개발되었습니다. 구글은 현재 삼성(Samsung) 및 워비 파커(Warby Parker)와 같은 파트너사들과 함께 Project Astra 스마트 글래스 구축을 진행하고 있다고 밝혔으나, 아직 확정된 출시 일정은 없습니다. 다만, 구글은 소비자 및 개발자를 위한 다양한 Project Astra 기반의 기능을 공개했습니다.
구글에 따르면, Project Astra는 개발자 대상의 API 엔드포인트인 Live API에 새로운 기능을 구현하며, 이는 Gemini와의 저지연 음성 상호 작용을 가능하게 합니다. 오는 화요일부터 개발자들은 오디오 및 비주얼 입력을 지원하고 네이티브 오디오 출력을 구현하는 경험을 구축할 수 있으며, 이는 Project Astra의 작동 방식과 매우 유사합니다. 구글은 또한 업데이트된 Live API에 향상된 감정 감지 기능이 포함되어 AI 모델의 응답이 더욱 적절해지며, Gemini의 추론 AI 모델에서 가져온 사고(thinking) 능력까지 포함한다고 설명했습니다.
구글은 Gemini 앱의 모든 사용자에게 Project Astra의 실시간 비디오 및 화면 공유 기능을 제공할 것이라고 밝혔습니다. 비록 Project Astra가 이미 Gemini Live의 저지연 대화를 지원하고 있지만, 이러한 시각적 입력 기능은 이전에는 유료 구독자에게만 제한되어 있었습니다.
구글은 Project Astra가 회사의 다양한 제품의 미래가 될 것이며, 심지어 완전히 새로운 제품군인 스마트 글래스까지 구동할 수 있다는 자신감을 표명했습니다. 이 기술이 궁극적인 가능성을 지니고 있음에도 불구하고, 구글은 지난해 시연된 Project Astra 스마트 글래스의 출시일은 아직 확정하지 않았습니다. 물론 구글이 해당 스마트 글래스의 디자인과 작동 방식에 대한 추가 세부 사항을 공개했으나, 현재로서는 시장 출시와는 거리가 있는 것으로 보입니다.
[출처:] https://techcrunch.com/2025/05/20/project-astra-comes-to-google-search-gemini-and-developers