
구글은 목요일에 Android 및 Chrome에 새로운 AI 및 접근성 기능을 출시한다고 발표했습니다. 그중 가장 주목할 만한 기능은 Android의 스크린 리더인 TalkBack이 이제 Gemini를 이용해 이미지 내용과 화면에 표시된 내용을 질문할 수 있게 되었다는 것입니다.
작년 구글은 시각 장애인 또는 저시력자가 Alt 텍스트가 없는 경우에도 AI가 생성한 이미지 설명을 활용할 수 있도록 TalkBack에 Gemini 기능을 도입했습니다. 이제 사용자는 이미지에 대해 질문하고 답변을 얻을 수 있습니다.
예를 들어, 친구가 새 기타 사진을 문자로 전송했을 경우, 해당 사진에 대한 설명을 듣고 브랜드나 색상에 대해 질문할 수 있습니다. 나아가 이제는 전체 휴대폰 화면에 대한 설명과 질의가 가능합니다. 따라서 앱에서 쇼핑할 때, 관심 품목의 소재나 할인 가능 여부 등을 Gemini에게 물어볼 수 있습니다.
구글은 또한 오늘 Android의 실시간 자막 기능인 Expressive Captions를 업데이트한다고 발표했습니다. 이 기능은 AI를 활용하여 사람이 무엇을 말했는지, 그리고 어떤 방식으로 말했는지를 포착합니다.
구글에 따르면, 사람들이 자신을 표현하는 방식 중 하나가 발성을 길게 늘이는 것이기 때문에, Expressive Captions에 새로운 지속 시간(duration) 기능이 추가되었습니다. 이제 스포츠 아나운서가 "amaaazing shot"을 외치는지, 혹은 단순히 "아니요"가 아니라 "아니이이이"라고 말하는지를 구분할 수 있습니다. 또한, 사람이 휘파람을 불거나 목을 가다듬는 등의 소리에도 새로운 라벨이 표시되기 시작할 예정입니다.
이 업데이트는 Android 15 이상을 실행하는 기기에서 미국, 영국, 캐나다, 호주를 대상으로 영어로 순차 출시됩니다.
또한 구글은 Chrome에서 PDF 파일에 접근하는 방식도 개선했습니다. 이전에는 데스크톱 Chrome 브라우저에서 스캔된 PDF 파일과 스크린 리더를 이용해 상호작용하기 어려웠습니다. 하지만 이제 Chrome은 이러한 유형의 PDF를 자동으로 인식하여, 다른 페이지와 마찬가지로 텍스트를 강조 표시하고, 복사하며, 검색할 수 있게 되었고, 스크린 리더로 읽을 수 있습니다. 구글에 따르면 이는 광학 문자 인식(Optical Character Recognition, OCR) 기능 덕분입니다.
추가적으로, Android용 Chrome의 Page Zoom 기능은 이제 웹페이지 레이아웃에 영향을 주지 않으면서 화면 텍스트 크기를 확대할 수 있게 합니다. 사용자는 원하는 확대 배율을 맞춤 설정한 후, 모든 방문 페이지에 적용할지 또는 특정 페이지에만 적용할지 선택할 수 있습니다. 이 기능은 Chrome 우측 상단의 세 점 메뉴를 탭하여 접근할 수 있습니다.