• 메타, 음성 및 번역 AI 개선 프로그램 출시

    article image

    메타(Meta)는 유네스코(UNESCO)와 협력하여 음성 녹음 및 전사 자료를 수집하는 새로운 프로그램을 시작한다고 밝혔습니다. 이 프로그램은 향후 공개적으로 접근 가능한 인공지능(AI) 개발에 기여할 것으로 예상됩니다.

    ‘언어 기술 파트너 프로그램(Language Technology Partner Program)’이라는 이름의 본 프로그램은 협력자들로부터 ‘다양한 언어’로 된 음성 녹음 및 전사 자료 10시간 이상, 대량의 서면 텍스트, 그리고 번역 문장 세트를 기여받고자 합니다. 메타에 따르면, 참여 파트너들은 회사 AI 팀과 협력하여 기여된 언어들을 AI 음성 인식 및 번역 모델에 통합하는 역할을 맡게 되며, 이 모델들은 최종적으로 오픈 소스로 공개될 예정입니다.

    현재 파트너로는 캐나다 북부의 인구 밀도가 낮은 지역인 누나부트(Nunavut) 정부가 포함되었습니다. 누나부트 거주민 일부는 인쿽투트(Inuktut)로 통칭되는 인트위트어(Intuit languages)를 사용합니다.

    메타는 테크크런치(TechCrunch)에 제공한 블로그 게시물에서 “저희 노력은 특히 유네스코의 활동을 지원하는 소외된 언어에 초점을 맞추고 있습니다. 궁극적으로 저희의 목표는 언어적 혹은 문화적 배경에 관계없이 복잡한 인간의 요구를 이해하고 응답할 수 있는 지능형 시스템을 만드는 것입니다”라고 전했습니다.

    한편, 메타는 이 새로운 프로그램과 더불어 언어 번역 모델의 성능을 평가하기 위한 ‘오픈 소스 기계 번역 벤치마크(open source machine translation benchmark)’를 공개한다고 밝혔습니다. 언어학자들이 제작한 문장으로 구성된 이 벤치마크는 7개 언어를 지원하며, AI 개발 플랫폼 허깅 페이스(Hugging Face)를 통해 접근하고 기여할 수 있습니다.

    메타는 이 두 가지 이니셔티브를 모두 자선적 활동의 성격으로 포장하고 있지만, 사실 회사는 이 과정을 통해 업그레이드된 음성 인식 및 번역 모델로부터 막대한 이익을 얻게 될 전망입니다.

    메타는 AI 기반 비서인 메타 AI(Meta AI)가 지원하는 언어 수를 꾸준히 확대하고 있으며, 크리에이터를 위한 자동 번역과 같은 기능을 테스트하고 있습니다. 지난 9월, 메타는 인스타그램 릴스(Instagram Reels)의 음성을 번역하는 도구 테스트를 시작한다고 발표했는데, 이 기능을 통해 크리에이터들은 자신의 음성을 더빙하고 자동으로 입 모양까지 동기화할 수 있게 되었습니다.

    메타가 플랫폼 전반에서 영어가 아닌 언어로 콘텐츠를 관리하는 방식은 그동안 많은 비판을 받아왔습니다. 한 보고서에 따르면, 페이스북은 이탈리아어와 스페인어 코로나19 허위 정보의 약 70%에 달하는 내용을 플래그 지정하지 않은 반면, 유사한 영어권 허위 정보는 29%에 그쳤습니다. 또한 회사에서 유출된 문서에는 아랍어 게시물이 정기적으로 혐오 발언으로 잘못 플래그 지정된 사례가 드러나기도 했습니다.

    이에 대해 메타는 번역 및 콘텐츠 중재 기술을 개선하기 위한 조치를 취하고 있다고 밝힌 바 있습니다.

    [출처:] https://techcrunch.com/2025/02/07/meta-launches-new-program-to-improve-speech-and-translation-ai