구글은 금요일 자체 발표를 통해 Gemini의 최신 심층 리서치 모드를 40개 언어로 확장한다고 밝혔습니다.
이 회사는 이달 초에 해당 심층 리서치 모드를 출시했으며, 이 기능을 통해 Google One AI 프리미엄 플랜 사용자는 AI 기반의 연구 조교 역할을 하는 기능을 이용할 수 있게 되었습니다. 이 심층 기능은 리서치 계획 수립부터 관련 정보 검색에 이르기까지 다단계 방식을 따릅니다. 이후 도구는 이 정보를 바탕으로 재차 검색을 수행하여 지식을 추출합니다. 이러한 과정을 여러 차례 반복한 후, 최종적으로 보고서를 생성하게 됩니다.
현재 Gemini가 지원하는 언어에는 아랍어, 벵골어, 중국어, 덴마크어, 프랑스어, 독일어, 구자라트어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 칸나다어, 한국어, 말라얄람어, 마라티어, 폴란드어, 포르투갈어, 스와힐리어, 스페인어, 타밀어, 텔루구어, 타니어, 우크라이나어, 우르두어 등이 포함되어 있습니다.
구글에게 주어진 과제는 특정 언어에서 신뢰할 수 있는 출처를 찾아내고, 이를 원어민 언어로 문법적 오류 없이 요약하는 것입니다.
구글 Gemini 앱의 엔지니어링 책임자인 최현정(HyunJeong Choe)은 지난 12월 초 TechCrunch와의 대화에서, 회사가 모델을 깨끗한 데이터와 신뢰할 수 있는 출처를 이용해 훈련시키고 있음에도 불구하고, 힌디어와 같은 원어민 언어로 된 구글 AI 개요의 요약본에서 부정확성이 나타나는 경향이 있다고 언급했습니다.
최 씨는 "저희는 일반적으로 원어민 출처 데이터에 의존하며, 또한 백엔드에서 구글 검색을 활용해 해당 정보를 근거로 삼습니다. 게다가 모델을 출시하기 전, 원어민 언어 데이터로 평가와 사실 확인을 진행합니다"라고 설명했습니다.
그는 이어 "정확한 정보를 얻는 '사실성(Factuality)'은 생성형 AI 전반에서 잘 알려진 연구 문제입니다. 비록 모델이 사전 훈련 과정에서 방대한 정보를 이미 지니고 있지만, 저희는 모델이 이 정보를 올바른 방식으로 사용하도록 훈련시키는 데 중점을 두고 있습니다"라고 덧붙였습니다.
Gemini 앱의 국제 시장 제품 리드를 맡고 있는 줄스 월터(Jules Walter)는 회사가 네이티브 관점에서의 품질 검사를 받기 위한 테스트 프로그램을 운영하고 있다고 밝혔습니다. 그는 또한 모델 훈련을 위해 데이터를 생성할 뿐만 아니라, 지역 팀들이 이 데이터셋을 검토하는 과정을 거친다고 덧붙였습니다.
한편, 이번 주 초 TechCrunch는 Gemini 개선 작업을 위해 응답 평가를 수행하는 계약 업체가 구글의 가이드라인을 준수하는 과정에서, 계약자들이 전문 지식 수준에 관계없이 프롬프트 응답 건너뛰기가 더 이상 허용되지 않는다는 보도를 했습니다.
이 보도가 공개된 후, 구글 대변인은 계약자들이 단순히 콘텐츠 내용만 평가하는 것이 아니라 스타일, 형식, 그리고 기타 요인들까지 살펴보는 업무를 수행한다고 밝혔습니다.
TechCrunch에서는 AI 중심의 뉴스레터를 받아볼 수 있습니다!
매주 수요일에 받아보려면 여기서 가입하세요.
[출처:] https://techcrunch.com/2024/12/20/google-is-expanding-geminis-in-depth-research-mode-to-40-languages