• 구글, 과거 뉴스 보도와 AI를 활용해 돌발 홍수 예측에 나선다

    돌발 홍수는 세계에서 가장 치명적인 기상 이변 중 하나로, 매년 5,000명 이상의 사상자를 발생시킵니다. 동시에 예측하기 가장 까다로운 재난이기도 합니다. 하지만 구글은 뉴스를 읽는 비전형적인 방식으로 이 문제의 해법을 찾았다고 공개했습니다.

    인간은 방대한 양의 기상 데이터를 축적해 왔지만, 돌발 홍수는 기온 변화나 강물의 흐름처럼 장시간 추적할 수 있는 현상이 아니어서 포괄적으로 측정하기가 매우 어렵습니다. 이러한 데이터 공백(data gap) 때문에, 기상 예측 능력이 점점 높아지고 있는 심층 학습 모델들조차 돌발 홍수를 예측하는 데 한계가 있었습니다.

    구글 연구진은 이 문제를 해결하기 위해 구글의 대규모 언어 모델(LLM)인 Gemini를 활용하여 전 세계의 뉴스 기사 5백만 건을 분석했습니다. 그 결과, 다양한 홍수 보고서 260만 건을 추출해내어, 이를 **'Groundsource'**라는 지리 태그가 달린 시계열 데이터로 구축했습니다. 구글 리서치 제품 관리자인 Gila Loike에 따르면, 이는 구글이 언어 모델을 이러한 유형의 작업에 적용한 최초의 사례입니다. 이 연구와 데이터셋은 목요일 오전에 공개되었습니다.

    연구진은 Groundsource를 실제 기준선(real-world baseline)으로 삼아, 장단기 기억(Long Short-Term Memory, LSTM) 신경망을 기반으로 모델을 훈련시켰습니다. 이 모델은 전 세계 기상 예보를 입력받아 특정 지역의 돌발 홍수 발생 확률을 생성합니다.

    구글의 돌발 홍수 예측 모델은 현재 구글 플랫폼에서 150개국 도시 지역의 위험을 시각화하고, 전 세계 긴급 대응 기관들과 관련 데이터를 공유하고 있습니다. 구글과 함께 예측 모델을 시험한 남부아프리카개발 공동체(Southern African Development Community)의 긴급 대응 관계자 안토니우 조제 베레자(António José Beleza)는 이 모델 덕분에 소속 기관이 홍수 상황에 더 신속하게 대응할 수 있었다고 전했습니다.

    다만, 이 모델에는 여전히 몇 가지 한계가 존재합니다. 첫째, 해상도가 비교적 낮아 20제곱킬로미터 면적 단위로 위험을 식별한다는 점입니다. 둘째, 구글의 모델은 강수량을 실시간으로 추적할 수 있는 현지 레이더 데이터를 통합하지 못하여, 미국 국립 기상청의 홍수 경보 시스템만큼의 정밀도를 갖추기는 어렵습니다.

    하지만 이 프로젝트의 핵심은 지역 정부가 고가(高價)의 기상 감지 인프라에 투자할 여력이 부족하거나, 기상 데이터 기록 자체가 충분하지 않은 지역에서도 작동하도록 설계되었다는 점입니다.

    구글 리질리언스(Resilience) 팀의 프로그램 관리자인 줄리엣 로텐버그(Juliet Rothenberg)는 이번 주 기자들에게 "수백만 건의 보고서를 통합함으로써, Groundsource 데이터셋은 사실상 지도를 재정립하는 데 도움을 줍니다. 정보가 부족한 다른 지역으로도 추론 범위를 확장할 수 있게 해줍니다"라고 설명했습니다.

    로텐버그는 팀이 LLM을 활용하여 서술된 정성적 자료에서 정량적 데이터셋을 개발하는 방법을, 열파나 산사태와 같이 예측하기에 중요하지만 일시적인 다른 현상의 데이터셋을 구축하는 데 적용할 수 있기를 기대한다고 덧붙였습니다.

    수력 발전소와 같은 고객을 위해 유사한 심층 학습 모델을 이용해 강물 흐름을 예측하는 회사 CEO인 마샬 무테노(Marshall Moutenot)는 구글의 기여가 심층 학습 기반 기상 예측 모델을 위한 데이터 축적 노력의 일환이라고 평가했습니다. 무테노는 연구원과 스타트업을 위해 머신러닝 준비가 된 기상 데이터를 큐레이션하는 그룹인 dynamical.org의 공동 창립자이기도 합니다.

    무테노는 "데이터 희소성은 지구물리학에서 가장 어려운 과제 중 하나입니다. 동시에 방대한 지구 데이터가 존재하지만, 이를 진실값과 비교하여 평가하려 할 때는 충분한 데이터가 없습니다. 구글의 접근 방식은 이러한 데이터를 얻기 위한 매우 독창적인 방법이었습니다"라고 말했습니다.

    [출처:] https://techcrunch.com/2026/03/12/google-is-using-old-news-reports-and-ai-to-predict-flash-floods