방대한 데이터 세트로 훈련된 대규모 언어 모델(LLM)은 유전체 연구를 가속화하고, 임상 문서화 작업을 간소화하며, 실시간 진단을 개선하고, 임상 의사 결정을 지원하며, 신약 개발을 가속화할 뿐만 아니라, 실험 발전을 위해 합성 데이터를 생성하는 데 활용될 수 있습니다.
하지만 생물의학 연구를 혁신할 것이라는 이 모델들의 잠재력은 종종 병목 현상에 직면합니다. 즉, 의료 분야가 의존하는 구조화된 데이터 범위를 넘어설 때, 특히 신뢰할 수 있고 대표성 있는 데이터가 부족한 희귀 질환이나 특이한 상태와 같은 엣지 케이스(edge cases)에서는 한계에 부딪힌다는 점입니다.
뉴욕에 본사를 둔 Mantis는 이러한 데이터 가용성 격차를 해소할 해결책을 개발하고 있다고 주장합니다. 이 회사의 플랫폼은 서로 다른 출처의 데이터를 통합하여 인간 신체의 이른바 "디지털 트윈(digital twin)"을 구축하는 데 사용되는 합성 데이터 세트를 제작합니다. 여기서 디지털 트윈이란 해부학, 생리학, 행동에 대한 물리 기반의 예측 모델을 의미합니다.
Mantis는 이 디지털 트윈을 데이터 통합 및 분석에 활용할 것을 제안합니다. 이 기술은 새로운 의료 절차 연구 및 테스트, 수술 로봇 훈련, 의료 문제나 행동 패턴 시뮬레이션 및 예측 등 다방면으로 응용될 수 있습니다. Mantis의 설립자이자 CEO인 조지아 위첼은 최근 테크크런치(TechCrunch) 인터뷰에서, 예를 들어 스포츠팀이 특정 NFL 선수가 최근 경기력, 훈련 부하, 식단, 활동 기간 등을 바탕으로 아킬레스건 부상을 입을 가능성을 예측할 수 있다고 설명했습니다.
이러한 디지털 트윈을 구축하는 과정에서 Mantis의 플랫폼은 먼저 교과서, 모션 캡처 카메라, 생체 인식 센서, 훈련 기록, 의료 영상 등 다양한 출처의 데이터를 수집합니다. 이후 LLM 기반 시스템을 활용하여 이 다양한 데이터 흐름을 정제하고, 검증하며, 통합한 뒤, 모든 정보를 물리 엔진을 거쳐 높은 충실도의 데이터 세트로 렌더링합니다. 이 데이터 세트는 궁극적으로 예측 모델을 훈련하는 데 사용됩니다.
위첼은 "우리는 이처럼 서로 다른 데이터 출처들을 모두 가져와 사람들의 수행 능력을 예측하는 모델로 만들 수 있습니다. 따라서 인간의 수행 능력을 예측하려는 모든 시점에서, 이는 저희 기술에 대한 매우 유효한 사용 사례입니다"라고 말했습니다.
위첼은 테크크런치와의 인터뷰에서 물리 엔진 계층이 핵심 역할을 한다고 설명했습니다. 이 엔진은 생성된 합성 데이터에 현실적인 근거를 부여하고, 해부학의 물리학적 원리를 사실적으로 모델링할 수 있게 해 주기 때문입니다.
나아가, Mantis는 데이터의 한계를 극복하고, 인간의 신체 움직임과 같은 데이터를 기반으로 예측 가능한 결과를 도출하는 데 특화되어 있습니다.
이러한 기술적 우위 덕분에, Mantis는 의료 및 운동 치료 분야에서 환자의 재활 정도와 운동 패턴을 정밀하게 분석하고, 최적화된 치료 계획을 수립하는 데 기여하고 있습니다.