• 컨버지 바이오, 바이오테크 LLM용 '종합 스토어'로 550만 달러 시드 투자 유치

    article image

    AI는 생명공학 및 제약 연구의 모든 영역으로 스며들고 있지만, 다른 산업과 마찬가지로 원하는 만큼 쉽고 매끄럽게 구현하기는 어려운 부분이 있습니다.

    [회사 이름 생략됨]은 기업들이 바이오 분야에 특화된 LLM(대규모 언어 모델)을 실제로 활용할 수 있도록 하는 도구를 구축했습니다. 이 도구는 데이터 ‘풍부화’부터 답변의 근거 설명에 이르기까지 다양한 기능을 포괄합니다. 이 회사는 제품 확장을 위해 시드 라운드에서 550만 달러를 유치했습니다.

    도브 거츠(Dov Gertz) CEO 겸 공동 창업자는 "모델 자체는 그저 모델일 뿐입니다. 그것만으로는 충분하지 않습니다. 회사들이 모델을 자체 R&D 프로세스에 실제로 통합할 수 있는 파이프라인이 구축되어야 합니다. 시장은 매우 파편화되어 있지만, 제약 및 생명공학 분야는 이 기술을 하나의 곳에서 통합적으로 소비하기를 원합니다. 저희가 바로 그 중심이 되고자 합니다"라고 말했습니다.

    약물 발견 분야에서 일하는 머신러닝 엔지니어가 아니라면 이 문제가 낯설 수 있습니다. 하지만 기본적으로 책이나 인터넷 데이터가 아닌, DNA, 단백질 구조, 유전체학 등 방대한 생물학적 데이터베이스로 훈련된 강력한 기반 모델(foundational models), 즉 대규모 언어 모델이 존재합니다.

    이러한 모델들은 강력하고 다재다능하지만, ChatGPT나 Cursor 같은 상용 제품에서 사용되는 LLM처럼, 사람들이 매일 사용할 수 있는 형태로 다듬는 데 상당한 작업이 필요합니다. 이러한 작업의 난이도는 미생물학이나 면역학 같은 전문 도메인(domain)일수록 더욱 높습니다. 수십억 개의 단백질 서열로 훈련된 '원시' LLM을 실험실 기술자가 일상 연구 과정의 일부로 활용할 수 있게 만드는 것은 결코 단순한 과정이 아닙니다.

    예를 들어, 거츠는 항체 연구를 예로 들었습니다. 항체 특이적 생물학 데이터로 훈련된 LLM은 존재하지만, 그 지식 범위가 너무 광범위하고 일반적입니다. Converge Bio는 기업이 자체 보유한 IP(지식재산)를 활용하여 안전하게 수행할 수 있는 일련의 개선 방안을 제공합니다.

    왼쪽부터: Converge Bio의 이도 와이너(Iddo Weiner), 최고 과학 책임자(CSO); 도브 거츠(Dov Gertz), CEO; 오데드 칼레브(Oded Kalev), CTO.

    오머 하코헨(Omer Hacohen) / Converge Bio

    이러한 프로세스에는 데이터 최적화와 구조화가 포함됩니다. 이 회사들은 항체와 같은 특정 단백질에 대한 지식을 결합하여 사용자 맞춤형으로 모델을 개선합니다.

    이러한 과정을 통해, 기업은 연구의 효율성을 높이고, 가장 성공 가능성이 높은 분야에 집중할 수 있게 됩니다.

    article image

    이 회사는 연구 과정을 최적화하고, 가장 성공 가능성이 높은 분야에 연구 개발 리소스를 집중하도록 돕습니다.

    궁극적으로는, 이러한 프로세스를 통해 의약품 개발 주기 전체를 단축시키고, 전 세계의 과학자들이 보다 빠르고 효율적으로 혁신적인 치료법을 개발할 수 있도록 합니다.


    [출처:] https://techcrunch.com/2024/11/20/converge-bios-everything-store-for-biotech-llms-brings-in-5-5m-seed