속도 향상은 올바른 방향으로의 큰 진전을 이끌어냅니다.

DNA에 디지털 콘텐츠를 저장하는 것은 분자의 높은 밀도, 내구성, 그리고 낮은 전력 소모를 활용하는 신흥 기술입니다. DNA는 수년 또는 수십 년 내에 성능이 저하되는 NAND 플래시나 하드디스크 드라이브(HDD)와 달리 수세기에 걸쳐 보존될 수 있다는 장점이 있습니다. 또한 일반적인 데이터 저장 시스템보다 약 1억 배 높은 데이터 용량을 제공합니다. 하지만 DNA 저장소에서 데이터를 검색하는 과정은 복잡하고 매우 느린 작업입니다. TechXplore 보도에 따르면, 이스라엘 연구진이 개발한 획기적인 방법이 이 처리 속도를 무려 3,200배 향상시킨 것으로 알려졌습니다.
테크니온-이스라엘 공과대학교(Technion – Israel Institute of Technology)의 한 연구팀은 DNA에 저장된 디지털 정보를 훨씬 빠르고 정확하게 검색할 수 있는 AI 도구를 개발했습니다. 'DNAformer'라는 이름의 이 시스템은 기존에 가장 정확했던 방법보다 3,200배 빠르며, 생체 물질을 활용한 효율적인 대규모 데이터 저장 가능성을 입증하는 우수한 결과를 보여주었습니다. 아직 상업적 시장에 적용하기에는 속도 면에서 개선할 여지가 남아있지만, 연구진은 이 기술이 올바른 방향으로 나아가고 있다고 자신합니다.
이 새로운 접근 방식은 기존 최적의 방법들을 이용해 며칠이 걸리던 작업을 단 10분 만에 100MB의 데이터를 처리할 수 있게 합니다. 3.1MB를 대상으로 진행된 테스트에서 이 도구는 다음과 같은 다양한 유형의 콘텐츠를 성공적으로 처리했습니다: 컬러 정지 이미지, 달에서 촬영한 닐 암스트롱의 짧은 음성 기록, DNA 저장 이점에 대한 텍스트, 그리고 암호화되거나 압축된 파일을 모방한 무작위 생성 데이터 등입니다.

데이터를 저장하기 위해 맞춤형 DNA 분자들이 합성됩니다. 이 정보를 읽어내려면 시퀀싱(sequencing) 과정이 필수적이지만, 이 과정에서는 결실(deletions)이나 치환(substitutions)과 같은 다양한 오류가 발생하여 데이터 순서가 뒤섞이거나 때로는 손상된 사본이 반환되는 문제가 발생합니다. DNAformer는 이러한 문제를 오류가 포함된 입력값으로부터 정확한 패턴을 식별하는 알고리즘을 통해 처리합니다. 이 모델은 맞춤형 수정 코드(correction codes)와 높은 노이즈를 가진 시퀀스를 감지하는 안전 계층을 통합하고 있으며, 특수 도구를 이용해 오류를 정리한 후 시퀀스를 디지털 형태로 역변환합니다.
DNAformer는 테크니온에서 자체 구축한 시뮬레이터가 생성한 합성 데이터셋을 사용하여 훈련된 트랜스포머 모델(transformer model)을 기반으로 합니다. 속도 향상 외에도 DNAformer는 이전의 빠른 검색 방식 대비 최대 40% 높은 정확도를 기록했습니다. 이러한 성능은 특히 전통적인 수정 방식을 어렵게 하는 불완전하거나 노이즈가 많은 실제 DNA 저장 데이터를 다루는 데 있어 획기적인 진전으로 평가됩니다.
연구진은 DNAformer를 특정 목적에 맞게 조정할 계획이며, 이 시스템이 산업 및 연구 애플리케이션으로 확장될 수 있다고 보고 있습니다. DNA가 쓰이고 읽히는 방식의 미래 발전에 맞춰 진화하도록 설계되었기 때문에, 지속 가능하고 고용량의 저장 솔루션에 대한 증가하는 수요를 충족하는 데 기여할 것으로 기대됩니다.