
"테이블형 데이터(Tabular data)"는 일반적으로 특정 행과 열의 구조를 갖는 데이터로, 매우 광범위한 개념입니다. SQL 데이터베이스, 스프레드시트, CSV 파일 등이 이에 해당할 수 있습니다.
비정형 및 시퀀스 데이터에 대한 인공지능 발전은 엄청났지만, 현재의 대규모 언어 모델(LLMs)들은 설계상 구조가 유연합니다. 이 모델들은 고정된 구조를 반드시 따르기보다 입력 토큰을 조작하여 일관된 출력을 생성하는 데 중점을 둡니다. 게다가, 최고 수준의 LLMs는 API를 통해 접근하거나 자체 클라우드 인프라에서 구동하는 데 높은 비용이 발생합니다.
그럼에도 불구하고, 많은 기업들은 이미 모든 중요 데이터를 중앙 집중화하는 데이터 웨어하우스 또는 데이터 레이크를 갖추고 있으며, 일부 데이터 과학자들은 이 데이터를 활용하여 회사 전략을 개선할 수 있습니다.
프랑스의 스타트업 Neuralk-AI는 테이블형 데이터에 초점을 맞춘 AI 모델을 개발하는 인공지능 전문 기업입니다. 이 회사는 최근 4백만 달러 규모의 투자 유치에 성공했다고 발표했습니다.
Neuralk-AI의 공동 창립자이자 최고 과학 책임자(CSO)인 알렉상드르 파스키우(Alexandre Pasquiou)는 TechCrunch을 통해 "기업에 진정한 가치를 제공하는 데이터란, 오랫동안 테이블 형태로 구조화되어 있었고 해당 기업의 데이터 과학자들에 의해 모든 머신러닝 알고리즘 개발에 사용된 데이터"라고 밝혔습니다.
Neuralk-AI는 AI 모델 개발 과정에서 구조화된 데이터에 특화된 재접근 기회가 있다고 보고 있습니다. 초기에는 상거래(commerce) 분야 기업의 데이터 과학자들에게 API 형태로 모델을 제공할 계획입니다. 이는 상거래 기업들이 제품 카탈로그, 고객 데이터베이스, 쇼핑 카트 트렌드 등 데이터를 핵심 자산으로 활용하는 경향이 높기 때문입니다.
파스키우는 "오늘날 LLMs는 검색, 자연어 사용자 상호 작용, 비정형 문서를 기반으로 질문에 답변하는 데 탁월합니다. 하지만 우리가 전통적인 테이블형 데이터에 기반한 클래식 머신러닝 영역으로 돌아갈 때 한계점들이 존재합니다"라고 지적했습니다.
Neuralk-AI를 사용하면 소매업체들은 스마트한 중복 제거(deduplication) 및 데이터 강화(enrichment)를 통해 복잡한 데이터 워크플로우를 자동화할 수 있습니다. 또한, 이 모델은 사기 거래 감지, 제품 추천 최적화, 그리고 재고 관리 및 제품 가격 책정에 활용될 판매 예측 생성 등에도 사용될 수 있습니다.
이번 4백만 달러 라운드는 Fly Ventures가 주도했으며 Steam AI도 참여했습니다. 이와 함께 Hugging Face의 토마스 울프(Thomas Wolf), Alan의 샤를 고랑땡(Charles Gorintin), Mirakl의 필립 코로(Philippe Corrot)와 나기 레타이파(Nagi Letaifa) 등 여러 비즈니스 투자자들이 참여했습니다.
해당 팀은 현재 활발하게 개발을 진행하고 있으며, E.S.E.M. 프로젝트와 관련하여 큰 기대를 모으고 있습니다.
개발팀은 "저희는 인공지능이 가진 근본적인 한계에 도전하여, 기존의 데이터 활용 방식을 혁신하고자 합니다."라며 자신감을 내비쳤습니다.