연구원들은 2025년 블랙햇(Black Hat) 행사에서 마이크로소프트의 보안 도구들을 약 8%의 확률로 능가하는 모델을 시연할 계획이다.

사이버 보안 업계는 과도하게 과장되고 있습니다. 많은 기업들이 AI가 보안 지형을 근본적으로 변화시킬 것이라고 선언하면서, 대규모 언어 모델(LLM)에 추가되는 모든 새로운 기능이 '위기감 조성용' 소재가 되고 있습니다. 가장 최근의 예로는 Microsoft Defender를 성공적으로 우회할 수 있는 AI 악성코드의 개발 사례가 꼽힙니다.
Dark Reading에 따르면, Outflank의 연구원들이 오는 8월 블랙햇 2025(Black Hat 2025)에서 이 새로운 AI 악성코드를 시연할 계획입니다. 하지만 아직 Windows Defender를 포기하기는 이릅니다.
Outflank의 웹사이트에 따르면, 이 회사는 "경험 많은 전문가로 구성된 매우 숙련된 레드 팀"이며, "첨단 위협에 대한 복원력 평가 및 보안 팀의 인시던트 대응 능력 향상 훈련을 전문으로 한다"고 합니다. 이 회사의 선임 공격 전문가인 카일 에이버리(Kyle Avery)는 Dark Reading과의 인터뷰에서, 그가 오픈 소스 LLM인 Qwen 2.5를 Microsoft Defender 우회용으로 훈련하는 데 3개월과 약 1,500달러를 투입했다고 밝혔습니다. 이는 해당 역량을 확보하기 위해 상당히 높은 초기 비용이지만, 극복 불가능한 금액은 아닙니다.
한편, Anthropic의 Claude Mythos는 지능형 슈퍼 해커가 아니라 단순한 세일즈 멘트(sales pitch)라는 비판을 받습니다. '수천 개'의 심각한 제로데이(zero-day) 취약점에 대한 주장은 단지 198건의 수동 검토를 기반으로 합니다.
Anthropic의 최신 AI 모델은 '모든 주요 운영 체제와 모든 주요 웹 브라우저'에서 '수천 개의 제로데이 취약점'을 식별한다고 주장합니다.
하지만 주목할 점은 다음과 같습니다. 해당 보고서에 따르면, 에이버리가 개발한 "모델은 Microsoft Defender for Endpoint를 완전히 우회할 수 있는 악성코드를 약 8%의 확률로 생성할 수 있었습니다." 이는 다른 모델들과 비교했을 때 좋은 성과입니다. 그는 Dark Reading에 "Anthropic의 AI는 같은 작업을 1% 미만의 확률로, DeepSeek은 0.5% 미만의 확률로 수행할 수 있었다"고 설명했습니다. 이는 그의 모델이 이 작업에서 현저히 더 효과적임을 의미하지만, 대다수의 아마추어 해커(script kiddies)가 기대할 만한 '즉시 사용 가능한(plug-and-play)' 수준의 성능은 아닙니다.
이러한 모델들은 시간이 지남에 따라 성능이 개선될 것으로 예상됩니다. 마치 챗봇 개발사들이 1990년대부터 머신러닝 연구원들이 모델 성능을 개선하는 데 사용해 온 강화 학습(reinforcement learning) 기법을 발견한 것처럼, 이론적으로는 충분한 훈련을 거쳐 이 작업을 수행하는 능력을 끌어올릴 수 있을 것으로 보입니다. 여분의 GPU를 보유한 재능 있는 사이버 범죄자는 이 작업에 더 많은 시간과 자금을 투자할 의향이 있을 수 있습니다.
결국 우리에게 남는 질문은 두 가지입니다. 이러한 기능적 측면에 상한선이 존재하는지, 그리고 Microsoft Defender가 이를 보완하기 위해 어떻게 개선되는지입니다. 마이크로소프트가 항상 가장 최첨단 기능으로 소프트웨어를 유지해 온 역사는 없지만, 심지어 메모장(Notepad)조차 이제 마크다운(Markdown)을 지원합니다.
이 모든 내용이 Outflank의 연구 결과를 폄하하려는 의도는 아닙니다. 이 연구는 보안 업계가 AI 과장광 열차에 몸을 싣고 지속적으로 제기해온 모든 '종말론적 예측'에 대한 다소 유능한 개념 증명(Proof of Concept)임은 분명합니다. 하지만 저는 '분위기 해킹(vibe hacking)'에 대해 더 우려하기보다는, 유출된 레드팀 도구가 악성코드 배포에 사용될 가능성, 단 한 명의 사람이 사회 공학적 공격(social engineering attack)에 속는 것만으로도 기업의 운영이 마비될 수 있다는 현실, 그리고 해커들이 감시 국가의 시스템에 편승할 수 있는 능력에 대해 더 심각하게 우려합니다.
Tom's Hardware를 Google News에서 팔로우하여 최신 뉴스, 분석 및 리뷰를 피드에서 받아보세요. 팔로우 버튼을 클릭하는 것을 잊지 마십시오.