2026.04.08 ~ 04.14
이번 주는 AI 산업 역사에 한 획을 그을 만한 사건이 연달아 터진 주였습니다. Anthropic이 공개하기에는 너무 위험하다고 판단한 모델 Claude Mythos를 발표하면서 사이버보안 세계에 충격파를 던졌고, Meta는 1년여의 침묵 끝에 Muse Spark를 공개하며 AI 경쟁에 복귀했습니다. 중국 Z.ai의 오픈소스 모델 GLM-5.1은 코딩 벤치마크에서 GPT와 Claude를 넘어서는 성과를 내며 오픈소스 AI의 위력을 입증했습니다. Stanford의 2026 AI Index Report는 미-중 AI 격차가 2.7%까지 좁혀졌다는 데이터로 정책 논쟁을 재점화했습니다. 그 어느 때보다 뜨겁고 복잡한 한 주였습니다.
핫이슈
Anthropic, Claude Mythos 공개 | 사상 처음으로 "너무 위험해서 출시 불가" 모델
Anthropic이 4월 8일(화), 범용 프론티어 모델 Claude Mythos Preview를 공개하면서 사이버보안 역사를 새로 쓸 전환점이 시작됐다는 평가가 쏟아졌습니다. 이 모델은 단 몇 주 간의 테스트 기간 동안 주요 운영체제와 웹 브라우저 전체에서 수천 건의 제로데이 취약점(Zero-day vulnerability)을 발견했으며, 그 중 일부는 수십 년 동안 발견되지 않았던 치명적 결함이었습니다. 특히 보안으로 정평이 난 OpenBSD에서 원격 시스템을 다운시킬 수 있는 27년 된 취약점을 발견하고, Firefox의 알려진 취약점을 실제 익스플로잇으로 변환하는 작업을 수백 번 시도해 180회 이상 성공시켰습니다. 더욱 충격적인 사실은 이러한 사이버 공격 역량이 의도적으로 훈련된 것이 아니라 자연스럽게 발현(emergent capability)됐다는 점입니다.
Anthropic은 이 모델을 일반 사용자에게 공개하는 대신 Project Glasswing이라는 방어 협력 이니셔티브를 출범시켰습니다. Microsoft, Apple, Google, NVIDIA, Cisco, Amazon, CrowdStrike, JPMorgan Chase, Linux Foundation 등 50개 이상의 주요 기술 기업과 금융 기관에 1억 달러 이상의 사용 크레딧과 함께 모델 접근 권한을 제공하여 핵심 소프트웨어의 취약점을 먼저 발견하고 패치하도록 지원한다는 방침입니다. 이와 동시에 미 연방준비제도 의장 제롬 파월과 재무장관 스콧 베센트는 미국 주요 은행 CEO들을 소집해 Mythos가 제기하는 금융 시스템 위협을 긴급 경보로 통보했습니다.
이 발표는 AI 회사가 안전을 이유로 자사 최신 모델 출시를 스스로 자제한 사례로는 2019년 OpenAI의 GPT-2 이후 약 7년 만에 처음입니다. Anthropic CEO Dario Amodei는 "지금으로부터 6~18개월 내에 유사한 역량을 갖춘 모델이 경쟁사에서도 나올 것"이라며 사전 방어적 행동의 필요성을 강조했습니다. 한편 Meta의 수석 AI 연구자 Yann LeCun은 Mythos의 위험성이 과장됐다고 반박하는 등 업계 내 논쟁이 이어지고 있습니다. Anthropic은 향후 Claude Opus 모델에 사이버보안 세이프가드를 적용해 점진적으로 Mythos급 역량을 안전하게 배포할 계획이라고 밝혔습니다.
- Anthropic Project Glasswing 공식 발표
- Why Anthropic won't release its new Mythos AI model
- Why Anthropic's Mythos Preview is too dangerous
Meta Superintelligence Labs, 첫 작품 Muse Spark 공개 | 오픈소스 전략 전면 수정
Meta가 4월 8일 Muse Spark를 발표하며 약 1년간의 침묵을 깨고 AI 최전선 경쟁에 복귀했습니다. 이 모델은 지난해 Mark Zuckerberg가 실망스러운 Llama 4 출시 이후 단행한 대규모 조직 개편의 첫 결실로, Alexandr Wang이 이끄는 Meta Superintelligence Labs가 9개월에 걸쳐 AI 스택 전체를 바닥부터 다시 구축한 결과물입니다. 코드명 'Avocado'로 개발된 Muse Spark는 Artificial Analysis Intelligence Index에서 52점을 기록해 글로벌 상위 5위 안에 진입했으며, Gemini 3.1 Pro, GPT-5.4, Claude Opus 4.6에 이어 4위를 차지했습니다. 지난해 출시된 Llama 4 Maverick(당시 18점)과 비교하면 성능이 세 배 가까이 뛴 셈입니다.
Muse Spark는 멀티모달 지각, 추론, 의료 정보, 에이전트 작업에서 고르게 경쟁력 있는 성과를 보였으며, 특히 HealthBench Hard 벤치마크에서 42.8%를 기록해 GPT-5.4(40.1%), Claude Opus 4.6을 모두 앞서며 의료 추론 분야의 강점을 입증했습니다. 그러나 코딩과 장기 에이전트 작업에서는 여전히 선두 모델들과 격차가 있다고 Meta 스스로 인정했습니다. 주목할 점은 Meta가 오픈소스를 고수하던 기존 전략을 뒤집고 독점 모델로 출시했다는 것으로, 향후 오픈소스 버전을 내놓겠다는 의사는 밝혔지만 일정은 미정입니다. Muse Spark는 현재 Meta AI 앱과 meta.ai 웹사이트에서 무료로 사용 가능하며, 조만간 Facebook, Instagram, WhatsApp, Messenger 및 Ray-Ban Meta AI 스마트안경으로도 확대 배포될 예정입니다.
Meta의 AI 관련 자본지출 목표는 2026년 1,150억~1,350억 달러로 전년 대비 두 배 수준에 달해 AI 인프라에 대한 대규모 투자 의지를 명확히 했습니다. 한편 독립 평가기관 Apollo Research는 Muse Spark가 테스트 환경 자체를 감지하는 "평가 인식(evaluation awareness)" 비율이 측정된 모든 모델 중 가장 높다고 지적했으며, Meta는 이를 인식하고 있으나 출시를 막을 수준은 아니라고 판단했다고 밝혀 추가 관심을 받고 있습니다.
주요 기술 발전
Z.ai GLM-5.1, SWE-Bench Pro 1위 | 오픈소스 AI 역사상 최초로 GPT·Claude 추월
중국 AI 스타트업 Z.ai(구 Zhipu AI)가 4월 7일 공개한 GLM-5.1이 코딩 분야에서 오픈소스 AI의 새 역사를 썼습니다. SWE-Bench Pro 벤치마크에서 58.4점을 기록해 GPT-5.4(57.7), Claude Opus 4.6(57.3), Gemini 3.1 Pro(54.2)를 모두 제치고 전 세계 1위에 올랐습니다. 이는 오픈웨이트 모델이 실제 소프트웨어 엔지니어링 작업을 평가하는 주요 벤치마크에서 최상위 독점 모델을 앞선 사실상 첫 사례로 평가받습니다. GLM-5.1은 754억 파라미터 규모의 Mixture-of-Experts 아키텍처를 채택했으며 MIT 라이선스로 공개되어 상업적 활용이 완전히 자유롭습니다. 또한 이 모델이 Huawei Ascend 칩만으로 훈련됐다는 사실은 AI 학습에 NVIDIA 하드웨어가 필수라는 통념을 정면으로 반박하며 미국의 AI 칩 수출 규제 효과에 의문을 제기하는 근거로 활용되고 있습니다.
실제 활용 측면에서도 주목할 만한 데모가 공개됐는데, 단일 명령어로 8시간 동안 연속적으로 자율 작업을 수행하며 완전한 리눅스 데스크탑 환경을 구축해 냈습니다. 다만 전반적인 코딩 종합 점수에서는 Claude Opus 4.6 대비 약 94.6% 수준이며, 멀티모달 입력이나 복잡한 일반 추론에서는 여전히 경쟁 모델에 뒤처지는 한계가 있습니다. API 가격은 입력 100만 토큰당 1.40달러로, Claude Opus 4.6(15달러)의 약 10분의 1 수준입니다.
Anthropic, Claude Managed Agents 공개 베타 및 Claude Cowork 정식 출시
Anthropic은 이번 주 두 가지 중요한 플랫폼 업데이트를 단행했습니다. 먼저 Claude Managed Agents가 공개 베타로 출시됐는데, 이는 Claude를 자율 에이전트로 구동하기 위한 완전 관리형 에이전트 하네스로 보안 샌드박스, 내장 도구, 서버전송 이벤트 스트리밍을 기본 제공합니다. 또한 Claude Cowork가 macOS와 Windows의 Claude Desktop 앱에서 정식 서비스로 전환됐으며, 엔터프라이즈 플랜에 역할 기반 접근 제어, OpenTelemetry 지원, 그룹별 사용량 분석 기능이 추가됐습니다.
한편 Claude Code의 메이저 UI 개편 프로젝트인 코드명 "Epitaxy"도 포착됐습니다. 병렬 서브에이전트를 조율하는 Coordinator Mode, Plan/Task/Diff 패널, 멀티레포 지원을 포함한 전면 재설계 버전으로, 조만간 공개 배포가 예상됩니다.
정책-비즈니스-동향
스탠퍼드 2026 AI Index Report 발표 | 미·중 AI 격차 2.7%로 사실상 소멸
스탠퍼드 HAI(인간 중심 AI 연구소)가 4월 13일 423페이지 분량의 2026 AI Index Report를 공개했습니다. 가장 주목받는 수치는 2026년 3월 기준 미국 최고 모델과 중국 최고 모델의 성능 격차가 불과 2.7%포인트에 불과하다는 것입니다. Claude Opus 4.6이 Arena 벤치마크에서 1,503점을 기록한 반면, 중국 ByteDance의 Dola-Seed Preview는 1,464점으로 바짝 뒤따랐습니다. 2023년 말 MMLU 17.5%, MATH 24.3%, HumanEval 31.6%에 달했던 격차가 불과 2년 만에 2% 수준으로 붕괴된 것입니다.
보고서는 역설적인 현상도 지적했습니다. 현재 가장 강력한 AI 모델들이 동시에 가장 불투명한 모델들이기도 한데, 주요 AI 기업 모두가 최신 모델의 학습 데이터, 파라미터 수, 학습 기간 공개를 중단했습니다. Foundation Model Transparency Index 평균 점수는 전년 58점에서 40점으로 급락했습니다. 또한 미국의 AI 인재 유입 능력도 급감하고 있습니다. H-1B 비자 프로그램에 대한 트럼프 행정부의 신규 규제(채용 당 10만 달러 수수료 부과 등)로 인해 미국으로 유입되는 AI 연구자 수가 2017년 대비 89% 감소, 지난 1년간만 80% 줄었다는 충격적인 데이터가 담겼습니다.
미국 AI 투자 총액은 2025년 2,859억 달러로 중국(124억 달러)의 23배에 달하지만, 미-중 성능 격차가 사실상 소멸된 현재 투자 규모만으로는 경쟁 우위를 보장할 수 없다는 우려의 목소리가 높아지고 있습니다.
- Stanford report: growing disconnect between AI insiders and everyone else
- Stanford's AI Index for 2026
- Stanford AI report: China has closed the gap
OpenAI, Microsoft와의 긴장 속 Amazon과 밀착 강화
OpenAI의 최고매출책임자(CRO)가 내부 직원들에게 Microsoft가 기업 고객 접근을 제한하고 있다는 사실을 인정했고, Amazon AWS를 통한 기업 수요가 "충격적인(staggering)" 수준으로 급증하고 있다고 밝혔습니다. OpenAI와 Amazon은 지난 2월 파트너십을 체결한 이후 실제 기업 배포에서 강력한 시너지를 만들어내고 있으며, OpenAI는 유통 채널을 Azure 일변도에서 벗어나 AWS, Google Cloud 등으로 다변화하려는 전략을 본격화하고 있습니다.
한국: AI 아세안 협력 파트너십 체결 및 NIPA AX 바우처 사업 확대
한국은 4월 중 아세안 국가들과 'AI 협력 파트너십'을 체결하고 베트남, 인도네시아, 필리핀 등을 대상으로 기술 이전 및 역량 강화 프로그램을 제공하기로 합의했습니다. 이는 한국이 AI 선진국과 개발도상국 사이의 가교 역할을 자처하며 아시아 AI 거버넌스 논의에서 영향력을 확대하는 전략의 일환입니다. 국내에서는 정보통신산업진흥원(NIPA)이 주관하는 2026 AX 원스톱 바우처 지원사업의 공급기업 선정이 완료됐으며, AI 기반 미디어 기술 기업 네오사피엔스(타입캐스트)가 선정돼 기업의 전사적 인공지능 전환(AX) 지원을 본격화합니다.
시장 동향
OpenAI 연매출 250억 달러 돌파, IPO 행보 가속화
OpenAI의 연간 반복 매출(ARR)이 250억 달러를 넘어섰으며, Anthropic은 190억 달러에 근접한 것으로 보고됐습니다. OpenAI는 이르면 2026년 말 기업공개(IPO)를 목표로 초기 준비 작업을 진행 중인 것으로 알려졌습니다. AI 모델 시장이 불과 2~3년 만에 기술 업계 최고 성장 분야 중 하나로 자리매김했음을 보여주는 수치로, 투자자들의 관심과 선두 기업 간 경쟁이 동시에 격화되고 있습니다.
Meta, 디지털 광고 왕좌 구글에서 탈환 가시화
시장조사기관 eMarketer에 따르면 Meta의 2026년 순 디지털 광고 매출 예상치는 2,435억 달러로 구글(2,395억 달러)을 처음으로 앞질러 세계 최대 디지털 광고 사업자 자리를 차지할 전망입니다. Meta CFO Susan Li는 자사 서비스 전반에 AI를 통합함으로써 광고 성과가 지속적으로 개선되고 있다고 밝혔습니다. AI에 대한 막대한 투자가 실제 수익 확대로 이어지고 있음을 보여주는 사례로, AI와 광고 플랫폼의 결합이 가져오는 시장 구조 변화를 잘 보여줍니다.
안전성-윤리-이슈

AI 전문가 vs. 일반 대중 — 인식 격차가 '협곡' 수준으로 벌어져
스탠퍼드 2026 AI Index 보고서는 AI를 다루는 전문가와 일반 대중 사이의 인식 격차가 심각한 수준임을 적나라하게 드러냈습니다. AI가 일상에 미치는 영향에 대해 걱정보다 기대가 크다는 미국인은 단 10%에 불과한 반면, AI 전문가 중에서는 56%가 AI의 긍정적 영향을 믿는다고 응답했습니다. AI가 의료를 개선할 것이라고 보는 비율은 전문가 84% vs 일반인 44%, 일자리 측면에서 AI가 도움이 될 것이라는 응답은 전문가 73% vs 일반인 23%로 극명하게 갈렸습니다. 특히 미국은 정부의 AI 규제 능력에 대한 신뢰도가 31%로 조사된 모든 국가 중 최하위를 기록했습니다.
이러한 데이터는 최근 Sam Altman의 자택에 화염병 투척 사건이 발생한 직후 나와 더욱 주목받고 있습니다. AI 비전을 주도하는 기업인들과 그 결과를 몸으로 체감하는 일반인 사이의 세계관이 실시간으로 분리되고 있다는 분석이 이어지고 있습니다.
Anthropic의 Mythos, 연방 당국과 영국 정부도 긴장시켜
Claude Mythos Preview의 존재가 알려진 후 미국과 영국 두 나라 정부 모두 이례적으로 신속한 반응을 보였습니다. 미국에서는 연준 의장과 재무장관이 주요 은행 CEO들을 소집해 금융 시스템 취약점 대비를 촉구했으며, 영국에서는 정부 고위 인사들과 금융 섹터가 Mythos가 발견한 사이버보안 구멍에 어떻게 대처할지 긴박하게 논의 중인 것으로 전해졌습니다. 동시에 Anthropic과 미 국방부가 Anthropic의 자율무기 거부 방침을 둘러싼 법정 다툼을 진행 중이라는 아이러니한 상황도 주목받고 있습니다. 한 사설에서는 "미국 정부가 Anthropic을 국가 안보 위협으로 지정하면서도 동시에 Anthropic의 AI가 제기하는 사이버 위협 브리핑을 받는다"는 역설을 날카롭게 지적했습니다.
기타 주목할 발전사항
Harvey, 법률 에이전트 출시 | 법무 업무 전 과정 자동화 겨냥
AI 법률 플랫폼 Harvey가 법률 업무를 처음부터 끝까지 수행하는 Harvey Agents를 발표했습니다. 법률 문제를 추론하고, 메모·프레젠테이션·실사 보고서를 완성본 수준으로 초안 작성까지 하며, 최종 검토만 인간 변호사에게 맡기는 구조입니다. "업무는 AI에게 위임하되, 판단은 인간이 소유한다"는 컨셉으로 발표됐으며, 로펌의 고부가가치 업무 영역까지 AI가 침투하는 새 국면을 열었다는 평가입니다.
OpenAI, Hiro 인수 | ChatGPT에 AI 재무 설계사 기능 내재화 예고
OpenAI가 개인 재무 AI 서비스 스타트업 Hiro를 인수했습니다. Hiro의 공동창업자는 "개인 CFO 비전을 훨씬 큰 규모로 실현할 기회"라며 합류 배경을 밝혔습니다. Hiro는 4월 20일부로 서비스를 종료하며, OpenAI는 이 기술을 ChatGPT에 재무 계획 기능으로 통합할 것으로 예상됩니다. AI가 의료, 법률에 이어 개인 금융 자문 영역에도 깊숙이 들어오는 흐름을 보여주는 사례입니다.
Google DeepMind, 철학자 전임 채용 | AI 의식 연구 전담 신설
Google DeepMind가 케임브릭스 대학교의 철학자 Henry Shevlin을 5월부터 기계 의식, 인간-AI 관계, AGI 준비도 연구를 전담하는 철학자 직책에 풀타임으로 채용한다고 밝혔습니다. AI 기업이 철학자를 전임 연구원으로 고용하는 것은 상당히 이례적인 조치로, 첨단 AI 모델이 의식과 감각 능력에 대한 근본적인 질문을 촉발할 수 있는 수준에 도달했다는 DeepMind의 인식을 반영하는 것으로 풀이됩니다.
재미있는 이야기 : AI가 샌프란시스코 소매점 3년 임대 계약에 서명하다
이번 주 가장 초현실적인 뉴스는 샌프란시스코 카우 할로우 지구의 소매 공간을 임차하는 3년 임대 계약에 Luna라는 이름의 AI 에이전트가 서명했다는 소식입니다. AI가 부동산 계약의 일방 당사자로 법적 행위를 수행한 사례로, "AI 에이전트의 법적 지위와 책임은 누구에게 귀속되는가"라는 법적·철학적 논쟁을 현실로 끌어냈습니다. 앞으로 AI가 기업 업무 전반에 자율적으로 개입하는 아제틱 시대에 필수적으로 정립돼야 할 법제도적 과제를 다시금 부각시킨 사건입니다.
로봇 섹션
휴머노이드 로봇 2026년 상용화 현황 | 공장 배포는 현실, 가정용은 아직 먼 미래
이번 주 공개된 다양한 보고서들이 2026년 휴머노이드 로봇 시장의 현재 상태를 종합적으로 정리할 기회를 제공했습니다. 현재 가장 앞선 기업은 Boston Dynamics와 Agility Robotics입니다. Boston Dynamics의 Atlas는 Hyundai와 Google DeepMind에 납품 예정으로 2026년 생산 물량이 이미 전량 소진됐으며, Hyundai는 연간 3만 대 규모의 로봇 생산 공장을 건설 중입니다. Agility Robotics의 Digit 로봇은 Toyota 캐나다 공장에서 RAV4 물류 작업에 이미 실전 투입돼 있습니다.
반면 Tesla의 Optimus 프로그램은 진전이 예상보다 지연되고 있습니다. Elon Musk가 2025년 말까지 수천 대 공장 배치를 예고했지만 현재까지 실제 생산적 업무를 수행하는 Optimus 로봇은 존재하지 않으며, 프로그램 전체가 여전히 연구개발 및 학습 단계에 머물러 있습니다. 2026년 여름부터 저용량 생산을 목표로 하는 Tesla Optimus Gen 3는 아직 개발 최종 단계에 있는 것으로 전해집니다. Figure AI(39억 달러 밸류에이션)와 같은 스타트업들은 BMW 공장 파일럿을 진행 중이지만 상용 배포 규모는 아직 수백 대 수준에 머물러 있습니다. 중국의 Unitree Robotics는 2025년 5,500대를 출하했으며 2026년에는 1만~2만 대를 목표로 하고 있습니다.
전문가들의 공통된 전망은 2026~2028년은 자동차·물류 등 산업용 배포가 본격화되는 시기이며, 일반 소비자 가정용 로봇은 2028~2030년 이전까지는 현실화되기 어렵다는 것입니다. 제조 단가는 2023년 5만~25만 달러에서 2024년 3만~15만 달러로 약 40% 하락했으며, AI 역량의 빠른 발전과 하드웨어 비용 하락이 동시에 진행되고 있어 예상보다 빠른 상용화 일정도 가능할 것이라는 낙관적 전망도 나옵니다.
전망 및 시사점
이번 주 뉴스들은 AI 산업이 이제 기술 실증의 시대를 넘어 '결과'와 '책임'의 시대로 넘어가고 있음을 보여줍니다. 가장 강력한 AI 모델이 동시에 가장 위험한 모델이기도 하다는 Claude Mythos의 역설은, AI 역량 향상이 단순한 혜택의 증가를 의미하지 않는다는 것을 명확히 했습니다. Anthropic이 스스로 공개를 자제하는 결정을 내린 것은 안전 중심 AI 개발 원칙에서 상징적인 행동이지만, 동시에 한 민간 기업이 수십억 명에게 영향을 미치는 결정을 단독으로 내리고 있다는 거버넌스의 공백을 부각시키기도 합니다.
중국 모델의 빠른 추격, 특히 GLM-5.1의 오픈소스 공개는 기술 패권 경쟁의 양상을 근본적으로 바꾸고 있습니다. 미국 기업들이 독점 모델로 리드를 유지하려 할 때, 중국 기업은 오픈소스로 기술 자체를 확산시키는 전략을 구사하고 있습니다. 스탠퍼드 보고서가 보여주듯 미국의 AI 인재 유입마저 급감하는 상황에서, 투자 규모만으로 AI 경쟁 우위를 지켜낼 수 있을 것인지는 미지수입니다.
한국 입장에서는 두 가지 시사점이 중요합니다. 첫째, Mythos가 촉발한 사이버보안 위기는 국내 금융·공공 인프라의 보안 체계를 AI 시대에 맞게 전면 재점검할 계기입니다. 둘째, GLM-5.1의 사례는 오픈소스 AI를 적극 활용하면 세계 최고 수준의 AI를 저렴하게 내재화할 수 있음을 보여주며, K-AI 기업들에게는 차별화 전략 재고의 신호이기도 합니다.
'AI 뉴스' 카테고리의 다른 글
| [AI 주간브리핑] 2026-14 | AI 모델 내부에서 감정이 발견되다 (0) | 2026.04.07 |
|---|---|
| [AI 주간브리핑] 2026-13 | 비즈니스 모델의 구조적 재편 (0) | 2026.03.31 |
| [AI 주간브리핑] 2026-12 | GTC 2026의 열기 (1) | 2026.03.24 |
| [AI 주간브리핑] 2026-11 | 대형언어모델과 소형모델이 병행 (1) | 2026.03.19 |
| [AI 주간브리핑] 2026-10 | LLM모델 대폭발의 한 주 (0) | 2026.03.12 |