저자: 진 진, 출처: Carbon Chain Value
실리콘밸리 거물들과 월가 엘리트들은 동양에서 온 신비한 힘, 딥시크가 실제로 미국 주식 시장과 그 엄청난 부를 하루 아침에 몰락시키고 축소시킬 수 있다고는 전혀 예상하지 못했습니다. 1월 28일 관련 데이터에 따르면 미국 칩 주식은 하룻밤 사이에 1조 달러가 증발했습니다. 엔비디아의 시장 가치는 하루 만에 6,000억 달러가 증발하며 미국 주식 사상 최고 기록을 세웠습니다. 도널드 트럼프 미국 대통령도 어쩔 수 없이 발언에 나섰습니다. 그는 중국 AI 앱 딥시크의 급부상은 '미국 기술 기업들에게 경종을 울려야 한다'며 중국 기업들이 더 저렴하고 효율적인 AI 모델을 개발하는 것은 좋은 일이라고 말했습니다.
트럼프는 여전히 미국 기술 기업이 AI 분야를 지배할 것으로 기대하지만, 지난 주말 애플 앱스토어에서 1위를 차지한 저가의 AI 비서 딥시크의 도전을 인정했습니다.

다음 질문은 이것이 시작에 불과할까요?
지난 1월 28일, FT는 잘 알려지지 않은 중국의 한 헤지펀드가 인공지능에 폭탄을 던졌다고 보도했습니다. 시장 선두주자인 샘 알트먼의 OpenAI와 거의 동등한 수준의 대규모 인공지능 모델을 개발했지만 비용은 훨씬 저렴하다는 것. OpenAI는 자사 모델의 작동을 독점적인 것으로 취급하는 반면, DeepSeek의 R1은 기술의 핵심을 오픈소스화해 개발자들이 이를 사용하고 구축하도록 유도하고 있다.
미국 증시가 월요일에 개장하기 전, 인공지능 분야에서 가장 큰 5개 기술주인 Nvidia, Alphabet, Amazon, Microsoft, Meta Platforms -의 시가총액이 7,500억 달러 가까이 증발했습니다. 딥시크가 자사의 최첨단 칩을 사용하지 않고도 승리한다면 NVIDIA에게는 특히 암울한 상황이 될 수 있습니다.
미국 증시 개장 후 칩 주식인 엔비디아는 17.5%까지 하락했습니다. 브로드컴은 16.5퍼센트 하락했습니다. TSMC는 14.3퍼센트 하락했습니다. 마이크론은 10.5퍼센트, ARM은 10.0퍼센트, AMD는 5.6퍼센트 하락했습니다. 위의 칩 주식은 하루 만에 시가총액에서 거의 1조 달러의 손실을 입었습니다. NVIDIA는 10월 2일 이후 상승분을 모두 잃고 2거래일 동안 21% 하락했습니다. NVIDIA의 시가총액은 6,300억 달러 감소했습니다. 지난주 세계 최대 상장사였던 이 회사는 이틀 만에 가치가 5분의 1로 떨어졌습니다. 젠슨 황의 개인 가치도 1,000억 달러 감소했습니다.
데이터 센터 개발로 회사 수익이 증가할 것으로 기대했던 칩 제조업체 ASML을 비롯한 기술 및 에너지 기업 투자자들은 이제 투자가 낭비될까 봐 걱정하고 있습니다. Visible Alpha의 추산에 따르면 올해 거대 기업들이 자본 지출에 거의 3,000억 달러를 지출할 것으로 예상됩니다. 분석가들은 Meta와 Microsoft가 수요일에 실적을 발표할 때 2024년에 총 940억 달러의 투자를 보고할 것으로 예상합니다.
일부 외신은 AI 경쟁이 시작되었다고 분석합니다. 엔비디아의 주가가 폭락한 이유는 딥시크가 엔비디아가 '탁월한 AI 발전'이라고 부르는 AI 혁신의 선두주자로 부상했기 때문인 것으로 보입니다.
둘째, 이론적으로 AI 발전은 칩 수요 증가를 의미하기 때문에 NVIDIA에 좋은 일입니다. 문제는 딥시크가 중국에 있고 미국이 중국의 칩 기술을 차단하고 있다는 점입니다. 즉, NVIDIA는 딥시크의 약한 H800 칩만 대량으로 판매할 수 있고, 개당 3만 달러 이상에 판매되는 H100 칩은 판매할 수 없습니다. 딥시크가 더 낮은 성능의 칩만 보유하고 있더라도 중국은 96% 더 저렴하고 더 효율적이며 90% 이상 저렴한 AI 모델을 효과적으로 생성할 수 있을 것입니다.
동시에 중국의 AI 모델은 무료인 반면 ChatGPT와 같은 AI 모델은 상대적으로 비싸고(월 200달러 이상) 효율성이 떨어집니다. 중국은 이전에는 불가능하다고 여겨졌던 속도로 혁신을 시작하고 있는 것으로 보입니다. 미국 기술 커뮤니티는 중국의 우위를 대체할 수 없다고 생각합니다. 미국의 대형 기술주들은 이제 더 나은 AI 모델을 무료로 얻을 수 있고 앞으로 더 좋아질 것이라는 현실에 직면하고 있습니다. 왜 더 나쁜 제품에 프리미엄을 지불할까요?
다음 반응은 미국이 딥시크를 제한하거나 중국에 칩을 수출하는 것이지만(지난 몇 달 동안 보아왔듯이), 이는 분명 효과가 없을 것입니다. 엔비디아가 딥시크의 성장에 따른 새로운 수요를 활용할 수 있는 방법을 찾을 수 있다면 올가을은 선물로 여겨질 것입니다. 궁극적으로 하드웨어와 소프트웨어 모두에서 AI 경쟁은 더욱 심화될 것이며, 어떤 기업도 '안전'할 수 없으며 혁신의 속도는 더욱 빨라질 것입니다.
그렇다면 딥시크가 우승한 이유는 무엇일까요? 그리고 AI의 미래는 어떻게 펼쳐질까요?
미국 투자사 Atreides의 매니징 파트너인 개빈 베이커는 다양한 측면에서 딥시크와 향후 AI의 진화에 대해 분석했습니다. 머스크는 지금까지 본 것 중 최고의 분석이라고 극찬했습니다.
가빈 베이커는 무엇보다도 DeepSeek R1이 Open ai o1보다 훨씬 저렴하고 추론 효율이 높으며, 이는 600만 달러의 학습 데이터에서 나온 것이 아니라고 말했습니다. R1은 API당 사용 비용이 o1보다 93% 저렴하고 하이엔드 워크스테이션에서 로컬로 사용할 수 있다는 것이 가장 중요한 점입니다. 93% 저렴하고, 로컬 하이엔드 워크스테이션에서 실행할 수 있으며, 속도 제한에 걸리지도 않습니다. 간단한 계산에 따르면 FP8에서 각 1b 활성 매개변수에는 1GB의 RAM이 필요하므로 R1에는 37GB의 RAM이 필요합니다. 일괄 처리로 비용을 상당히 줄일 수 있고, 더 많은 계산을 하면 초당 토큰 수를 늘릴 수 있으므로 클라우드에서 추론을 수행하는 것이 여전히 이점이 있습니다. 또한 지정학적 역학 관계도 작용하는데, 스타게이트 이후에 이런 일이 벌어진 것은 우연이 아니라고 생각합니다. 5천억 달러 - 그리고 우리는 당신을 거의 알지도 못합니다.
DeepSeek는 관련 카테고리에서 App Store 다운로드 1위를 기록했습니다. ChatGPT보다 확실히 앞서고 있습니다.2) 품질 측면에서는 o1과 비슷하지만, o3보다 뒤쳐져 있습니다.3) 훈련과 추론을 훨씬 더 효율적으로 만든 알고리즘의 진정한 혁신이 있었습니다.FP8, MLA 및 다중 마커 예측 훈련은 매우 중요합니다.4) r1 훈련 실행에 드는 비용이 6백만 달러에 불과하다는 것을 쉽게 확인할 수 있습니다. 이는 사실이지만 오해의 소지가 다분합니다.5) 하드웨어 아키텍처도 참신한데, 확장을 위해 PCI-Express를 사용한다는 점에 주목하고 싶습니다.
뉘앙스:1) 기술 문서에 따르면 600만 달러에는 "아키텍처, 알고리즘 및 데이터에 대한 이전 연구 및 제거 실험과 관련된 비용"이 포함되지 않았습니다. 즉, 연구소가 이전 연구에 수억 달러를 투자했고 더 큰 클러스터에 액세스할 수 있다면 600만 달러의 운영 비용으로 r1 수준의 모델을 훈련할 수 있다는 뜻입니다. 딥시크는 2,048개 이상의 H800을 보유한 것으로 보이며, 이전 논문 중 하나는 10,000개의 A100 클러스터를 언급했습니다. 똑같이 똑똑한 팀이라면 2,000개의 GPU 클러스터를 구성하고 처음부터 600만 달러로 r1을 트레이닝할 수 없었을 것입니다. Nvidia 매출의 약 20%가 싱가포르에서 발생합니다. 엔비디아의 최선의 노력에도 불구하고 엔비디아 GPU의 20%는 싱가포르에 있지 않을 수도 있습니다.2) 즉, GPT-4o와 o1에 대한 무제한 액세스 권한이 없었다면 이 모델을 훈련하지 못했을 가능성이 높습니다. 어제 @altcap이 지적했듯이, 중국이 미국의 주요 모델을 개선하는 능력에 대처하기 위해 아무것도 하지 않고 주요 GPU에 대한 액세스를 제한하는 것은 수출 제한의 목적에 명백히 위배되는 우스운 일입니다. 우유를 공짜로 얻을 수 있는데 왜 소를 사나요?
결론: 1) 학습 비용을 줄이면 AI ROI가 향상됩니다. 2) 단기적으로는 학습 자본이나 '파워' 테마에 긍정적인 영향을 미치지 않습니다. 3) 현재 기술, 산업, 유틸리티 및 에너지 분야의 'AI 인프라' 승자에게 가장 큰 위험은 r1. 의 라이트 버전이 하이엔드 워크스테이션의 엣지에서 로컬로 실행될 수 있다는 점입니다(Mac Studio Pro가 언급되었습니다). 이는 약 2년 내에 비슷한 모델이 슈퍼폰에서도 실행될 수 있다는 것을 의미합니다. 추론이 '충분히 좋다'는 이유로 엣지로 이동한다면, 우리는 매우 다른 세상에 살고 있고 승자는 완전히 다른, 즉 사상 최대의 PC 및 스마트폰 업그레이드 주기를 맞이하게 될 것입니다. 컴퓨팅은 오랫동안 중앙 집중식과 탈중앙화 사이에서 진동해 왔습니다.4) ASI는 정말, 정말 가까워졌고, 초지능의 경제적 보상이 무엇인지 아무도 실제로 알지 못합니다. 100,000개 이상의 블랙웰(o5, 제미니 3, 그로크 4)로 훈련된 1000억 달러 규모의 추론 모델이 암을 치료하고 워프 엔진을 발명한다면, ASI의 보상이 너무 커서 훈련 비용 지출과 전력 소비가 꾸준히 증가할 것이며, 다이슨 구체(별 주위에 연속적인 외피를 형성하는 단단한 구조로 종종 언급됨)는 페르미 역설의 가장 잘 설명됩니다. ASI가 좋은 성과를 거두었으면 좋겠습니다.5) 이는 소프트웨어, 인터넷 등 AI를 사용하는 기업들에게 정말 좋은 일입니다.6) 경제적 관점에서 볼 때, 이는 분산되고 고유한 데이터의 가치를 극적으로 증가시킵니다. -유튜브, 페이스북, 인스타그램, 엑스 등.7) 미국 연구소는 r1의 필수적인 정제 과정을 막기 위해 선도적인 모델 출시를 중단할 수 있습니다(이와 관련하여 완전히 노출되었을 수도 있지만). 즉, r2 등을 훈련하기 위해 r1으로 충분할 수 있습니다.
Grok-3는 곧 출시될 예정이며 위의 결론에 상당한 영향을 미칠 수 있습니다. 이는 GPT-4 이후 사전 훈련 규모 법칙에 대한 첫 번째 주요 테스트가 될 것입니다. 강화 학습을 통해 v3를 r1로 바꾸는 데 몇 주가 걸렸던 것처럼, Grok-3의 추론을 개선하는 데 필요한 강화 학습도 몇 주가 걸릴 수 있습니다. 사전 훈련, 사후 훈련 중 강화 학습, 추론 중 테스트 시간 계산(강화 학습의 함수)의 세 가지 확장 법칙이 증식하기 때문에 기본 모델이 우수할수록 추론 모델도 우수해야 합니다. Grok-3는 이미 o1 이상의 작업이 가능하다는 것을 입증했습니다. -테서랙트 데모 참조 - 그 이상의 작업이 얼마나 가능하느냐가 중요할 것입니다. 영화 '두 개의 탑'에 나오는 이름 없는 오크의 말을 빌리자면, 곧 다시 고기를 먹어야 할 때가 올지도 모릅니다. 시간이 지나면 "사실이 스스로 말해주겠지, 내 마음은 바뀔 거야."라고 말할 것입니다.
그러나 미국 주식 투자 분석가인 올드 캣 슈는 월요일 딥시크에 따른 매도세가 과잉 반응이었다고 생각합니다. AI의 장기 성장 이야기는 여전히 유효하며 그 어느 때보다 강력하다고 주장합니다. 경제학에는 제본스의 역설이 있는데, 이는 자원 사용의 효율성이 높아지면 자원 사용 비용이 감소하여 자원에 대한 수요가 증가하기 때문에 자원의 전반적인 소비가 감소하기보다는 증가하는 경향이 있다는 것을 시사합니다.
증기 기관에 석탄을 사용할 때 이런 일이 일어났습니다. 증기 엔진의 효율성이 개선되면서 단위 출력당 석탄 소비량이 감소했습니다. 그러나 석탄 화력 발전 기술의 경제성이 높아지면서 더 많은 석탄이 채택되었고 궁극적으로 전체 석탄 소비량이 증가했습니다. 컴퓨터가 더 작고 저렴해지고, 인터넷 접속이 기본적으로 무료가 되고, 누구나 컴퓨터를 가지고 있고, 24시간 내내 인터넷에 접속할 수 있게 되면서 인터넷에서도 이런 일이 일어났습니다.
이제 AI도 마찬가지입니다. AI 모델 학습 및 추론 비용이 급격히 하락함에 따라 점점 더 많은 기업과 개인이 자체 AI 모델을 구축할 것이며, AI는 전 세계적으로 확산되어 사회의 모든 측면에 스며들고 있습니다.