출처: AGI Interface
5월 중순, 90일 동안 관세가 유예되자 산술 관련 핵심 자원을 둘러싼 경쟁이 갑자기 뜨거워졌습니다.
"서버 가격은 급등락을 거듭했고, 이전 기간 동안 단위당 가격은 15~20% 상승했습니다. 관세 부과가 중단됨에 따라 원래 가격으로 판매를 재개할 계획입니다." 호랑이에게 칩을 공급하는 남부 지역이 밝혀졌습니다.
한편, 시장의 공급 측면에서도 새로운 변수가 등장했습니다. 타이거스냅은 엔비디아의 하이엔드 제품인 후퍼 시리즈와 블랙웰 시리즈가 국내 시장에 조용히 등장한 사실을 단독으로 파악했는데, 전자의 등장 시점은 2024년 9월경이며 후자는 최근 발생한 일입니다. 시노벨 경영진은 "공급업체마다 물량을 확보하는 채널이 다르다"고 말했습니다. 그리고 그 뒤에 숨겨진 복잡한 공급망 네트워크를 탐색할 방법이 없습니다.
(타이거스 노트: 미국은 2023년 10월 17일부터 A100, A800, H800, H100, H200 등 엔비디아 칩의 중국 판매를 단계적으로 중단했으며, 최근 후퍼 시리즈 중 마지막으로 중국에 판매할 수 있는 제품인 H20도 수출 제한 목록에 포함되어 있습니다)
일반적으로 엔비디아 후퍼 하이엔드 시리즈는 H200을 지칭하며, H100 칩의 업그레이드 버전으로 전자는 후자의 가격보다 20만원 내외에 불과하지만 효율은 30% 이상 높습니다. 블랙웰 시리즈는 엔비디아의 하이엔드 시리즈에 속하며, 그 중 B200의 가격은 300만 이상이지만 현재 가장 엄격한 제품의 "제한된 유통"은 유통 경로가 더 비밀입니다. 이 두 가지는 대형 모델 사전 훈련에 사용되며 B200은 "카드를 찾기가 어렵다"입니다.
타임라인으로 돌아가 2024년 4월, 젠슨 황과 OpenAI 공동 창업자 그렉 브록맨(Greg Brockman)이 함께 찍은 사진이 트위터에 유포되었습니다. 이 단체 사진 뒤에는 H200 제품 첫 번째 배치의 주요 배송 지점인 NVIDIA CEO 젠슨 황이 직접 전달했으며, OpenAI는 H200의 첫 번째 사용자 배치입니다.
5개월 후, 바다 건너에서 H200의 출시 소식이 전해졌습니다. 현재 중국에는 주당 100대의 H200 서버를 공급할 수 있는 공급업체가 있습니다. 공급업체에 따르면 H100이 단종되면서 시장 수요가 H200 이전으로 가속화되고 있으며, 현재 공급업체가 파악한 H200 공급원은 10개에 불과해 수급 격차가 더욱 확대되고 있다고 합니다.
이 산술 군비 경쟁에서 거래 사슬은 베일에 싸여 있습니다. 국내의 한 산술 공급 업체는 업계의 일반적인 산술 가격 책정 규칙은 계약서에 산술 단위 "P"로만 표시되어 서버 거래를 추상적 인 산술 거래로 변환하는 것이라고 말했습니다. 예를 들어 산술 사용자가 산술 공급자와 산술 거래를 할 때 카드 모델을 직접 계약에 기록하는 것이 아니라 산술의 P로 대체하는데, 이는 눈에 보이는 구체적인 카드 모델을 계약에 넣지 않는다는 것을 의미합니다.
산업 사슬의 가장 밑바닥에 숨겨진 거래 네트워크가 드러났습니다. 이전에 일부 언론은 일부 중국 딜러가 특수 조달 채널을 통해 여러 층의 재판매 및 포장을 통해 서버 '곡선 상장'을 달성했다고 공개했습니다. 또한 일부 딜러는 타사의 도움을 받아 제품에 모듈을 내장하는 방식으로 서버를 확보하는 또 다른 경로를 이용한다는 사실도 알게 되었습니다.
어둠 속의 산업 체인 뒤에서 국내 산술 산업의 발전도 새로운 방향을 보여주고 있습니다.
01스마트 컴퓨팅 거품은 어디에서 왔을까?
2023년 말, 바다 건너편에서 들려온 '엔비디아 금지령'은 잔잔한 호수에 던져진 돌멩이와 같았고 산술의 핵심 자원을 둘러싼 어두운 전쟁이 시작되었습니다.
처음 몇 달 동안 시장은 일종의 원시적인 혼돈과 동요를 보였습니다. 수익 창출의 유혹에 이끌려 예민한 후각을 가진 일부 개인이 위험을 감수하기 시작했습니다. 익명을 원하지 않는 한 업계 관계자는 "당시 시장에는 해외에서 돌아온 유학생과 정보에 밝은 일부 개인 덤퍼 등 다양한 배경을 가진 '공급자'들이 넘쳐났다"며 "이들의 유통 방식은 비교적 단순하고 거칠었다"고 회상했습니다. 단순하고 거칠었으며 거래는 비밀리에 이루어졌지만 나중에 형성된 복잡한 하도급 사슬과는 거리가 멀었습니다."
이러한 초기 '선구자'들은 정보 격차와 다양한 비공식 채널을 활용하여 NVIDIA의 하이엔드 그래픽 카드를 시장에 공급했습니다. 그 결과 자연스럽게 그래픽 카드 가격이 상승했습니다. 일부 언론 보도에 따르면, 일부 개별 공급업체는 공식 권장 소매 가격인 미화 약 1만 달러보다 훨씬 높은 12만 8천 위안에 NVIDIA A100 그래픽 카드 가격을 책정하기도 했습니다. 게다가 일부 사람들은 소셜 미디어 플랫폼에서 H100 칩을 한 개에 25만 위안에 판매하고 있다고 주장하기도 했습니다. 당시에는 위의 모든 행동과 제스처가 과대광고에 가까웠다고 할 수 있습니다.
이러한 숨겨진 순환 속에서 일부 대형 산술 공급업체들이 유사한 거래 네트워크 채널을 갖기 시작했고, 그 결과 스마트 컴퓨팅 붐도 같은 기간에 일어났습니다. 2022년부터 2024년 사이에 많은 곳에서 스마트 컴퓨팅 센터를 서둘러 건설하기 시작했습니다. 일부 데이터에 따르면 2024년에만 458개 이상의 스마트 컴퓨팅 센터 프로젝트가 진행 중입니다.
그러나 이러한 '카드 투기 및 스마트 컴퓨팅 붐'은 오래가지 못했습니다. 2024년 말, 특히 딥시크와 다른 국내 대형 모델이 높은 가성비를 내세우며 등장한 이후, 순전히 '카드 사재기'에 의존하거나 핵심 기술이 부족한 일부 업체는 점점 더 어려움을 겪게 되었습니다. 스마트 컴퓨팅의 거품도 서서히 꺼질 조짐을 보이고 있습니다.
통계에 따르면 2025년 1분기에 중국 본토에서 총 165개의 스마트 컴퓨팅 센터 프로젝트가 새로 개발되었으며, 이 중 58%(95개)에 달하는 프로젝트가 아직 승인 또는 준비 작업 상태에 있고 나머지 33%(54개)는 건설 중이거나 곧 가동될 상태이며 실제로 가동되거나 시운전된 프로젝트는 16개에 불과한 것으로 나타났습니다. 16개 프로젝트는 10% 미만을 차지합니다.
물론 거품이 꺼질 조짐을 보이는 것은 미국뿐만이 아닙니다. 지난 6개월 동안 Meta, Microsoft 등이 글로벌 데이터센터 프로젝트 중 일부를 중단한다는 소문이 돌았습니다. 거품의 다른 이면에는 비효율성과 유휴 상태가 우려되고 있습니다.
한 업계 소식통은 "현재 IQC의 점등률은 50% 미만이며, 국산 칩은 성능 부족으로 사전 훈련에 전혀 사용할 수 없다"고 말했습니다. 그리고 일부 스마트 컴퓨팅 센터에서는 상대적으로 오래된 서버를 사용하고 있습니다."
이러한 '쓸 수 없는 카드' 현상에 대해 업계 관계자들은 컴퓨팅 파워의 절대적인 과잉이 아니라 '구조적 불일치'가 원인으로 지목하고 있습니다. 컴퓨팅 파워의 절대적인 과잉이 아니라 하이엔드 수요를 충족할 수 있는 효과적인 컴퓨팅 파워가 부족하고, 동시에 열악한 기술, 불완전한 생태계, 운영 능력 부족으로 인해 이미 구축된 많은 컴퓨팅 파워 자원을 충분히 활용하지 못하고 있다는 것입니다.
그러나 스마트 컴퓨팅에 대한 기대와 숨겨진 우려가 공존하는 가운데, 거대 기술 기업들은 매우 다른 태도를 보이고 있습니다.
바이트 점프는 2025년 AI 인프라에 123억 달러(약 892억 원) 이상을 투자할 계획이며, 이 중 400억 위안은 중국 내 AI 칩 조달에, 약 500억 위안은 엔비디아 칩 구매에 쓸 계획인 것으로 알려졌습니다. 이와 관련하여 바이트 측은 호랑이 측에 대응하여 뉴스가 부정확하다고 말했습니다.
또한 알리바바는 AI에 막대한 투자를 하고 있습니다. 우용밍 알리바바 CEO는 2월 24일 향후 3년간 AI 인프라 구축에 3,800억 위안을 투자할 계획이라고 공개적으로 발표했습니다. 이 수치는 지난 10년간의 합계를 훌쩍 뛰어넘는 금액입니다.
그러나 대규모 구매에 직면해 공급 측면의 압박도 부각되고 있습니다." 이어 "대형 제조업체에 공급하기에는 시장 공급이 너무 늦어 많은 업체들이 납품하지 않기로 계약했다"고 덧붙였다. 한 현명한 컴퓨팅 공급업체 영업 직원은 Tiger에 이렇게 말했습니다.
반면, 앞서 언급한 스마트 컴퓨팅 거품과 오늘날의 대형 제조업체들이 AI 인프라에 막대한 자금을 투자하는 것은 극명한 대조를 이룹니다. 한편으로는 A주 주도 연산 공급업체들이 대규모 스마트 컴퓨팅 프로젝트를 중단해야 하는 반면, 다른 한편에서는 대형 제조업체들이 AI 인프라에 적극적으로 투자하고 있기 때문입니다.
그리고 그 이유는 어렵지 않게 이해할 수 있습니다. 스마트 컴퓨팅이 급격히 냉각된 시점이 바로 딥시크를 전후로 나타났기 때문입니다. 올해부터는 아무도 "100가지 전쟁 모드"라는 개념을 제시하지 않고, 딥시크는 훈련 수요의 거품을 터뜨리고 있습니다. 현재 테이블에 남은 것은 대기업과 몇몇 AI 모델링 회사뿐입니다.
이와 관련해 펑보 상임베이스캐피탈 매니징 파트너는 타이거센스에 "훈련이 100가지 꽃이 아닐 때, 정말 훈련 능력과 자격을 갖춘 사람들은 알리, 바이트 등 카드 훈련을 계속 구매할 것이고, 노래 끝에 있는 사람들의 훈련을 할 능력이 없는 사람들은 손 안에 있는 사람들, 즉 산술은 거품이 됩니다."
02계산 능력이 전대
모든 '거품'의 탄생은 희소성에 대한 인간의 비합리적인 상상력에 뿌리를 두고 있습니다. 마오타이에 투기하고 컴퓨팅 파워를 사재기하는 사람들은 마오타이 애호가나 컴퓨팅 파워 소비자가 아니라 투기적 사고방식을 공유하는 사람들입니다.
2024년 말과 2025년 1분기를 기준으로 페이리신, 로터스홀딩스, 진지주식회사 등 많은 기업이 수억 달러 규모의 연산 파워 임대 계약을 해지했습니다. 한편 한 컴퓨팅 파워 공급업체는 타이거에 "컴퓨팅 파워 임대 사업에서는 임대를 포기하는 것이 일반적"이라고 말했습니다.
리스를 해지한 이들 기업이 산술적 수요의 실제 종착점은 아닙니다. 딥시크가 촉발한 업계 충격으로 AI 산업 거품이 서서히 꺼지면서 많은 산술 공급업체는 과잉 산술 문제에 직면해 안정적인 고객 공급처를 찾고 새로운 산술 소비 경로를 모색해야 합니다.
타이거 스니프는 조사에서 스마트 컴퓨팅, 클라우드 컴퓨팅 분야 기업 세 곳 외에도 컴퓨팅 파워 공급 업체 창업자의 명함을 발견했지만 투자 회사도 명확하게 인쇄되어 있습니다. 추가 조사 결과 투자 회사의 투자 프로젝트에는 로봇 공학 회사와 대형 모델 및 클라우드 시스템 개발에 주력하는 기업이 포함되어 있는 것으로 나타났습니다. 설립자는 타이거뷰에 "이 두 포트폴리오 회사의 전체 산술 수요는 자체 산술 공급 시스템으로 충족되며, 포트폴리오 회사는 일반적으로 낮은 시장 가격으로 자체 산술 공급을 구매한다"고 밝혔습니다. "
사실, 스마트 컴퓨팅 업계에서 스마트 컴퓨팅 + 투자 결합 형태는 결코 고립된 사례가 아닙니다. 많은 산술 공급 업체에게 "이것은 현재 카드를 제거하는 것이 매우 좋은 방법이며 테이블에 올려 놓지 않을뿐입니다." 펑보는 호랑이 냄새에 말했다.
그러나 위의 이야기에서 이것은 산술 취소의 "독점적" 경로, 즉 산술 공급자가 투자를 통해 산술 수요를 잠그고 투자 된 프로젝트의 모든 산술 수요를 직접 충족시키는 경로입니다. 하지만 이것이 유일한 방법은 아닙니다.
펑보는 "산술 공급자가 산업 펀드에 투자하여 폐쇄 루프 산술 수요 체인 모델을 구축하는 또 다른 모델도 주목할 가치가 있다"고 믿습니다. "
구체적으로 이 비즈니스 모델은 자본 연계 기능을 제시합니다. 산술 공급자 A가 잠재적 유한 파트너(LP)로서 산업 펀드 B와 협력 의향에 도달하고, 펀드 B의 투자 지도에서 LP는 산업에 투자할 수 있게 됩니다. B 펀드의 투자 맵에서 투자 대상인 인공지능 애플리케이션 공급업체 C는 사업 개발을 위해 컴퓨팅 파워 자원에 대한 수요가 높습니다. 이때 A는 B 펀드에 전략적 투자를 통해 C사의 향후 연산 능력 조달 수요를 간접적으로 구속하여 '자본 투자-산술 능력 조달'의 폐쇄 루프를 구축합니다.
이 거래가 성사되면 A사는 LP 지위에 따라 서비스 우선권을 갖게 되며, C사의 산술적 조달을 위한 우선 공급업체가 됩니다. 이 모델은 본질적으로 자본의 순환적 흐름을 만들어내며, A사의 펀드 B에 대한 기여는 궁극적으로 C사의 전력 구매를 통해 다시 전달됩니다.

"주류 접근 방식은 아니지만 여전히 비교적 잘 작동하는 방식입니다. ." 펑보가 고백했습니다.
03거품이 곧 터질 텐데, 그다음은?
"스마트 컴퓨팅 거품에 대해 이야기 할 때 산술에 대해서만 이야기 할 수 없으며 산업 체인의 문제이며 산술을 작동 시키려면 끊어진 점을 묶어야하는데 현재 산업 체인은 폐쇄 루프를 형성하지 못했습니다." 수년간 산술 업계에 깊이 관여해 온 한 산술 공급업체의 최고 마케팅 책임자는 현재 스마트 산술 산업의 핵심을 타이거 센스에게 설득력 있게 지적했습니다.
2025년 상반기에 접어들면서 AI 분야에서 주목할 만한 트렌드는 주요 AI 기업의 입에 오르내리던 '사전 학습'이라는 단어가 점차 '추론'이라는 단어로 대체되고 있다는 점입니다. 주요 AI 기업들 사이에서 회자되던 '사전 학습'이라는 용어는 점차 '추론'이라는 단어로 대체되고 있습니다. 광범위한 C-엔드 소비자 시장이든, 수천 개의 산업을 지원하는 B-엔드 엔터프라이즈 애플리케이션이든, 추론 수요의 성장 곡선은 이례적으로 가파른 것으로 보입니다.
"간단한 예측을 해볼 가치가 있습니다." 한 업계 분석가는 "예를 들어 Doubao 및 DeepSeek와 같은 현재 시장의 주류 AI 앱의 규모를 계산하기 위해 다음과 같이 가정해 볼 수 있습니다."라고 추정했습니다. 각 활성 사용자가 하루 평균 10개의 이미지를 생성한다고 가정하면 산술적 수요는 수백만 개에 달할 수 있습니다. 이는 이미지 생성의 단일 시나리오에 불과합니다. 이는 이미지 생성의 단일 시나리오에 불과하며 텍스트, 음성, 비디오 및 기타 멀티모달 상호 작용이 겹쳐지면 그 수요는 훨씬 더 헤아릴 수 없습니다."
이것은 C-사용자의 추론 요구 사항일 뿐입니다. B급 사용자의 경우 추론 수요는 훨씬 더 방대합니다. 시노벨의 한 임원은 타이거센스에 "지능형 컴퓨팅 센터의 자동차 공장 건설은 1만P 규모로 시작된다"며 "대형 공장 외에 우리 고객 중 컴퓨팅 파워 수요가 가장 많은 곳은 자동차 공장"이라고 말했다.
그러나 엄청난 추론 수요를 산술적 거품과 연관 지어 생각해보면, 이 이야기는 매우 터무니없는 이야기입니다. 추론에 대한 엄청난 수요가 왜 여전히 산술 거품을 만드는 것일까요?
한 연산 서비스 제공업체는 Tiger Sense에 이와 같은 대규모 추론 수요는 스마트 컴퓨팅 서비스 제공업체가 시작 시간 압축, 스토리지 개선, 추론 지연 시간 단축, 처리량 및 추론 정확도 향상 등과 같은 엔지니어링 기술을 통해 산술을 최적화해야 한다고 말했습니다.
이뿐만 아니라 앞서 언급한 수요-공급 불일치 문제도 칩 문제에서 기인한 부분이 큽니다. 이와 관련하여 업계에 정통한 업계 소식통은 타이거, 일부 국내 카드와 엔비디아 격차가 여전히 상대적으로 크고, 자체 성능 개발이 균일하지 않고, 더 많은 카드 짧은 보드의 더미가 여전히 존재하더라도 동일한 브랜드가 단일 클러스터로 이어지는 AI 학습 및 추론을 효과적으로 완료 할 수 없다고 말했다.
이러한 '쇼트보드 효과'는 칩을 대규모로 쌓아 연산 클러스터를 구축하더라도 쇼트보드 문제가 효과적으로 해결되지 않으면 전체 클러스터의 전체적인 성능은 여전히 한계에 봉착하게 되고, AI 대형 모델의 복잡한 학습을 효율적으로 지원하기 어렵다는 것을 의미합니다. 이 과정의 첫 번째 단계는 많은 수의 칩으로 대규모 칩 클러스터를 구축하는 것입니다.
사실, 산술 수준에서의 엔지니어링 과제와 칩 병목 현상은 심각하지만, 많은 심층적인 산술 요구 사항은 효과적으로 충족되지 않았으며 실제 '중단점'은 산술 계층 위의 애플리케이션 에코시스템, 특히 L2 계층(즉, 특정 산업이나 시나리오의 수직 클래스 모델)에 있는 경우가 많습니다.
L2 계층(즉, 특정 산업 또는 시나리오용)은 펜던트 모델에 심각한 격차가 있습니다.
의료 산업에는 메워야 할 거대한 '구멍'이 존재하며, 인재 유출 효과는 국내 의료 시스템에서 오랫동안 비판받아 온 구조적 문제로, 최고의 의사들이 도시의 최상위 3차 병원에 집중되어 있습니다. 하지만 의료계가 빅 의료 모델에 기대어 고급 의료 자원의 쏠림 현상을 해결하려 할 때, 보다 근본적인 문제인 신뢰할 수 있는 의료 데이터 공간을 어떻게 구축할 것인가라는 과제가 떠오릅니다.
데이터는 전 과정 진단 및 치료 기능을 갖춘 펜던트형 빅 모델을 학습시키기 위한 핵심 전제 조건이기 때문입니다. 하지만 문제는 빅데이터 모델에 지식을 형성하기 위해서는 전체 질병 경과, 연령대, 성별, 지역에 걸쳐 방대한 양의 데이터가 있어야 한다는 것입니다. 그리고 현실은 의료 데이터의 5% 미만이 공개되어 있다는 것입니다.
한 3차 병원의 정보 부서장은 병원에서 매년 생성되는 500TB의 진단 및 치료 데이터 중 실제로 AI 학습에 사용할 수 있는 정형화된 데이터는 3% 미만이라고 밝혔습니다. 게다가 질병 지도 가치의 80%를 차지하는 희귀 및 만성 질환 데이터는 민감성 때문에 여러 의료 기관의 '데이터 사일로'에 오랫동안 잠자고 있었습니다.
이러한 문제점을 해결하지 못하면 산업 체인이 폐쇄형 루프를 형성할 수 없습니다. 컴퓨팅 파워에 대한 수요는 충족되지 않으며, 이는 자체적으로 처리할 수 있는 '카드와 전기'만 제공할 수 있는 기존 컴퓨팅 파워 인프라 제공업체의 범위를 분명히 벗어납니다.
그러나 오늘날 시장에는 새로운 유형의 스마트 컴퓨팅 서비스 제공업체가 조용히 등장하고 있습니다. 이러한 기업들은 더 이상 단순히 하드웨어나 컴퓨팅 파워 임대를 제공하는 데 그치지 않고, 보다 전문적인 알고리즘 팀과 업계 전문가 팀을 구성하여 고객의 AI 애플리케이션 개발 및 최적화 과정에 깊이 관여할 수 있습니다.
동시에 다양한 자원 불일치 및 산술 활용 문제에 직면하여 실제로 여러 지역에서 지역 산업 수요에 따라 다양한 산술 보조금 정책을 도입하고 있으며, 그중 '산술 쿠폰'은 산술 보조금 사용 비용을 직접적으로 절감할 수 있는 방법입니다. '산술 쿠폰'은 산술 사용 비용을 직접적으로 줄여주는 일종의 보조금입니다. 이 회사의 최신 상품인 '아크 바우처'는 기업의 산술 사용 비용을 직접적으로 줄여주는 보조금입니다.
오늘날 컴퓨팅 업계에 필요한 것은 '피를 키우는' 육성 생태계입니다.