저자: Haotian 출처: X, @tmel0211
한편으로 메타는 148억 달러를 들여 Scale AI의 지분 절반 가까이를 인수했고 실리콘밸리 전체는 거대 기업이 "데이터 주석 가격을 재조정"하기 위해 높은 가격을 사용하고 있다고 외쳤습니다. "
@SaharaLabsAI는 여전히 "개념만 있고 스스로 증명하지 못한다"는 Web3 AI 편견에 갇혀 있으며, 곧 TGE가 될 반대편에 있습니다. 이 거대한 대조 뒤에 시장이 놓치고 있는 것은 무엇일까요?
첫째, 데이터 라벨링은 탈중앙화된 산술 집계보다 훨씬 더 가치 있는 트랙입니다.
유휴 GPU로 거대 클라우드 기업에 도전하는 이야기는 좋은 이야기지만, 산술은 본질적으로 표준화된 상품이며, 그 차이는 주로 가격과 가용성에 있습니다. 가격 우위는 거대 독점에 틈새를 찾을 수 있는 것처럼 보이지만 지리적 분포, 네트워크 지연, 사용자 인센티브 부족으로 인해 접근성이 제한되며, 거대 기업이 가격을 인하하거나 공급을 늘리면 이 우위는 순식간에 사라질 것입니다.
데이터 주석은 완전히 다른 이야기이며, 인간의 지능과 전문적인 판단이 필요한 차별화된 분야입니다. 각각의 고품질 주석은 고유한 전문 지식, 문화적 배경, 인지적 경험 등을 담고 있으며, GPU 컴퓨팅 성능과 같은 '표준화된' 방식으로 복제할 수 없습니다.
정확한 암 이미지 진단에는 종양 전문의의 전문적인 직관이 필요하고, 훌륭한 금융 시장 심리 분석은 월스트리트 트레이더의 실제 경험과 분리될 수 없습니다. 이러한 태생적 희소성과 대체 불가능성은 '데이터 라벨링'에 컴퓨팅 파워로는 결코 도달할 수 없는 깊이를 부여합니다.
6월 10일, Meta는 데이터 라벨링 회사인 Scale AI의 지분 49%를 148억 달러에 인수한다고 공식 발표했는데, 이는 올해 AI 분야 단일 투자로는 가장 큰 규모입니다. 또한 Scale AI의 설립자 겸 CEO인 알렉산드르 왕(Alexandr Wang)이 메타의 새로운 초지능 연구소를 이끌게 됩니다.
25세의 중국인 사업가인 왕은 스탠퍼드 대학 중퇴생으로 2016년에 Scale AI를 설립했으며, 현재 300억 달러 규모의 회사를 이끌고 있습니다, OpenAI, Tesla, Microsoft, 국방부 등이 이 회사의 오랜 파트너입니다. 이 회사는 AI 모델 학습을 위한 고품질 데이터 주석을 전문으로 하며, 전문적으로 훈련된 30만 명 이상의 어노테이터를 보유하고 있습니다.
모두가 여전히 누가 더 높은 모델 점수를 가지고 있는지에 대해 논쟁하고 있을 때, 실제 플레이어들은 조용히 전장을 데이터 소스로 옮겼습니다.
AI의 미래를 장악하기 위한 '암흑의 전쟁'이 시작되었습니다.
스케일 AI의 성공으로 간과되었던 진실이 드러났습니다. 산술은 더 이상 희소하지 않고, 모델 아키텍처는 동질화되는 경향이 있으며, AI 지능의 상한을 실제로 결정하는 것은 신중하게 조정된 데이터입니다. 메타가 천문학적 가격표로 산 것은 아웃소싱 회사가 아니라 AI 시대의 석유를 추출할 수 있는 권리인 것입니다.
독점 이야기에는 항상 반란군이 있습니다.
클라우드 컴퓨팅 통합 플랫폼이 중앙 집중식 클라우드 컴퓨팅 서비스를 파괴하려고 하는 것처럼, 사하라 AI는 블록체인을 사용하여 데이터 주석의 가치 분배 규칙을 완전히 다시 쓰려고 합니다. 기존 데이터 라벨링 모델의 치명적인 결함은 기술적인 문제가 아니라 인센티브 설계의 문제입니다.
의료 이미지에 주석을 다는 데 몇 시간을 투자한 의사는 수십 달러의 인건비를 받을 수 있지만, 이 데이터로 학습된 AI 모델은 수십억 달러의 가치를 지니고 있지만 의사는 한 푼도 받지 못합니다. 이러한 불공정한 가치 분배는 고품질 데이터를 제공하려는 의욕을 심각하게 저해합니다.
웹3 토큰 인센티브라는 촉매제를 통해 이들은 더 이상 값싼 데이터 '이주 노동자'가 아니라 AI LLM 네트워크의 진정한 '주주'가 되었습니다. 분명히, 생산 관계를 변화시키는 웹3의 장점은 산술적 힘보다 데이터 라벨링 시나리오에 더 잘 적용됩니다.
흥미롭게도, 사하라 AI는 메타가 거액을 주고 산 바로 그 노드인 TGE에 있다는 점이 우연일까요, 아니면 조율일까요? 제 생각에 이것은 실제로 시장의 변곡점을 반영하는 것으로, 웹3 AI든 웹2 AI든 '롤 산술'에서 '롤 데이터 품질'의 교차로까지 왔다는 것입니다.
전통적인 거대 기업들이 돈으로 데이터 장벽을 쌓는 동안, Web3는 토큰노믹스를 통해 '데이터 민주화'라는 더 큰 실험을 하고 있습니다.