Tác giả: Haotian Nguồn: X, @tmel0211
Một mặt, Meta đã chi 14,8 tỷ đô la để mua lại gần một nửa vốn chủ sở hữu của Scale AI và toàn bộ Thung lũng Silicon đã thốt lên rằng những gã khổng lồ này đã sử dụng mức giá trên trời để định giá lại "gắn nhãn dữ liệu"; mặt khác, @SaharaLabsAI, công ty sắp nắm giữ TGE, vẫn bị mắc kẹt dưới nhãn thiên vị AI Web3 là "sử dụng các khái niệm và không thể tự chứng minh". Thị trường đã bỏ qua chính xác điều gì đằng sau sự tương phản lớn này?
Trước hết, gắn nhãn dữ liệu là một hướng đi có giá trị hơn so với tổng hợp sức mạnh tính toán phi tập trung.
Câu chuyện thách thức những gã khổng lồ điện toán đám mây bằng GPU nhàn rỗi thực sự thú vị, nhưng sức mạnh tính toán về cơ bản là một mặt hàng tiêu chuẩn và sự khác biệt chủ yếu nằm ở giá cả và tính khả dụng. Lợi thế về giá dường như có thể tìm ra một khoảng trống trong thế độc quyền của những gã khổng lồ, nhưng tính khả dụng phụ thuộc vào phân phối địa lý, độ trễ mạng và động lực của người dùng không đủ. Một khi những gã khổng lồ giảm giá hoặc tăng nguồn cung, lợi thế này sẽ bị xóa sổ ngay lập tức.
Gắn nhãn dữ liệu hoàn toàn khác - đây là một lĩnh vực khác biệt đòi hỏi trí tuệ của con người và phán đoán chuyên môn. Mỗi nhãn chất lượng cao mang kiến thức chuyên môn, nền tảng văn hóa, kinh nghiệm nhận thức, v.v. độc đáo, không thể được "chuẩn hóa" và sao chép như sức mạnh tính toán của GPU.
Gắn nhãn chẩn đoán hình ảnh ung thư chính xác đòi hỏi trực giác chuyên môn của một bác sĩ ung thư cao cấp; phân tích tâm lý thị trường tài chính giàu kinh nghiệm không thể tách rời khỏi kinh nghiệm thực tế của Wall Street Trader. Sự khan hiếm tự nhiên và tính không thể thay thế này mang lại cho "việc dán nhãn dữ liệu" một độ sâu hào mà sức mạnh tính toán không bao giờ có thể đạt tới.
Vào ngày 10 tháng 6, Meta chính thức công bố việc mua lại 49% cổ phần của công ty dán nhãn dữ liệu Scale AI với giá 14,8 tỷ đô la Mỹ, đây là khoản đầu tư đơn lẻ lớn nhất vào lĩnh vực AI trong năm nay. Điều đáng chú ý hơn là Alexandr Wang, nhà sáng lập kiêm giám đốc điều hành của Scale AI, cũng sẽ giữ chức vụ người đứng đầu phòng thí nghiệm nghiên cứu "siêu trí tuệ" mới thành lập của Meta.
Doanh nhân người Trung Quốc 25 tuổi này đã bỏ học tại Đại học Stanford khi anh thành lập Scale AI vào năm 2016. Ngày nay, công ty anh quản lý được định giá 30 tỷ đô la. Danh sách khách hàng của Scale AI là "đội hình toàn sao" trong ngành AI: OpenAI, Tesla, Microsoft, Bộ Quốc phòng, v.v. đều là những đối tác lâu năm của công ty. Công ty chuyên cung cấp dịch vụ chú thích dữ liệu chất lượng cao cho việc đào tạo mô hình AI và có hơn 300.000 người chú thích được đào tạo chuyên nghiệp.
Bạn thấy đấy, trong khi mọi người vẫn đang tranh cãi về việc mô hình của ai có điểm cao hơn, thì những người chơi thực sự đã âm thầm chuyển chiến trường sang nguồn dữ liệu.
Một "cuộc chiến bí mật" để kiểm soát tương lai của AI đã bắt đầu.
Thành công của Scale AI đã phơi bày một sự thật bị bỏ qua: sức mạnh tính toán không còn khan hiếm nữa, kiến trúc mô hình có xu hướng đồng nhất và thứ thực sự quyết định giới hạn trên của trí thông minh AI chính là dữ liệu được "điều chỉnh" cẩn thận. Thứ mà Meta mua với giá cắt cổ không phải là một công ty gia công phần mềm, mà là "quyền khai thác dầu mỏ" trong kỷ nguyên AI.
Luôn có những kẻ nổi loạn trong những câu chuyện độc quyền.
Giống như các nền tảng tổng hợp điện toán đám mây cố gắng phá hoại các dịch vụ điện toán đám mây tập trung, Sahara AI cố gắng sử dụng blockchain để viết lại hoàn toàn các quy tắc phân phối giá trị của chú thích dữ liệu. Sai sót nghiêm trọng của mô hình chú thích dữ liệu truyền thống không phải là vấn đề kỹ thuật, mà là vấn đề thiết kế khuyến khích.
Một bác sĩ có thể chỉ nhận được vài chục đô la tiền công cho một vài giờ chú thích hình ảnh y tế, trong khi mô hình AI được đào tạo bằng dữ liệu này có giá trị hàng tỷ đô la, nhưng bác sĩ không nhận được một xu nào. Sự phân phối giá trị cực kỳ bất công này kìm hãm nghiêm trọng thiện chí cung cấp dữ liệu chất lượng cao.
Với sự xúc tác của cơ chế khuyến khích token web3, họ không còn là "người lao động di cư" dữ liệu giá rẻ nữa mà là "cổ đông" thực sự của mạng AI LLM. Rõ ràng, lợi thế của web3 trong việc chuyển đổi quan hệ sản xuất phù hợp hơn với các kịch bản chú thích dữ liệu hơn là sức mạnh tính toán.
Điều thú vị là Sahara AI tình cờ nằm trong nút TGE được Meta mua lại với giá cao ngất ngưởng. Đây là sự trùng hợp ngẫu nhiên hay là một kế hoạch cẩn thận? Theo tôi, điều này thực sự phản ánh một điểm uốn của thị trường: cả Web3 AI và Web2 AI đều đã chuyển từ "sức mạnh tính toán khối lượng" sang ngã ba đường của "chất lượng dữ liệu khối lượng".
Trong khi những gã khổng lồ truyền thống sử dụng tiền để xây dựng các rào cản dữ liệu, Web3 đang sử dụng Tokenomics để xây dựng một thử nghiệm "dân chủ hóa dữ liệu" lớn hơn.