Tác giả: Giá trị chuỗi cacbon
Xu hướng phát triển của Ai+Crypto dường như đang diễn ra nhanh chóng. Chỉ là cách biểu diễn lần này có chút khác biệt so với những gì mọi người tưởng tượng trước đó. Nó được thực hiện dưới hình thức đụ nhau. Đầu tiên Ai hoạt động trong thị trường vốn truyền thống và sau đó là thị trường tiền điện tử.
Vào ngày 27 tháng 1, số lượt tải xuống của DeepSeek, một mô hình AI Trung Quốc đang bất ngờ nổi lên, lần đầu tiên đã vượt qua ChatGPT. Nó đứng đầu danh sách APPStore của Mỹ. Nó đã gây ra sự chú ý và báo cáo đặc biệt từ cộng đồng công nghệ, cộng đồng đầu tư và thậm chí cả cộng đồng truyền thông toàn cầu.

Đằng sau sự việc này, chúng ta không chỉ được nhắc nhở về khả năng mô hình phát triển khoa học và công nghệ Trung-Mỹ trong tương lai có thể bị viết lại. Nó cũng gây ra sự hoảng loạn ngắn hạn cho thị trường vốn Hoa Kỳ. Bị ảnh hưởng bởi điều này, Nvidia đã giảm 5,3%. ARM giảm 5,5%. Broadcom giảm 4,9%. TSMC giảm 4,5%. Ngoài Micron, AMD và Intel, cũng có sự sụt giảm tương ứng. Thậm chí, chỉ số tương lai Nasdaq 100 còn giảm xuống -400 điểm. Nó dự kiến sẽ đạt mức giảm trong một ngày lớn nhất kể từ ngày 18 tháng 12. Theo số liệu thống kê chưa đầy đủ, giá trị thị trường của thị trường chứng khoán Mỹ dự kiến sẽ bốc hơi hơn 1 nghìn tỷ USD trong phiên giao dịch thứ Hai. Mất một phần ba tổng giá trị thị trường tiền điện tử.
Thị trường mã hóa theo sát xu hướng của thị trường chứng khoán Mỹ cũng chứng kiến sự sụt giảm mạnh do DeepSeek gây ra. Trong số đó, Bitcoin đã giảm xuống dưới 100.500 USD, với mức giảm 4,48% trong 24 giờ. ETH giảm xuống dưới 3.200 USD, với mức giảm 3,83% trong 24 giờ. Nhiều người vẫn đang gãi đầu thắc mắc tại sao thị trường tiền điện tử lại lao dốc nhanh đến vậy? Nó có thể liên quan đến kỳ vọng thấp hơn về việc cắt giảm lãi suất của Cục Dự trữ Liên bang hoặc thậm chí các yếu tố vĩ mô khác.
Vậy sự hoảng loạn của thị trường đến từ đâu? DeepSeek không được phát triển bằng cách tích lũy vốn dồi dào và card đồ họa khổng lồ như OpenAi, Meta hay thậm chí là Google. OpenAI được thành lập cách đây 10 năm, có 4.500 nhân viên và cho đến nay đã huy động được 6,6 tỷ USD vốn tài trợ. Meta đang chi 60 tỷ USD để phát triển một trung tâm dữ liệu trí tuệ nhân tạo có quy mô gần bằng Manhattan. Ngược lại, DeepSeek được thành lập cách đây chưa đầy 2 năm, có 200 nhân viên và có chi phí phát triển dưới 10 triệu USD. Nó đã không bỏ ra số tiền khổng lồ để tích lũy card đồ họa GPU NVIDIA.
Một số người không thể không hỏi: Làm thế nào họ có thể cạnh tranh với DeepSeek?
Điều mà DeepSeek phá vỡ không chỉ là lợi thế về chi phí ở cấp độ vốn/kỹ thuật mà còn là các khái niệm và hệ tư tưởng truyền thống cố hữu trước đây của con người.
Phó chủ tịch sản phẩm của DropBox than thở trên mạng xã hội X rằng DeepSeek là một câu chuyện mang tính đột phá kinh điển. Những công ty đương nhiệm đang tối ưu hóa các quy trình hiện có, trong khi những công ty đột phá đang xem xét lại các phương pháp tiếp cận cơ bản. DeepSeek đặt câu hỏi: Điều gì sẽ xảy ra nếu chúng ta làm điều này thông minh hơn thay vì đầu tư vào nhiều phần cứng hơn?
Điều bạn cần biết là hiện nay, chi phí đào tạo những mô hình lớn về trí tuệ nhân tạo hàng đầu là vô cùng đắt đỏ. Các công ty như OpenAI và Anthropic chi hơn 100 triệu USD chỉ riêng cho điện toán. Họ cần các trung tâm dữ liệu lớn được trang bị hàng nghìn GPU trị giá 40.000 USD. Giống như cần cả một nhà máy điện để vận hành một nhà máy.
DeepSeek bất ngờ xuất hiện và nói: "Làm điều này với giá 5 triệu đô la thì sao?" Họ không chỉ nói mà thực sự đã làm được. Mô hình của họ tương đương hoặc tốt hơn GPT-4 và Claude trong nhiều nhiệm vụ. Làm sao? Họ đã suy nghĩ lại mọi thứ từ đầu. AI truyền thống giống như viết mỗi số có 32 chữ số thập phân. DeepSeek giống như "Điều gì sẽ xảy ra nếu chúng ta chỉ sử dụng 8 chữ số thập phân? Nó vẫn đủ chính xác!" Cần ít bộ nhớ hơn 75%.
Phó chủ tịch sản phẩm của DropBox cho biết kết quả thật đáng kinh ngạc: chi phí đào tạo giảm từ 100 triệu USD xuống còn 5 triệu USD. Số lượng GPU cần thiết sẽ giảm từ 100.000 xuống còn 2.000. Chi phí API giảm 95%. Chạy trên GPU chơi game, không cần phần cứng trung tâm dữ liệu. Quan trọng hơn, chúng là nguồn mở. Đó không phải là phép thuật, chỉ là kỹ thuật cực kỳ thông minh.
Một số người còn cho rằng Deepseek đã lật đổ hoàn toàn quan niệm truyền thống trong lĩnh vực trí tuệ nhân tạo:
Trung Quốc sẽ chỉ sử dụng mã nguồn đóng/công nghệ độc quyền.
Thung lũng Silicon là trung tâm phát triển trí tuệ nhân tạo toàn cầu và có lợi thế dẫn đầu rất lớn.
OpenAI có một con hào vô song.
Bạn cần bỏ ra hàng tỷ, thậm chí hàng chục tỷ đô la để phát triển mô hình SOTA.
Giá trị của mô hình sẽ tiếp tục tích lũy (giả thuyết mô hình béo
Giả định về khả năng mở rộng ngụ ý rằng hiệu suất của mô hình có liên quan tuyến tính với chi phí đầu vào đào tạo (điện toán, dữ liệu, GPU). Tất cả những hiểu biết thông thường này, nếu không nói là bị lật đổ hoàn toàn chỉ sau một đêm, thì đã bị Shake.
Archerman Capital, một tổ chức đầu tư cổ phần nổi tiếng của Mỹ, đã nhận xét về DeepSeek trong một cuộc họp ngắn: Trước hết, DeepSeek thể hiện một chiến thắng của toàn bộ ngành công nghiệp nguồn mở trước nguồn đóng. Đóng góp cho cộng đồng sẽ nhanh chóng chuyển thành sự thịnh vượng của toàn bộ cộng đồng nguồn mở. Tôi tin rằng Sức mạnh của nguồn mở, bao gồm cả Meta, sẽ phát triển hơn nữa mô hình nguồn mở trên cơ sở này. căn chỉnh: trái;">Thứ hai, OpenAI. Con đường tạo ra những điều kỳ diệu một cách mạnh mẽ này có vẻ hơi đơn giản và thô sơ trong thời điểm hiện tại, nhưng không loại trừ rằng khi đạt đến một mức nhất định, những thay đổi mới về chất sẽ xảy ra và khoảng cách giữa nguồn đóng và nguồn mở sẽ ngày càng lớn. thật khó để nói từ 70 năm qua của AI. Kinh nghiệm phát triển lịch sử cho thấy sức mạnh tính toán là rất quan trọng và có thể vẫn như vậy trong tương lai
Vậy thì DeepSeek. Để mô hình nguồn mở tốt như mô hình nguồn đóng và hiệu quả hơn sẽ giảm bớt nhu cầu chi tiền để mua API của OpenAI. một hoặc hai năm nữa, rất có thể chúng ta sẽ chứng kiến nhiều sản phẩm chip suy luận phong phú hơn và hệ sinh thái ứng dụng LLM thịnh vượng hơn
Cuối cùng, nhu cầu về sức mạnh tính toán sẽ không giảm. Có một nghịch lý Jevons cho rằng việc cải thiện hiệu suất của động cơ hơi nước trong cuộc cách mạng công nghiệp lần thứ nhất đã khiến tổng lượng than tiêu thụ trên thị trường tăng lên. đến thời đại của Big Brother Trong thời đại điện thoại di động Nokia phổ biến, chúng được ưa chuộng vì giá rẻ. Vì sự phổ biến của chúng, tổng lượng tiêu thụ trên thị trường tăng lên.