Nguồn: Tin tức Tencent Thâm Quyến
Niềm vui và nỗi buồn của con người không giống nhau. Từ năm 2016, năm đầu tiên của trí tuệ nhân tạo, ngành công nghiệp AI đã trải qua nhiều vòng xáo trộn. Cưỡi trên làn sóng của ChatGPT, DeepSeek đã khuấy động toàn bộ thị trường mô hình lớn như một con cá trê. So với nó, các công ty khởi nghiệp mô hình lớn khác, được coi là "Sáu con rồng nhỏ" của ngành, đang ở trong tình trạng mặt trời mọc ở phía đông và mưa rơi ở phía tây.
Sau khi DeepSeek gây chấn động ngành công nghiệp với DeepSeek-V3 giá rẻ có hiệu suất tương đương với GPT-4o, hãng đã phát hành mẫu R1 vào ngày 20 tháng 1. Sáu ngày sau khi ra mắt, nó đã đứng đầu danh sách tải xuống toàn cầu của Apple App Store và tổng số lượt tải xuống đã vượt quá 110 triệu lần trong vòng một tháng kể từ khi ra mắt. Trong thời gian này, các nhà cung cấp dịch vụ đám mây lớn đã nhanh chóng tung ra phiên bản mã nguồn mở V3 và R1, và các sản phẩm như Baidu Search và WeChat đang tích cực áp dụng DeepSeek.
Mô hình học tăng cường toàn cục k1.5 và mô hình suy luận từng bước Step R-mini của Kimi, được phát hành cùng lúc với DeepSeek, gần đạt đến o1 ở nhiều khía cạnh về khả năng của mô hình, nhưng chúng vẫn bị lấn át bởi dư luận sôi nổi về DeepSeek.
So với tiếng ồn của DeepSeek, "Sáu chú rồng nhỏ" cũng liên tiếp đưa tin: Zero One Everything lại tiếp tục chia rẽ, vụ kiện ngân sách và trọng tài của Dark Side of the Moon vẫn chưa được giải quyết, một giám đốc điều hành cấp cao khác của MIniMax đã từ chức...
Và đằng sau đó là các VC thất vọng: không có dự án nào được hỗ trợ bằng tiền thật đạt được sự nổi tiếng như DeepSeek. Hiện tại, bốn trong số “Sáu tiểu long” đã không công bố bất kỳ tin tức tài chính nào trong hơn nửa năm. Năm 2024, ngành công nghiệp nói rằng hai trong số "Sáu chú rồng nhỏ" đã tụt hậu. Năm 2025, ai sẽ là người tiếp theo tụt hậu?
Chỉ có ba công ty tiếp tục tập trung vào các mô hình lớn
Mức độ phổ biến của DeepSeek không phải là không có dấu hiệu. Kể từ khi ra mắt mô hình đầu tiên, DeepSeek Coder, vào ngày 2 tháng 11 năm 2023, hơn 10 phiên bản khác nhau của mô hình này đã được ra mắt trong hơn một năm. Trong số đó, mẫu V2 được phát hành vào tháng 5 năm ngoái có hiệu suất tương đương với GPT-4 Turbo, nhưng giá của nó chỉ bằng 1% GPT-4. Do đó, DeepSeek được gọi là "kẻ giết người giá rẻ" và "Pinduoduo của thế giới AI", đồng thời cũng mở ra vòng chiến giá đầu tiên trong ngành mô hình lớn.
Vào ngày 27 tháng 1 năm 2025, DeepSeek đã vượt qua ChatGPT và đứng đầu danh sách miễn phí trên Apple APP Store tại Trung Quốc và Hoa Kỳ, thu hút sự chú ý trên toàn cầu. Điều làm cho DeepSeek thành công chính là mô hình suy luận lớn DeepSeek-R1. Theo thông tin được DeepSeek công bố, điểm số của R1 trong nhiều bài kiểm tra có thẩm quyền đều gần bằng phiên bản chính thức o1, thậm chí ở một số bài kiểm tra, điểm số còn vượt xa phiên bản chính thức o1.
Ngoài thứ hạng, mã nguồn mở + hiệu quả về chi phí là sự kết hợp quan trọng khiến DeepSeek trở nên phổ biến. Bị ảnh hưởng bởi DeepSeek, nhà sáng lập Baidu Robin Li, người từng tin tưởng vào mã nguồn đóng, cũng tuyên bố rằng ông sẽ tham gia nhóm mã nguồn mở. Nhà sáng lập OpenAI Sam Altman cũng phản ánh rằng công ty luôn ở "phía sai" trong chiến lược mã nguồn mở của mình.
MiniMax, một trong “Sáu chú rồng nhỏ” của các mô hình lớn, đã phát hành mô hình nguồn mở đầu tiên của mình vào ngày 15 tháng 1. Nhà sáng lập Yan Junjie cũng đã nói trong một cuộc phỏng vấn với “Late Post” rằng “Tôi không có nhiều kinh nghiệm khi lần đầu tiên khởi nghiệp. Nếu tôi có thể lựa chọn lại, tôi nên mở nguồn vào ngày đầu tiên”. Trong số năm chú rồng nhỏ khác, chỉ có Zhipu là người đầu tiên đi trên hai chân: nguồn mở và nguồn đóng. Sau gần hai năm nỗ lực, hướng phát triển của "Lục Tiểu Long" đã đi theo những hướng trái ngược nhau.
Lingyi Wanwu là công ty mô hình lớn cơ bản đầu tiên công khai thực hiện các điều chỉnh lớn. Đầu tiên, công ty đã sa thải nhóm thuật toán đào tạo trước và nhóm Infra, và một số nhân viên đã gia nhập Alibaba bằng cách nhảy tàu. Sau đó, công ty đã công bố thành lập một phòng thí nghiệm chung về mô hình lớn công nghiệp và một cơ sở mô hình lớn công nghiệp với Alibaba Cloud và Khu công nghệ cao Tô Châu.
Về mặt nhân sự, Huang Wenhao, trưởng phòng đào tạo mô hình, Lan Yuchuan, người phụ trách nền tảng mở API mô hình lớn và Cao Dapeng, người phụ trách sản phẩm năng suất, đều đã từ chức. Zero One Everything đã cố gắng trụ lại trên bàn, nhưng không thể che giấu được thành tích đang suy giảm của mình trong vòng thi mô hình quy mô lớn này.
Baichuan Intelligence đã tuyên bố rõ ràng rằng họ sẽ bước vào lĩnh vực y tế vào năm 2024 và gần đây đã ra mắt "bác sĩ nhi khoa AI" đầu tiên. Baichuan có vẻ không thành công trong việc thương mại hóa To B. Người đồng sáng lập và giám đốc thương mại hóa Hong Tao đã rời công ty cách đây nhiều năm. Một nhân viên của Baichuan cho biết hiệu suất thực sự thấp hơn mong đợi. "Bây giờ chúng tôi có DeepSeek, áp lực trong năm nay chỉ tăng lên."
Một người phụ trách thương mại hóa To B khác đã từ chức là Wei Wei của MiniMax. Trước đó, Wei Wei đã nói trong một cuộc phỏng vấn rằng nhiều khách hàng B-side sẽ không dễ dàng trả tiền để hỗ trợ doanh thu của các công ty mô hình lớn. Họ chỉ có thể dựa vào khả năng R&D và thuật toán của mình để giúp khách hàng căn chỉnh hiệu ứng đầu ra trong các tình huống thực tế, điều này cũng chứng minh rằng việc thương mại hóa các mô hình lớn không phải là điều dễ dàng.
Có vẻ như những công ty duy nhất vẫn tập trung vào đổi mới công nghệ mô hình quy mô lớn và theo đuổi AGI là Dark Side of the Moon, Wisdom Spectrum và Step Star. Chịu ảnh hưởng của DeepSeek, Step-Xingchen cũng tham gia vào nhóm nguồn mở. Điểm khác biệt duy nhất giữa Step-Xingchen và DeepSeek, tập trung vào các mô hình văn bản, là các mô hình nguồn mở mới nhất của Step-Xingchen là hai mô hình đa phương thức - Step-Video-T2V và Step-Audio.
Sáng sớm ngày 23 tháng 2, Dark Side of the Moon đã phát hành bài báo mới nhất "Muon có thể mở rộng cho đào tạo LLM" và mã nguồn mở mô hình Moonlight của MoE, chỉ yêu cầu tham số kích hoạt mô hình 3B. Nhiều người trong ngành tin rằng đây là "Tuần lễ nguồn mở bị chặn" vì trước đó DeepSeek đã thông báo sẽ phát hành các dự án nguồn mở trong năm ngày liên tiếp.
Đối với Dark Side of the Moon, vấn đề cấp bách nhất có thể là sản phẩm Kimi mà công ty đã đầu tư rất nhiều.
Khó có thể trở thành người chơi hàng đầu bằng cách chi tiền và đầu tư vào lưu lượng truy cập
Giống như "Sáu chú rồng nhỏ" của các mẫu xe lớn, DeepSeek cũng có một sản phẩm C-end cùng tên, không gây được nhiều sự chú ý trên thị trường trong tuần đầu tiên sau khi ra mắt. Theo dữ liệu được QuestMobile tiết lộ với giới truyền thông, từ ngày 13 tháng 1 đến ngày 19 tháng 1 năm 2025, lượt tải xuống hàng tuần của ứng dụng DeepSeek chỉ là 285.000, ít hơn nhiều so với Doubao (4,52 triệu) và Kimi (1,557 triệu).
Sau khi phát hành R1 vào ngày 20 tháng 1 năm 2025, lượt tải xuống DeepSeek bắt đầu tăng mạnh. Nghiên cứu của Sensor Tower cho thấy DeepSeek đã được tải xuống hơn 16 triệu lần trong vòng 18 ngày kể từ khi ra mắt, gần gấp đôi so với 9 triệu lần khi ChatGPT của OpenAI được phát hành lần đầu tiên.
Lượng truy cập tăng đột biến đã khiến DeepSeek bị sập tại một thời điểm, nhưng ngay cả như vậy, đà tăng trưởng vẫn rất mạnh mẽ, với số lượt tải xuống hàng tháng vượt quá 110 triệu. Không một công ty nào có thể bỏ qua sự xuất sắc của DeepSeek. Tại cuộc họp nội bộ của ByteDance vào ngày 13 tháng 2, CEO Liang Rubo đã nói về DeepSeek và phản ánh rằng tốc độ theo dõi chưa đủ nhanh và năm nay ông sẽ theo đuổi việc ra mắt thông minh.
Bài kiểm tra thang độ xám WeChat của Tencent đã kết nối với tìm kiếm AI của DeepSeek và sau khi sử dụng vượt quá mong đợi, họ đã kêu gọi ứng dụng AI Yuanbao hỗ trợ tìm kiếm WeChat. Vào ngày 22 tháng 2, Tencent Yuanbao đã vượt qua Doubao của ByteDance và vươn lên vị trí thứ hai trong bảng xếp hạng tải xuống ỨNG DỤNG miễn phí của Apple tại Trung Quốc, trong khi DeepSeek tiếp tục đứng đầu danh sách.
Hai “ông lớn” số 1 và số 2 đổi chủ chỉ trong vòng một tháng, khiến Doubao và Kimi vốn đốt tiền để tăng trưởng nay mất đi lợi thế. Sự khác biệt giữa hai người là người trước là quý tộc sinh ra đã có "chìa khóa vàng", trong khi người sau là "doanh nhân mới". Theo ước tính trước đó của giới truyền thông, riêng chi tiêu hàng ngày của Kimi trên kênh iPhone đã lên tới gần 200.000 nhân dân tệ, trong khi của Doubao là 2,48 triệu nhân dân tệ.
Dưới ảnh hưởng của DeepSeek, Dark Side of the Moon gần đây được cho là đã cắt giảm mạnh ngân sách ra mắt sản phẩm, bao gồm cả việc tạm dừng ra mắt trên nhiều kênh Android và hợp tác với các nền tảng quảng cáo của bên thứ ba. Theo một người trong cuộc tiết lộ với AI Light Years, chương trình khuyến mãi thực sự đã được điều chỉnh cho phù hợp, "Có những bổ sung tự nhiên, nhưng chúng không thể so sánh với sự phát triển của DeepSeek".
Những rắc rối hiện tại của Kimi không chỉ giới hạn ở những điều này: "Undercurrent Waves" đã biết độc quyền rằng vụ kiện trọng tài Kimi, vốn bị gác lại trong một thời gian dài, vẫn chưa được giải quyết như mong đợi, mà đã bước vào quá trình tiếp theo của vụ kiện trọng tài. Theo nguồn tin nội bộ, hai bên trong vụ trọng tài Kimi là các cổ đông cũ của Circular Intelligence và Yang Zhilin... đã hoàn tất việc thanh toán tại HKIAC (Trung tâm Trọng tài Quốc tế Hồng Kông) vào cuối tháng 1 và cuối tháng 2, đồng thời thành lập tòa án trọng tài. Zhang Yutong, nhân vật chính chỉ trích gay gắt nhất đằng sau toàn bộ vụ việc, có thể sẽ bị kiện riêng.
MiniMax cũng đặt nhiều kỳ vọng vào các sản phẩm To C vì sản phẩm chủ lực Talkie của họ đã trở thành ứng dụng AI được tải xuống nhiều thứ tư tại Hoa Kỳ trong nửa đầu năm 2024, giúp họ gặt hái được thành công rực rỡ. Nhưng thời gian tốt đẹp không kéo dài lâu. Vào giữa tháng 12, Talkie lặng lẽ biến mất khỏi Apple App Store tại thị trường Hoa Kỳ, trong khi nền tảng Android không bị ảnh hưởng.
Step Star, Zero One Everything, Zhipu AI và Baichuan Intelligence cũng có sản phẩm ứng dụng AI của riêng mình, nhưng theo danh sách sản phẩm AI, tính đến tháng 1 năm 2025, không có ứng dụng AI nào trong số 20 ứng dụng AI có lượng người dùng hoạt động hàng tháng cao nhất liên quan đến bốn nhà sản xuất này. Trước đó, một nhân viên của Baichuan Intelligence đã chia sẻ với AI Light Years rằng: "Không có gì ngạc nhiên khi tỷ lệ giữ chân và tăng trưởng người dùng của Baixiaoying rất kém. Về cơ bản, chúng tôi không quảng cáo và để các công ty khác chi tiền để hoàn thiện chương trình giáo dục người dùng trước".
Hiện tại, DeepSeek, Tencent Yuanbao và Byte Doubao chiếm ba vị trí hàng đầu trong bảng xếp hạng tải xuống ỨNG DỤNG miễn phí của Apple. Nếu "Sáu chú rồng nhỏ" của các người mẫu lớn muốn lọt vào danh sách, cuộc cạnh tranh sẽ chỉ trở nên khốc liệt hơn. Đối với Nano Search, hiện đang xếp hạng thứ bảy, Zhou Hongyi đang đích thân quảng bá sản phẩm.
Một đối thủ khác không thể bỏ qua là Alibaba. Sau khi ứng dụng AI Tongyi được sáp nhập vào Alibaba Intelligent Information Business Group, mảng kinh doanh AI To C của Alibaba gần đây đã triển khai đợt tuyển dụng quy mô lớn, với hàng trăm vị trí, tập trung vào các vị trí nghiên cứu phát triển sản phẩm và công nghệ liên quan đến các mô hình AI lớn. Phía trước có sói, phía sau có hổ, mô tả chân thực tình hình hiện tại của "Lục Tiểu Long" trong mô hình lớn.
Khi câu chuyện công nghệ không còn lãng mạn, tính thương mại hóa không như mong đợi, lượng người dùng hoạt động hàng tháng của sản phẩm không tương xứng với số tiền đầu tư thì mô hình lớn “Sáu chú rồng nhỏ” là lý tưởng nhưng thực tế lại quá mong manh.
Ngưỡng cho vòng tài trợ tiếp theo sẽ được nâng lên
Một thực tế được công nhận là việc đào tạo trước các mô hình lớn sẽ tốn kém. Kai-Fu Lee đã từng tiết lộ rằng chi phí đào tạo trước là khoảng ba đến bốn triệu đô la Mỹ. Ngay cả Yi-Lightning có chi phí thấp hơn cũng sử dụng 2.000 GPU để đào tạo, mất một tháng rưỡi và tốn hơn ba triệu đô la Mỹ.
Mặc dù DeepSeek tuyên bố là chi phí thấp, nhưng khoản đầu tư ban đầu của nó rất khó ước tính. Tổ chức bên thứ ba SemiAnalysis ước tính rằng DeepSeek thực sự có một lượng dự trữ năng lực tính toán khổng lồ: tổng cộng 60.000 card GPU NVIDIA, bao gồm 10.000 card A100, 10.000 card H100, 10.000 card H800 "phiên bản đặc biệt" và 30.000 card H20 "phiên bản đặc biệt".
"Chúng tôi ước tính chi phí đào tạo một mô hình lớn nói chung vào khoảng 1 tỷ đô la Mỹ. Đây chỉ là phần sức mạnh tính toán, và không bao gồm hai phần rất tốn kém khác, một là dữ liệu và phần còn lại là chi phí lao động. Nhân tài trong lĩnh vực mô hình lớn hiện rất khan hiếm trên thế giới." Tiến sĩ Du Feng, đối tác sáng lập của Jiangmen Venture Capital và cựu giám đốc Microsoft Ventures Greater China, đã từng nói với tác giả.
Do yêu cầu đầu tư lớn nên từ lâu trong ngành đã có câu nói phổ biến: vé vào cửa để đầu tư vào các công ty mô hình quy mô lớn là 100 triệu đô la Mỹ. Một tín hiệu khác đằng sau câu nói này là một công ty khởi nghiệp quy mô lớn sẽ khó có thể tồn tại nếu không nhận được nguồn tài trợ.
Sau khi cuộc chiến Trăm mẫu bắt đầu vào năm 2023, tin tức tài chính được công bố hầu như hàng tháng. Tuy nhiên, khi lý thuyết bong bóng AI ngày càng phổ biến, bắt đầu từ tháng 9 năm 2024, không có dòng tiền nóng hàng trăm triệu chảy vào "Sáu con rồng nhỏ" của các mô hình lớn trong một thời gian dài. Mãi đến trước Tết Nguyên đán năm 2025, Zhipu và Jieyuexingchen mới tuyên bố nhận được "tiền mùa đông". Công ty trước tuyên bố hoàn thành vòng tài trợ mới trị giá 3 tỷ nhân dân tệ, công ty sau hoàn thành vòng tài trợ B trị giá hàng trăm triệu đô la.
Đã hơn nửa năm kể từ lần cập nhật tài chính cuối cùng của bốn "Sáu chú rồng nhỏ" còn lại: MiniMax chính thức công bố hoàn thành vòng tài trợ Series B trị giá 600 triệu đô la vào tháng 3 năm ngoái, Baichuan Intelligence đã huy động được 5 tỷ nhân dân tệ trong vòng tài trợ Series A vào tháng 7 năm ngoái, Zero One Everything đã hoàn thành vòng tài trợ mới trị giá hàng trăm triệu đô la vào tháng 8 năm ngoái và Dark Side of the Moon đã hoàn thành vòng tài trợ trị giá 300 triệu đô la vào tháng 8 năm ngoái.
Vào dịp Tết Nguyên đán, DeepSeek trở nên phổ biến trên toàn thế giới và dư luận đã dành nhiều lời khen ngợi cho DeepSeek và người sáng lập Liang Wenfeng. Trong giới đầu tư mạo hiểm, gần đây có rất nhiều tin tức lan truyền về việc liệu DeepSeek có bắt đầu huy động vốn hay không và định giá của công ty sẽ là bao nhiêu.
Trước đó có thông tin cho rằng Alibaba sẽ đầu tư 1 tỷ đô la Mỹ để nắm giữ 10% cổ phần với mức định giá 10 tỷ đô la Mỹ. Đáp lại, Phó chủ tịch Alibaba Yan Qiao đã nhanh chóng bác bỏ tin đồn này thông qua WeChat Moments, nói rằng: "Thông tin lan truyền bên ngoài rằng Alibaba đã đầu tư vào DeepSeek là tin sai sự thật". Sau đó, truyền thông nước ngoài đưa tin "DeepSeek đã cân nhắc việc huy động vốn bên ngoài lần đầu tiên". Những người liên quan đến DeepSeek đã phủ nhận tin đồn này, nói rằng các thông tin về việc tài trợ đều chỉ là tin đồn.
“Nhiều nhà đầu tư đã tiếp cận Liang Wenfeng trực tiếp hoặc thông qua các mối quan hệ. Tôi dự đoán rằng mức định giá sẽ cao hơn nhiều so với ‘Big Six Little Dragons’ hiện tại.” Một nhà đầu tư từ CICC Capital cho biết, “DeepSeek đã trở thành một chuẩn mực. Ngưỡng để ‘Big Six Little Dragons’ có được nguồn tài chính mới trên thị trường sơ cấp rõ ràng là cao hơn.”
Trên thực tế, kể từ khi cơn sốt khởi nghiệp mô hình lớn bắt đầu, ngành công nghiệp này nói chung không tin rằng ‘Big Six Little Dragons’ cuối cùng có thể tồn tại như ‘các công ty mô hình lớn’ độc lập. Một số nhà sáng lập của "Sáu chú rồng nhỏ" cũng đã bày tỏ quan điểm tương tự trước công chúng. Ví dụ, Yan Junjie, nhà sáng lập của MiniMax, tin rằng trong tương lai trên thế giới sẽ chỉ còn lại năm công ty mô hình lớn.
“Trung Quốc chắc chắn sẽ có ChatGPT của riêng mình. Giống như các công cụ tìm kiếm, chúng tôi có các yêu cầu tuân thủ riêng. Nhưng phiên bản ChatGPT của Trung Quốc sẽ chỉ được sản xuất bởi năm công ty: BAT + ByteDance + Huawei.” Cheng Hao, người sáng lập Xunlei và Yuanwang Capital, đã từng nói với tác giả.
Với sự nổi tiếng liên tục, “Sáu chú rồng nhỏ” vốn đã hướng đến sự khác biệt sẽ đẩy nhanh quá trình xáo trộn.