Trí tuệ nhân tạo (AI) dựa trên tác nhân đang làm thay đổi câu chuyện của ngành công nghiệp AI từ định hướng chi phí sang định hướng lợi nhuận. Goldman Sachs tin rằng với sự bùng nổ tiềm năng trong tiêu thụ token và chi phí sức mạnh tính toán cơ bản giảm nhanh hơn giá token, điểm uốn về biên lợi nhuận gộp đối với các nhà cung cấp điện toán đám mây siêu quy mô và các nhà cung cấp mô hình quy mô lớn có thể đến trong vòng 3 đến 12 tháng tới. Theo một báo cáo được Goldman Sachs công bố vào ngày 5 tháng 5, ngân hàng này dự đoán rằng đến năm 2030, các tác nhân AI dành cho người tiêu dùng và doanh nghiệp kết hợp sẽ thúc đẩy tiêu thụ token toàn cầu cao gấp 24 lần so với năm 2026, đạt khoảng 120 triệu tỷ token mỗi tháng; nếu các tác nhân doanh nghiệp đạt đỉnh điểm về mức độ áp dụng vào năm 2040, con số này sẽ tiếp tục mở rộng lên gấp 55 lần. Trong khi đó, các đường cong giá và chi phí dự kiến của Goldman Sachs cho thấy giá của các token quy mô lớn phổ biến đã ổn định hoặc thậm chí phục hồi nhẹ so với mức giảm hàng năm trước đó khoảng 40%, trong khi chi phí mỗi token do các chip như Nvidia, AMD, Google TPU và Trainium cung cấp tiếp tục giảm với tốc độ từ 60% đến 70% mỗi năm. Sự khác biệt giữa hai đường cong này đang mở ra biên lợi nhuận cho ngành công nghiệp. Chi tiêu vốn quy mô lớn cho cơ sở hạ tầng AI có thể nhận được sự hỗ trợ kinh tế bền vững hơn nhờ biên lợi nhuận được cải thiện. Bước ngoặt của kinh tế token: Chi phí giảm nhanh hơn giá cả, biên lợi nhuận đang mở rộng. Luận điểm cốt lõi của báo cáo Goldman Sachs là ngành công nghiệp AI đang chuyển từ giai đoạn "kinh tế suy luận không chắc chắn có thể làm giảm lợi nhuận" sang giai đoạn mới, nơi "sự gia tăng token được hiện thực hóa với biên lợi nhuận hấp dẫn". Trong giai đoạn đầu của chu kỳ AI, các nhà đầu tư thường coi sức mạnh tính toán và token là động lực chi phí - sử dụng nhiều hơn có nghĩa là tải suy luận lớn hơn, nhiều bộ tăng tốc hơn, nhiều điện năng hơn và chi phí vốn cao hơn. Tuy nhiên, đường cong giá so với chi phí do Goldman Sachs suy luận cho thấy logic này đang thay đổi. Mặc dù giá của các token mô hình quy mô lớn phổ biến đã giảm đáng kể, nhưng hiện tại đã ổn định và thậm chí phục hồi trong một số trường hợp. Trong khi đó, tổng chi phí trên mỗi token của Nvidia, Google TPU (Broadcom), AMD và Trainium (Marvell) tiếp tục giảm nhanh chóng và ổn định. Nếu giá token ổn định ở mức cao hơn chi phí token, việc ứng dụng rộng rãi AI tác nhân sẽ dẫn đến lợi nhuận tăng trưởng tích cực, chứ không chỉ đơn thuần là tăng trưởng doanh thu. Goldman Sachs cũng chỉ ra rằng AI tác nhân có thể tạo thành một vòng xoáy kinh tế tự củng cố: chi phí điện năng tính toán trên mỗi token thấp hơn dẫn đến các tác nhân phong phú và phức tạp hơn; các tác nhân phong phú hơn tiêu thụ nhiều token hơn thông qua các ngữ cảnh dài hơn, nhiều vòng lặp hơn, nhiều xác minh hơn và giám sát liên tục; mức độ sử dụng cao hơn cải thiện hiệu quả kinh tế của cơ sở hạ tầng AI, từ đó hỗ trợ các nhà cung cấp liên tục đầu tư vào chất lượng mô hình và khả năng phân phối. Goldman Sachs tin rằng vòng xoáy này khác biệt rõ rệt so với quan điểm chủ đạo trên thị trường rằng "việc sử dụng AI sẽ mang lại gánh nặng chi phí không bền vững". Tuy nhiên, Goldman Sachs cũng cảnh báo về những rủi ro: không phải tất cả các khối lượng công việc AI đều có thể đảm bảo điểm uốn lợi nhuận tích cực. Đối với các chatbot dựa trên văn bản đã trở nên phổ biến, cạnh tranh vẫn có thể buộc giá token giảm nhanh hơn chi phí điện năng tính toán. Đối với các tác nhân phía người tiêu dùng: Từ các cuộc hội thoại rời rạc đến các trợ lý "vĩnh viễn", mức tiêu thụ token sẽ tăng gấp 12 lần. Goldman Sachs ước tính rằng đến năm 2030, các tác nhân AI phía người tiêu dùng có thể làm tăng mức tiêu thụ token toàn cầu lên gấp 12 lần, tương đương khoảng 60 triệu tỷ token mỗi tháng. Báo cáo phân loại các tác nhân phía người tiêu dùng thành hai loại: tác nhân "theo yêu cầu", chẳng hạn như các tác nhân dựa trên trình duyệt như OpenAI Operator và Claude Code, tự động lập kế hoạch, thực hiện và trả về kết quả sau khi người dùng bắt đầu tác vụ; và tác nhân "thường trú", chẳng hạn như giám sát email, quản lý lịch hoặc trợ lý cuộc sống kỹ thuật số hoạt động liên tục trong nền. Goldman Sachs tin rằng bước nhảy vọt lớn nhất về mức tiêu thụ token sẽ xảy ra khi các tác nhân chuyển từ các tác vụ do người dùng khởi tạo sang hoạt động liên tục trong nền - các tác nhân liên tục giám sát ngữ cảnh và hành động chủ động khi cần thiết. Dữ liệu mô phỏng cho thấy một chatbot LLM điển hình tiêu thụ khoảng 1.000 token mỗi phiên, một Copilot nhúng tiêu thụ hơn 5.000 token mỗi ngày, trong khi một tác nhân thường trú có thể tiêu thụ hơn 100.000 token mỗi ngày. Goldman Sachs dự báo rằng số lượng truy vấn AI hàng ngày sẽ tăng từ khoảng 5 tỷ vào năm 2025 lên khoảng 23 tỷ vào năm 2030, với khoảng 30% hướng đến các công cụ trung gian trong các lĩnh vực như tìm kiếm, mua sắm, du lịch, email và năng suất cá nhân. Trong khi đó, thị phần của các công cụ tìm kiếm truyền thống trong tổng số truy vấn dự kiến sẽ giảm từ 68% vào năm 2025 xuống 36% vào năm 2030, còn thị phần của các ứng dụng dựa trên LLM sẽ tăng từ 12% lên 31%. Proxy phía doanh nghiệp: Độ phức tạp của quy trình công việc thúc đẩy sức mạnh của token, mức tiêu thụ có thể tăng gấp 55 lần vào năm 2040
Goldman Sachs dự đoán rằng các proxy AI phía doanh nghiệp sẽ trở thành yếu tố nhân token lớn nhất, thúc đẩy mức tiêu thụ token toàn cầu tăng gấp 24 lần vào năm 2030, và tiếp tục tăng lên gấp 55 lần khi đạt đỉnh điểm vào năm 2040. Vào thời điểm đó, khối lượng công việc phía doanh nghiệp sẽ chiếm hơn 70% tổng lượng token sử dụng toàn cầu.
Lý do tại sao các proxy phía doanh nghiệp có sức mạnh token lớn hơn các proxy phía người tiêu dùng là vì quy trình công việc của chúng yêu cầu các proxy thực hiện các thao tác phức tạp và chính xác hơn—giám sát nhiệm vụ, truy xuất ngữ cảnh, suy luận các bất thường, xác minh đầu ra, cập nhật hệ thống và liên tục báo cáo các vấn đề trong suốt ngày làm việc.
Về các mục tiêu cụ thể, lý do cốt lõi của Goldman Sachs đối với Amazon nằm ở sự tăng tốc trở lại của tăng trưởng doanh thu AWS (tăng trưởng 28% so với cùng kỳ năm trước trong quý 1) và doanh thu tồn đọng 364 tỷ đô la. Quan điểm của họ về Google dựa trên sự tăng trưởng 63% so với cùng kỳ năm trước của mảng kinh doanh điện toán đám mây trong quý 1 và doanh thu tồn đọng gần như tăng gấp đôi so với quý trước, lên khoảng 460 tỷ đô la. Đánh giá của họ về Meta dựa trên sự tăng trưởng của mảng kinh doanh quảng cáo vượt trội đáng kể so với toàn ngành quảng cáo kỹ thuật số, và sự đóng góp liên tục của sức mạnh tính toán AI vào việc cải thiện sự tương tác của người dùng và khả năng kiếm tiền từ quảng cáo. Trong lĩnh vực phần mềm, Goldman Sachs tin rằng chi phí token thấp hơn giúp các nhà cung cấp phần mềm dễ dàng tích hợp các tác nhân vào các sản phẩm hiện có mà không ảnh hưởng đáng kể đến biên lợi nhuận gộp, đồng thời hỗ trợ định giá dựa trên kết quả, năng suất hoặc đơn vị công việc thay vì chỉ đơn giản là số lượng chỗ ngồi, do đó mở rộng thị trường phần mềm có thể tiếp cận được. Đối với các công ty dịch vụ CNTT, khi các chuyên gia chuyển hướng sử dụng AI từ các công cụ độc lập sang các giải pháp chuyển đổi quy trình làm việc tích hợp cao cấp cấp doanh nghiệp, nhu cầu về tích hợp, quản trị và điều phối được quản lý sẽ tăng lên đáng kể. Accenture được xem là một trong những đơn vị hưởng lợi chính từ xu hướng này.