Các thực tiễn mới nhất của xAI cho thấy rằng ngay cả khi đã mua được một số lượng lớn GPU cấp máy chủ của Nvidia, việc sử dụng hiệu quả vẫn là một trong những nút thắt cổ chai cốt lõi trong quá trình huấn luyện AI. Khi các nhà phát triển AI tiếp tục cạnh tranh để có được sức mạnh tính toán của Nvidia, tình trạng thiếu GPU đã trở thành mối lo ngại lan rộng, nhưng thách thức mới đối với ngành công nghiệp nằm ở chính "hiệu quả sử dụng". Quá trình huấn luyện mô hình AI thường thể hiện đặc điểm "bùng phát" rõ rệt: GPU hoạt động ở cường độ cao trong thời gian ngắn, sau đó là các khoảng thời gian nhàn rỗi để phân tích kết quả và điều chỉnh chiến lược. Mô hình sử dụng sức mạnh tính toán không đồng đều này khiến các cụm GPU quy mô lớn khó duy trì mức sử dụng cao ổn định, dẫn đến lãng phí sức mạnh tính toán đáng kể ngay cả khi có đủ phần cứng. Các chuyên gia trong ngành chỉ ra rằng vấn đề này đang buộc các công ty AI phải thiết kế lại kiến trúc huấn luyện và hệ thống lập lịch của họ để cải thiện hiệu quả sử dụng tổng thể của các cụm GPU, thay vì chỉ đơn giản là mở rộng quy mô sức mạnh tính toán. (The Information)