ChatGPT, con bot trò chuyện AI được phát triển bởi OpenAI và Microsoft, dựa vào một cơ sở hạ tầng phần cứng mạnh mẽ để mang đến khả năng ấn tượng của nó. Ở trung tâm của cơ sở hạ tầng này là các cụm GPU NVIDIA V100 và A100, được thiết kế đặc biệt cho các ứng dụng trí tuệ nhân tạo và phân tích.
GPU NVIDIA A100, thành phần phần cứng chính của ChatGPT, không phải là một GPU chơi game thông thường. Nó được xây dựng dành riêng cho các ứng dụng trí tuệ nhân tạo, không có đầu ra hiển thị. Nó có hai phiên bản: phiên bản PCI Express và phiên bản SXM4. Phiên bản SXM4, được ưa chuộng trong các trung tâm dữ liệu, có thể xử lý các tải điện năng cao hơn, cho phép hiệu suất ưu việt bằng cách sử dụng lên đến 500 watt.
GPU NVIDIA V100 Tensor Core là một GPU quan trọng khác được sử dụng trong ChatGPT. Nó được thiết kế cho tính toán hiệu năng cao, khoa học dữ liệu và kỹ thuật đồ họa. Với kiến trúc Volta tiên tiến, V100 mang lại hiệu suất đáng chú ý, tương đương với tới 32 CPU hợp nhất vào một GPU duy nhất. 640 Tensor Cores của nó cho phép vượt qua ngưỡng 100 teraFLOPS, thiết lập một tiêu chuẩn mới cho hiệu suất học sâu.
Các GPU làm nên sức mạnh của ChatGPT được kết nối thông qua giao diện NVLink tốc độ cao, cho phép chúng hoạt động như một GPU lớn đơn nhất. Trong khi số lượng chính xác của các GPU được sử dụng vẫn chưa được tiết lộ, ước tính cho biết hiện có khoảng 30,000 GPU A100 đang hoạt động. Việc huấn luyện mô hình trí tuệ nhân tạo có lẽ đòi hỏi khoảng 4,000 đến 5,000 GPU, nhưng số lượng người dùng khổng lồ lên tới 100 triệu người dùng đòi hỏi khoảng sáu lần nhiều GPU hơn.
Ngoài các GPU, ChatGPT cũng sử dụng CPU cho các nhiệm vụ cụ thể mà GPU ít phù hợp hơn, như tải dữ liệu và chạy giao diện trò chuyện. Lưu trữ đóng vai trò quan trọng, với SSD hoặc lưu trữ đám mây được sử dụng để lưu trữ các tập dữ liệu và mô hình lớn. Một mạng lưới tốc độ cao do một trung tâm dữ liệu riêng biệt cung cấp cho phép ChatGPT giao tiếp một cách mượt mà với người dùng và các hệ thống khác.
Sự đầu tư của Microsoft vào hệ thống ChatGPT được ước tính là hàng trăm triệu đô la, với chi phí hoạt động hàng ngày đáng kể. Công ty cũng đang tích hợp các GPU NVIDIA H100 mới hơn vào dịch vụ Azure Cloud AI của mình, từ đó tăng cường hiệu suất và cho phép huấn luyện các mô hình ngôn ngữ phức tạp hơn.
Các thiết bị phần cứng được sử dụng để cung cấp sức mạnh cho ChatGPT tiếp tục phát triển theo thời gian, đảm bảo rằng trò chuyện AI này trở nên mạnh mẽ và hiệu quả hơn. Điều này là minh chứng cho tiềm năng của trí tuệ nhân tạo và sự tiến bộ trong phần cứng hiện đại.