GPU mạnh sẽ góp phần nâng cao quá trình huấn luyện cũng như xử lý các phép tính toán liên quan đến AI tuy nhiên việc sở hữu một hệ thống tính toán có GPU mạnh là một đầu tư lớn mà không phải tổ chức hay cá nhân nào cũng có khả năng để tiếp cận. Chính vì lý do trên, các hệ thống tính toán dựa trên GPU ra đời dưới dạng hạ tầng đáp mây sẽ đáp ứng được nhu cầu sử dụng của đông đảo các nhà phát triển ứng dụng AI với chi phí phù hợp. Chúng tôi đã tiến hành tổng hợp 10 nhà cung cấp dịch vụ hạ tầng đám mây GPU với hy vọng mang lại cho các bạn những thông tin cần thiết để có thể lựa chọn một dịch vụ phù hợp cho việc phát triển AI của riêng mình.
Những thông tin tổng hợp dưới đây sẽ liệt kê những ưu và nhược điểm của từng nhà cung cấp, chúng tôi có được dựa vào đánh giá của người dùng trên các diễn đàn đánh giá trực tuyến khác cũng như một số nhận định riêng của chúng tôi.
Dịch vụ web của Amazon (AWS)
AWS là nhà cung cấp nền tảng đám mây lớn nhất và là nhà cung cấp GPU đám mây hàng đầu. Amazon EC2 (Elastic Compute Cloud) cung cấp các phiên bản máy chủ ảo cho phép hỗ trợ GPU hướng tới tăng tốc tính toán cho các tác vụ liên quan đến học máy.
Ưu điểm
Cung cấp khả năng tích hợp liền lạc với các giải pháp AWS phổ biến khác như:
- SageMaker, được sử dụng để tạo, đào tạo, triển khai và ứng dụng mô hình ML trên quy mô lớn
- Dịch vụ lưu trữ đơn giản (Amazon S3), Amazon RDS (Dịch vụ cơ sở dữ liệu quan hệ) hoặc các dịch vụ lưu trữ AWS khác, có thể đóng vai trò là giải pháp lưu trữ cho dữ liệu đào tạo
Nhược điểm
- AWS cung cấp ít tùy chọn GPU hơn một số đối thủ khác như Azure.
- Giao diện người dùng được đánh giá là khá phức tạp
- Giá thành sử dụng mỗi giờ cao hơn các nhà cung cấp đám mây lớn khác. Giống như các nhà cung cấp dịch vụ đám mây khác, AWS cũng cung cấp giảm giá nếu sử dụng theo số lượng lớn.
Microsoft Azure
Microsoft Azure, nhà cung cấp đám mây lớn thứ hai, cung cấp dịch vụ GPU dựa trên đám mây được gọi là Máy ảo Azure N-Series, tận dụng GPU NVIDIA giống như các nhà cung cấp khác để mang lại khả năng tính toán hiệu suất cao. Dịch vụ này đặc biệt phù hợp cho các ứng dụng đòi hỏi khắt khe như học sâu, mô phỏng, kết xuất và đào tạo mô hình AI.
Ưu điểm
- Microsoft Azure đang cung cấp nhiều tùy chọn GPU hơn hầu hết các nhà cung cấp khác
- Gói miễn phí cung cấp 12 tháng quyền truy cập vào một số dịch vụ
- Giao diện người dùng trực quan của Azure được khen ngợi vì dễ sử dụng
Nhược điểm
- Một số người dùng nhận thấy rằng một số tính năng nâng cao nhất định trong Azure yêu cầu trình độ chuyên môn kỹ thuật cao để định cấu hình và quản lý hiệu quả
- Một số người dùng nhận thấy cấu trúc giá của Azure phức tạp để lựa chọn và nhấn mạnh việc phải lên kế hoạch một cách cẩn trọng để tránh phát sinh các chi phí không mong muốn
Nền tảng đám mây của Google (GCP)
Google Cloud Platform (GCP) là nền tảng đám mây lớn thứ ba. GCP cung cấp các phiên bản GPU có thể được gắn vào các máy ảo (VM) hiện có hoặc có thể là một phần của thiết lập VM mới.
Ưu điểm
- Giao diện người dùng dễ dàng hơn các nền tảng phổ biến khác như AWS
- Cung cấp các tùy chọn GPU miễn phí có giới hạn cho người dùng Kaggle và Colab
- Khách hàng có thể sử dụng miễn phí hơn 20 sản phẩm, tối đa giới hạn sử dụng hàng tháng
Nhược điểm
- GPU phải được gắn vào máy ảo tiêu chuẩn, khiến việc định giá trở nên khó hiểu
- Giống như AWS, GCP cung cấp ít tùy chọn GPU hơn đối thủ như Azure
Đám mây NVIDIA DGX
NVIDIA là công ty dẫn đầu trong thị trường phần cứng GPU. NVIDIA đã ra mắt dịch vụ đám mây GPU, DGX Cloud, bằng cách cho thuê không gian tại các trung tâm dữ liệu của các nhà cung cấp đám mây hàng đầu (ví dụ: OCI, Azure và GCP).
Đám mây DGX cung cấp các nền tảng mạng NVIDIA Base Command™, NVIDIA AI Enterprise và NVIDIA. Phiên bản DGX Cloud có cấu hình ngầm định với 8 GPU NVIDIA H100 hoặc A100 80GB Tensor Core.
Khách hàng ban đầu của dịch vụ này, nhóm nghiên cứu có tên là Amgen thông báo rằng việc đào tạo mô hình ngôn ngữ riêng về dưỡng chất với BioNeMo cho kết quả nhanh hơn gấp 3x lần và các tác vụ phân tích sau đào tạo nhanh hơn tới 100 lần khi dùng với NVIDIA RAPIDS.
Ưu đãi của dịch vụ tập trung cho doanh nghiệp với giá niêm yết của các phiên bản DGX Cloud bắt đầu từ 36.999 USD mỗi phiên mỗi tháng khi ra mắt.
Ưu điểm
- Hỗ trợ từ các kỹ sư NVIDIA
Nhược điểm
- Gói dịch vụ được cung cấp không phù hợp với các công ty có nhu cầu GPU nhỏ
- Dịch vụ này được cung cấp trên cơ sở hạ tầng vật lý của một nhà cung cấp dịch vụ đám mây nhất định. Vì vậy, người sư dụng mua cần phải trả tiền cho cả nhà cung cấp đám mây và NVIDIA.
Đám mây IBM
GPU do IBM Cloud cung cấp cho phép thực hiện quy trình lựa chọn máy chủ linh hoạt và nó có sự tích hợp liền mạch với kiến trúc, ứng dụng và API của IBM Cloud. Điều này được thực hiện thông qua mạng lưới các trung tâm dữ liệu được phân phối toàn cầu được kết nối với nhau.
Ưu điểm
- Tích hợp mạnh mẽ với kiến trúc và ứng dụng Đám mây của IBM
- Các trung tâm dữ liệu phân tán trên toàn thế giới tăng cường bảo vệ dữ liệu
Nhược điểm
- Việc áp dụng hạn chế so với 3 nhà cung cấp hàng đầu.
Cơ sở hạ tầng đám mây Oracle (OCI)
Oracle đã tăng cường cung cấp GPU sau khi chính thức hợp tác với NVIDIA.9
Oracle cung cấp các phiên bản GPU ở cả định dạng máy chủ ảo và máy ảo để tính toán nhanh chóng, tiết kiệm chi phí và hiệu quả cao. Các phiên bản Bare-Metal của Oracle cung cấp cho khách hàng khả năng thực thi các tác vụ trong cài đặt không ảo hóa. Những phiên bản này có thể truy cập được ở các khu vực như Hoa Kỳ, Đức và Vương quốc Anh, với tính khả dụng theo cả mô hình định giá theo yêu cầu và định giá gián đoạn.
Ưu điểm
- Nhiều sản phẩm và dịch vụ đám mây. Trong số các dịch vụ đám mây của gã khổng lồ công nghệ, chỉ OCI cung cấp bare metal GPU. Đối với người dùng cụm GPU, chỉ OCI cung cấp RoCE v2 cho công nghệ cụm của nó trong số các dịch vụ đám mây của gã khổng lồ công nghệ.
- Tiết kiệm chi phí so với các nhà cung cấp đám mây lớn khác
- Cung cấp thời gian dùng thử miễn phí và một số sản phẩm miễn phí mãi mãi
Nhược điểm
- Giao diện người dùng được người dùng cồng kềnh và chậm chạp
- Một số người dùng thấy tài liệu khó hiểu
- Quá trình bắt đầu sử dụng dịch vụ điện toán Đám mây của Oracle được một số người dùng đánh giá là quan liêu, phức tạp và tốn thời gian.
CoreWeave
CoreWeave là nhà cung cấp đám mây GPU chuyên dụng. NVIDIA là một trong những nhà đầu tư của CoreWeave. CoreWeave tuyên bố có 45.000 GPU và được NVIDIA chọn làm nhà cung cấp dịch vụ đám mây cấp Elite đầu tiên.
Jarvis Labs
Jarvis Labs, được thành lập vào năm 2019 và có trụ sở tại Ấn Độ, chuyên tạo điều kiện đào tạo nhanh chóng và đơn giản các mô hình deep learning trên các phiên bản điện toán GPU. Với các trung tâm dữ liệu được đặt tại Ấn Độ, Jarvis Labs được công nhận nhờ cách thiết lập thân thiện với người dùng, cho phép người dùng bắt đầu hoạt động nhanh chóng.
Ưu điểm
- Không cần thẻ tín dụng để đăng ký
- Giao diện đơn giản cho người mới bắt đầu
Nhược điểm
- Dù đang trên đà phát triển nhưng Jarvis Labs không phải là lựa chọn tốt cho các nhiệm vụ cấp doanh nghiệp và tốn thời gian
Lambda Lab
Ban đầu, Lambda Labs là một công ty phần cứng cung cấp các giải pháp phần cứng máy chủ và lắp ráp máy tính để bàn GPU. Kể từ năm 2018, Lambda Labs cung cấp Lambda Cloud làm nền tảng GPU. Các máy ảo mà họ cung cấp đều được trang bị sẵn các khung học sâu chiếm ưu thế, trình điều khiển CUDA và sổ ghi chép Jupyter chuyên dụng. Người dùng có thể kết nối với các phiên bản này thông qua thiết bị đầu cuối web trong bảng điều khiển đám mây hoặc trực tiếp bằng các khóa SSH đã cho.
Ưu điểm
- Cung cấp hoàn toàn tập trung vào GPU
Paperspace CORE
Paperspace là một nền tảng điện toán đám mây cung cấp các máy ảo được tăng tốc GPU cùng với các dịch vụ khác. Công ty được đánh giá cao vì tập trung vào khối lượng công việc đòi hỏi nhiều GPU và cung cấp nền tảng đám mây để phát triển, đào tạo và triển khai các mô hình học máy.
Ưu điểm
- Cung cấp nhiều loại GPU so với các nhà cung cấp khác
- Người dùng nhận thấy mức giá hợp lý cho sức mạnh tính toán được cung cấp
- Người dùng nhận thấy dịch vụ khách hàng thân thiện và đáp ứng
Nhược điểm
- Một số người dùng phàn nàn về tính khả dụng của máy, cả về máy ảo miễn phí và các loại máy cụ thể không có sẵn ở tất cả các khu vực
- Giao diện Jupyter tích hợp bị chỉ trích và thiếu một số phím tắt, mặc dù giao diện Jupyter Notebook gốc được cung cấp
- Thời gian tải hoặc tạo lâu hơn cho máy
- Phí đăng ký hàng tháng cộng với chi phí máy có thể là một nhược điểm và việc đào tạo đa GPU có thể tốn kém