Microsoft muốn tự sản xuất các vi chip trí tuệ nhân tạo của riêng mình. Theo một báo cáo từ The Information, công ty đang tham gia vào việc phát triển các vi chip trí tuệ nhân tạo của họ, có tên gọi là Athena, một dự án mà tập đoàn công nghệ này đã làm việc từ năm 2019. Hiện tại, các vi chip này đang được thử nghiệm bởi một nhóm nhỏ nhân viên từ Microsoft và OpenAI. Tuy nhiên, điều chúng ta vẫn chưa biết là Microsoft có kế hoạch nào để đưa vi chip này ra sử dụng thương mại và khi nào.
Cho đến nay, để chạy các mô hình trí tuệ nhân tạo của mình, Microsoft đã phụ thuộc vào các vi chip có sẵn trên thị trường, mà Nvidia đang chiếm ưu thế trong lĩnh vực này. Để giúp OpenAI huấn luyện các mô hình ngôn ngữ lớn (LLMs) trong loạt sản phẩm GPT của họ, công ty có trụ sở tại Redmond cũng đã xây dựng một siêu máy tính cho OpenAI, được trang bị bởi các vi chip Nvidia A100.
Với sự phát triển nhanh chóng trong lĩnh vực này, các công ty trí tuệ nhân tạo như Google, Apple và Amazon đã phát triển vi chip trí tuệ nhân tạo của riêng họ. Thậm chí, Google đã xây dựng một siêu máy tính để huấn luyện các mô hình của mình bằng các TPUs (Tensor Processing Units). Amazon cũng có kiến trúc bộ xử lý Trainium và Inferentia. Vì vậy, không có gì ngạc nhiên khi Microsoft cũng đang tiến theo hướng tương tự.
Tối ưu hóa chi phí
Ước tính chỉ việc huấn luyện một mô hình ngôn ngữ lớn như GPT-3 có thể đã tốn cho OpenAI khoảng 4 triệu đô la Mỹ. Ngoài ra, OpenAI tiêu khoản khoảng 3 triệu đô la Mỹ mỗi tháng để duy trì ChatGPT. Ngoài ra, các GPU được sử dụng để chạy các mô hình này cũng rất đắt đỏ. Nvidia, nhà sản xuất dẫn đầu về GPU cho ngành công nghiệp trí tuệ nhân tạo, bán các vi chip trung tâm dữ liệu chính của họ với giá khoảng 10.000 đô la Mỹ. Hơn nữa, các GPU H100 của họ được bán với giá 40.000 đô la Mỹ trên eBay. Theo báo cáo, siêu máy tính của Microsoft sử dụng hàng chục nghìn GPU trung tâm dữ liệu H100 và A100 của Nvidia.
Một trong những lý do chính khiến Microsoft xây dựng các vi chip của riêng mình là để giảm chi phí. Theo báo cáo, Athena có thể giảm được một phần ba chi phí cho mỗi vi chip so với Nvidia.
Hơn nữa, Microsoft cũng muốn giảm sự phụ thuộc vào Nvidia. Do đó, việc tự sản xuất vi chip trong nội bộ có thể có nghĩa là Microsoft có thể thiết kế vi chip, kiến trúc của chúng, và tính tương thích dựa trên nhu cầu của riêng họ. Theo báo cáo, Microsoft đã thiết kế Athena để sử dụng cả trong việc huấn luyện lẫn chạy các mô hình trí tuệ nhân tạo của họ.
Với việc Microsoft đang nhắm mục tiêu giới thiệu các tính năng được trang bị trí tuệ nhân tạo trong Bing, Office 365 và GitHub, việc chuyển đổi này có thể mang lại lợi thế về chi phí cho công ty. “Khi nhu cầu mở rộng và đa dạng hóa của việc sử dụng cũng mở rộng theo, điều quan trọng là Microsoft và các công ty siêu quy mô khác nên tiến hành phát triển phiên bản tối ưu của riêng mình cho các vi chip trí tuệ nhân tạo theo kiến trúc và thuật toán tối ưu hóa của họ (không phải là CUDA cụ thể)”, Jack Gold từ J Gold Associates cho biết trên VentureBeat.
Trí tuệ nhân tạo trên thiết bị
Trí tuệ nhân tạo thường được chạy trên đám mây (cloud). Tuy nhiên, các tiến bộ gần đây đã chỉ ra rằng có thể chạy các mô hình trí tuệ nhân tạo hoàn toàn trên các thiết bị. Gần đây, một nhóm kỹ sư của Qualcomm đã thành công trong việc chạy mô hình trí tuệ nhân tạo chuyển đổi văn bản thành hình ảnh có tên là Stable Diffusion trên một thiết bị Android.
Hiện tại, trên thị trường có các laptop được trang bị vi chip được thiết kế để hỗ trợ việc huấn luyện các mô hình trí tuệ nhân tạo. Microsoft cũng sản xuất các dòng laptop cao cấp với phần cứng tầm cao dưới thương hiệu Surface. Theo thông tin đồn đoán, Microsoft cũng đang thiết kế các vi xử lý dựa trên kiến trúc ARM riêng cho các dòng laptop Surface của họ; tuy nhiên, những vi xử lý này vẫn chưa được phát hành.
Do đó, có thể chúng ta sẽ thấy một thế hệ tiếp theo của các dòng laptop Surface chạy một mô hình giống như ChatGPT hoàn toàn trên thiết bị của họ trong tương lai.
Cạnh tranh với Nvidia?
Hiện nay, Nvidia là nhà cung cấp hàng đầu các vi chip trí tuệ nhân tạo, nắm giữ hơn 90% thị trường GPU doanh nghiệp. Trong khi Nvidia tập trung vào việc xây dựng GPU, Microsoft lại đặt trọng tâm ở nơi khác. Họ muốn đưa sản phẩm trí tuệ nhân tạo của mình vào lĩnh vực doanh nghiệp.
Hiện tại, Microsoft đang xây dựng Athena để sử dụng trong nội bộ của mình. Do đó, khả năng cao là Microsoft sẽ không cạnh tranh trực tiếp với Nvidia trên thị trường vi chip. Trong lúc này, mục tiêu của Microsoft là giảm chi phí hoạt động trên đám mây. Tuy nhiên, trong tương lai, Microsoft có thể sử dụng Athena để cải thiện các dịch vụ đám mây và các thiết bị của họ, cung cấp hiệu suất tốt hơn và chi phí thấp hơn so với các đối thủ của họ.
Một thách thức cho các nhà phát triển?
Hiện tại, chúng ta không chắc chắn liệu Microsoft sẽ cung cấp các vi chip này cho khách hàng sử dụng dịch vụ đám mây Azure hay không. Nếu Microsoft quyết định chạy Azure trên nền Athena, các vi chip mới có thể gây khó khăn cho các nhà phát triển vì chúng có thể khác biệt so với các vi chip hiện tại về thiết kế, hiệu suất, tiêu thụ năng lượng và tính tương thích với phần mềm và khung làm việc hiện có.
Ban đầu, các nhà phát triển có thể phải đối mặt với khó khăn khi chuyển đổi sang các vi chip trí tuệ nhân tạo mới này do những sự khác biệt này và có thể cần phải điều chỉnh luồng làm việc và mã code của họ tương ứng. Việc chuyển đổi mã code hiện tại sang nền tảng mới có thể khó khăn. Hơn nữa, các nhà phát triển có thể cần tài liệu chi tiết và tài nguyên về các vi chip trí tuệ nhân tạo mới, bao gồm hướng dẫn, mã mẫu và hướng dẫn về tính tương thích.
Mặc dù báo cáo cho rằng vi chip Athena của Microsoft có thể sẽ có sẵn trong vòng một năm, nhưng có thể mất một thời gian trước khi chúng trở nên phổ biến và có sẵn rộng rãi trên thị trường.