Tác giả: Tiến sĩ Tehseen Zia
ngày 28 tháng 12 năm 2023
Lãnh vực Trí tuệ Nhân tạo hiện đang trải qua một sự biến đổi đáng kể, được thúc đẩy bởi sự tích hợp và tiếp cận rộng rãi của Trí tuệ Nhân tạo sinh sản trong các hệ sinh thái mã nguồn mở. Sóng biến đổi này không chỉ nâng cao năng suất và hiệu quả mà còn tạo điều kiện cho sự đổi mới, cung cấp một công cụ quan trọng để cạnh tranh trong thời đại hiện đại. Rời xa hệ sinh thái đóng cửa truyền thống của mình, Apple gần đây đã chấp nhận sự dịch chuyển mô hình này bằng cách giới thiệu MLX, một khung việc làm mã nguồn mở được thiết kế để trao quyền cho các nhà phát triển Trí tuệ Nhân tạo để khai thác một cách hiệu quả các khả năng của các vi mạch Apple Silicon. Trong bài viết này, chúng ta sẽ chi tiết tìm hiểu về khung MLX, vạch ra những tác động của nó đối với Apple và tiềm năng tác động mà nó mang lại cho hệ sinh thái Trí tuệ Nhân tạo rộng lớn hơn.
Tiết lộ về MLX
Được phát triển bởi nhóm nghiên cứu Trí tuệ Nhân tạo của Apple, MLX đứng là một khung việc làm tiên tiến được tùy chỉnh cho nghiên cứu và phát triển Trí tuệ Nhân tạo trên các vi mạch silic của Apple. Khung này bao gồm một bộ công cụ cho phép các nhà phát triển Trí tuệ Nhân tạo tạo ra các mô hình tiên tiến, bao gồm các mô hình trò chuyện, tạo văn bản, nhận dạng giọng nói và tạo hình ảnh. MLX vượt xa bằng cách bao gồm các mô hình cơ bản đã được huấn luyện trước như LlaMA của Meta cho việc tạo văn bản, Stable Diffusion của Stability AI cho việc tạo hình ảnh và Whisper của OpenAI cho việc nhận dạng giọng nói.
Lấy cảm hứng từ các khung việc làm đã được thành lập như NumPy, PyTorch, Jax và ArrayFire, MLX đặt một sự nhấn mạnh mạnh mẽ vào thiết kế thân thiện với người dùng và quá trình huấn luyện và triển khai mô hình hiệu quả. Các tính năng đáng chú ý bao gồm các API thân thiện với người dùng, bao gồm một API Python giống như NumPy và một API C++ chi tiết. Các gói chuyên ngành như mlx.nn và mlx.optimizers giúp tối ưu hóa quá trình xây dựng các mô hình phức tạp, áp dụng kiểu dáng quen thuộc của PyTorch.
MLX sử dụng phương pháp tính toán trì hoãn, chỉ tạo ra mảng khi cần thiết. Khả năng xây dựng đồ thị động của nó cho phép tạo ra các đồ thị tính toán một cách tự spontan, đảm bảo rằng các sự thay đổi đối với đối số của hàm không ảnh hưởng đến hiệu suất, tất cả trong khi giữ cho quá trình gỡ lỗi một cách dễ dàng và trực quan. MLX cung cấp một sự tương thích rộng rãi trên các thiết bị bằng cách mượt mà thực hiện các thao tác trên cả CPU và GPU. Một khía cạnh chính của MLX là mô hình bộ nhớ thống nhất của nó, bảo tồn các mảng trong bộ nhớ chia sẻ. Tính năng đặc biệt này giúp tối ưu hóa các hoạt động mượt mà trên các mảng MLX trên các thiết bị được hỗ trợ khác nhau, loại bỏ nhu cầu chuyển dữ liệu.
Phân biệt CoreML và MLX
Apple đã phát triển cả hai khung việc làm CoreML và MLX để hỗ trợ các nhà phát triển Trí tuệ Nhân tạo trên các hệ thống của Apple, nhưng mỗi khung việc làm đều có những tính năng độc đáo riêng. CoreML được thiết kế để dễ dàng tích hợp các mô hình máy học đã được huấn luyện từ các bộ công cụ mã nguồn mở như TensorFlow vào các ứng dụng trên các thiết bị của Apple, bao gồm iOS, macOS, watchOS và tvOS. Nó tối ưu hóa việc thực thi mô hình bằng cách sử dụng các thành phần phần cứng chuyên biệt như GPU và Neural Engine, đảm bảo xử lý được tăng tốc và hiệu quả. CoreML hỗ trợ các định dạng mô hình phổ biến như TensorFlow và ONNX, khiến cho nó linh hoạt cho các ứng dụng như nhận dạng hình ảnh và xử lý ngôn ngữ tự nhiên. Một tính năng quan trọng của CoreML là việc thực thi trên thiết bị, đảm bảo các mô hình chạy trực tiếp trên thiết bị của người dùng mà không phụ thuộc vào các máy chủ bên ngoài. Trong khi CoreML đơn giản hóa việc tích hợp các mô hình máy học đã được huấn luyện với hệ thống của Apple, MLX lại phục vụ như một khung việc làm phát triển được thiết kế đặc biệt để tạo điều kiện cho việc phát triển các mô hình Trí tuệ Nhân tạo trên các vi mạch silic của Apple.
Phân tích Động cơ của Apple Đằng Sau MLX
Việc giới thiệu MLX cho thấy Apple đang bước vào lĩnh vực mở rộng của Trí tuệ Nhân tạo sinh sản, một lĩnh vực hiện đang được các tập đoàn công nghệ lớn như Microsoft và Google thống trị. Mặc dù Apple đã tích hợp công nghệ Trí tuệ Nhân tạo, như Siri, vào các sản phẩm của mình, công ty trước đây thường tránh việc tham gia vào cảnh quan Trí tuệ Nhân tạo sinh sản. Tuy nhiên, sự tăng đáng kể trong nỗ lực phát triển Trí tuệ Nhân tạo của Apple vào tháng 9 năm 2023, với sự nhấn mạnh đặc biệt vào việc đánh giá các mô hình cơ bản cho các ứng dụng rộng lớn hơn và việc giới thiệu MLX, gợi ý một sự dịch chuyển tiềm năng đối với việc khám phá Trí tuệ Nhân tạo sinh sản. Các nhà phân tích cho rằng Apple có thể sử dụng các khung việc làm MLX để mang các tính năng sáng tạo của Trí tuệ Nhân tạo sinh sản đến dịch vụ và thiết bị của mình. Tuy nhiên, phù hợp với cam kết mạnh mẽ của Apple về quyền riêng tư, việc đánh giá cẩn thận về các vấn đề đạo đức được mong đợi trước khi thực hiện bất kỳ tiến bộ đáng kể nào. Hiện tại, Apple chưa chia sẻ thêm thông tin hoặc ý kiến cụ thể về ý định của mình đối với MLX, MLX Data và Trí tuệ Nhân tạo sinh sản.
Tầm quan trọng của MLX Ngoài Thế Giới Apple
Ngoài thế giới của Apple, mô hình bộ nhớ thống nhất của MLX mang lại lợi thế thực tiễn, làm nó nổi bật so với các khung việc làm như PyTorch và Jax. Tính năng này cho phép các mảng chia sẻ bộ nhớ, làm cho các hoạt động trên các thiết bị khác nhau đơn giản hơn mà không cần sao chép dữ liệu không cần thiết. Điều này trở nên đặc biệt quan trọng khi Trí tuệ Nhân tạo ngày càng phụ thuộc vào các GPU hiệu quả. Thay vì thiết lập thông thường liên quan đến các PC mạnh mẽ và các GPU dành riêng với nhiều VRAM, MLX cho phép GPU chia sẻ VRAM với RAM của máy tính. Sự thay đổi tinh tế này có tiềm năng để yên lặng định nghĩa lại nhu cầu phần cứng Trí tuệ Nhân tạo, làm cho chúng trở nên dễ tiếp cận và hiệu quả hơn. Nó cũng ảnh hưởng đến Trí tuệ Nhân tạo trên các thiết bị cạnh, đề xuất một cách tiếp cận linh hoạt và tiết kiệm tài nguyên hơn so với những gì chúng ta đã quen thuộc.
Thay lời kết
Bước vào lĩnh vực Trí tuệ Nhân tạo sinh sản với khung việc làm MLX, Apple đánh dấu một sự dịch chuyển đáng kể trong cảnh quan Trí tuệ Nhân tạo. Bằng cách chấp nhận các thực hành mã nguồn mở, Apple không chỉ làm dân chủ hóa Trí tuệ Nhân tạo tiên tiến mà còn định vị mình là một đối thủ trong một lĩnh vực được các tập đoàn công nghệ lớn như Microsoft và Google thống trị. Thiết kế thân thiện với người dùng, khả năng xây dựng đồ thị động và mô hình bộ nhớ thống nhất của MLX mang lại lợi thế thực tiễn ngoài hệ sinh thái của Apple, đặc biệt là khi Trí tuệ Nhân tạo ngày càng phụ thuộc vào các GPU hiệu quả. Tiềm năng tác động của khung việc làm này đối với yêu cầu phần cứng và tính linh hoạt của nó đối với Trí tuệ Nhân tạo trên các thiết bị cạnh đề xuất một tương lai biến đổi. Khi Apple điều hướng vào thế giới mới này, việc tập trung vào quyền riêng tư và các vấn đề đạo đức vẫn được xem là quan trọng nhất, định hình hướng đi của vai trò của MLX trong hệ sinh thái Trí tuệ Nhân tạo rộng lớn hơn.