Tác giả: Romain Dillet @romaindillet
23 tháng 10 năm 2023
ZenML muốn trở thành bộ keo kết nối tất cả các công cụ trí tuệ nhân tạo mã nguồn mở. Framework mã nguồn mở này cho phép bạn xây dựng các đường ống công việc sẽ được sử dụng bởi các nhà khoa học dữ liệu, kỹ sư học máy và kỹ sư nền tảng để hợp tác và xây dựng các mô hình trí tuệ nhân tạo mới.
Lý do tại sao ZenML là một sự quan tâm đáng kể đó là nó giúp các công ty tự xây dựng các mô hình riêng tư của họ. Tất nhiên, các công ty có lẽ sẽ không xây dựng một đối thủ GPT-4. Nhưng họ có thể xây dựng các mô hình nhỏ hơn hoạt động đặc biệt tốt cho nhu cầu của họ. Điều này sẽ giảm sự phụ thuộc của họ vào các nhà cung cấp API, như OpenAI và Anthropic.
“Ide là, sau khi làn sóng đầu tiên của sự phấn khích với tất cả mọi người sử dụng OpenAI hoặc các API mã nguồn đóng, [ZenML] sẽ cho phép mọi người xây dựng ngăn xếp của riêng họ,” Louis Coppey, một đối tác tại công ty VC Point Nine, tự tin chia sẻ.
Trước đó trong năm nay, ZenML đã tăng vốn bổ sung từ vòng gieo giống của họ từ Point Nine với sự tham gia của nhà đầu tư hiện tại Crane. Tổng cộng, startup đặt trụ sở tại Munich, Đức đã thu về 6,4 triệu đô la kể từ khi thành lập.
Adam Probst và Hamza Tahir, những người sáng lập của ZenML, đã trước đây làm việc cùng nhau trong một công ty xây dựng các đường ống máy học cho các công ty trong một ngành công nghiệp cụ thể. “Ngày qua ngày, chúng tôi cần xây dựng các mô hình học máy và đưa học máy vào sản xuất,” Adam Probst, CEO của ZenML, cho biết.
Từ công việc này, cặp đôi này bắt đầu thiết kế một hệ thống có tính modular sẽ thích nghi với các tình huống, môi trường và khách hàng khác nhau, để họ không phải lặp lại công việc giống nhau lần nào nữa – điều này dẫn đến sự ra đời của ZenML.
Đồng thời, các kỹ sư mới bắt đầu với học máy cũng có thể tiến xa bằng cách sử dụng hệ thống modular này. Đội ngũ ZenML gọi không gian này là MLOps – nó giống một chút với DevOps, nhưng được áp dụng vào học máy cụ thể.
“Chúng tôi đang kết nối các công cụ mã nguồn mở tập trung vào các bước cụ thể trong chuỗi giá trị để xây dựng một đường ống học máy – mọi thứ trên nền của các nhà cung cấp siêu quy mô, vì vậy mọi thứ dựa trên AWS và Google – và cũng các giải pháp on-prem,” Probst nói.
Khái niệm chính của ZenML là các đường ống. Khi bạn viết một đường ống, bạn có thể chạy nó cục bộ hoặc triển khai nó bằng cách sử dụng các công cụ mã nguồn mở như Airflow hoặc Kubeflow. Bạn cũng có thể tận dụng các dịch vụ đám mây quản lý, như EC2, Vertex Pipelines và Sagemaker. ZenML cũng tích hợp với các công cụ học máy mã nguồn mở từ Hugging Face, MLflow, TensorFlow, PyTorch, vv.
“ZenML là một thứ mang tất cả về một trải nghiệm thống nhất duy nhất – nó là đa nhà cung cấp, đa đám mây,” CTO của ZenML, Hamza Tahir nói. Nó mang lại khả năng kết nối, quan sát và khả năng kiểm tra trong các quy trình làm việc với học máy.
Công ty đã đầu tiên phát hành framework của họ trên GitHub dưới dạng một công cụ mã nguồn mở. Đội ngũ đã thu thập hơn 3.000 sao trên nền tảng mã hóa. ZenML cũng gần đây bắt đầu cung cấp một phiên bản đám mây với máy chủ được quản lý – các khả năng kích hoạt cho tích hợp và triển khai liên tục (CI/CD) sẽ sớm có.
Một số công ty đã sử dụng ZenML cho các trường hợp sử dụng công nghiệp, hệ thống đề xuất thương mại điện tử, nhận diện hình ảnh trong môi trường y tế, v.v. Các khách hàng bao gồm Rivian, Playtika và Leroy Merlin.
Các mô hình riêng tư, dành cho ngành công nghiệp cụ thể Sự thành công của ZenML sẽ phụ thuộc vào cách hệ sinh thái trí tuệ nhân tạo đang tiến triển. Hiện tại, nhiều công ty đang thêm tính năng trí tuệ nhân tạo ở đây và ở đó bằng cách truy vấn API của OpenAI. Trong sản phẩm này, bạn hiện đã có một nút ma thuật mới có thể tóm tắt các đoạn văn lớn. Trong sản phẩm kia, bạn hiện đã có câu trả lời đã được viết sẵn cho tương tác hỗ trợ khách hàng.
“OpenAI sẽ có một tương lai, nhưng chúng tôi nghĩ rằng phần lớn thị trường sẽ phải có giải pháp riêng của họ,” Adam Probst nói.
Tuy nhiên, có một số vấn đề với những API này – chúng quá phức tạp và quá đắt đỏ. “OpenAI, hoặc những mô hình ngôn ngữ lớn được xây dựng kín cửa đằng sau, được xây dựng cho các trường hợp sử dụng tổng quát – không phải cho các trường hợp sử dụng cụ thể. Vì vậy, hiện tại chúng quá được huấn luyện và quá đắt đỏ cho các trường hợp sử dụng cụ thể,” Probst nói.
“OpenAI sẽ có một tương lai, nhưng chúng tôi nghĩ rằng phần lớn thị trường sẽ phải có giải pháp riêng của họ. Và đây là lý do tại sao mã nguồn mở rất hấp dẫn đối với họ,” ông bổ sung.
Sam Altman, CEO của OpenAI, cũng tin rằng các mô hình trí tuệ nhân tạo sẽ không phải là một kích thước vừa vặn cho tất cả mọi tình huống. “Tôi nghĩ cả hai đều đóng vai trò quan trọng. Chúng tôi quan tâm đến cả hai và tương lai sẽ là một kết hợp cả hai,” Altman nói khi trả lời câu hỏi về các mô hình nhỏ, chuyên biệt so với các mô hình rộng trong một phiên hỏi đáp tại Station F vào đầu năm nay.
Cũng có những vấn đề về đạo đức và pháp lý trong việc sử dụng trí tuệ nhân tạo. Quy định vẫn đang tiến triển theo thời gian thực, nhưng đặc biệt, lập luật châu Âu có thể khuyến khích các công ty sử dụng các mô hình trí tuệ nhân tạo được huấn luyện trên tập dữ liệu rất cụ thể và theo cách rất cụ thể.
“Gartner cho biết 75% doanh nghiệp đang chuyển từ bằng chứng sáng kiến sang sản xuất vào năm 2024. Vì vậy, năm hoặc hai tới có lẽ sẽ là một số khoảnh khắc quan trọng nhất trong lịch sử trí tuệ nhân tạo, khi chúng ta cuối cùng đang vào giai đoạn sản xuất bằng cách sử dụng một sự kết hợp có lẽ giữa các mô hình cơ sở mã nguồn mở đã được điều chỉnh tinh sở hữu,” Tahir nói với tôi.
“Giá trị của MLOps là chúng tôi tin rằng 99% trường hợp sử dụng trí tuệ nhân tạo sẽ được thúc đẩy bởi các mô hình chuyên biệt, giá rẻ, nhỏ gọn được đào tạo bên trong công ty,” ông bổ sung.