Tác giả: Antoine Tardif.
Được xuất bản cách đây 17 giây vào ngày 30 tháng 9 năm 2024
Trong một thông báo mang tính đột phá, Liquid AI, một công ty khởi nghiệp từ MIT, đã giới thiệu dòng sản phẩm Liquid Foundation Models (LFMs) đầu tiên của mình. Được thiết kế từ nguyên tắc cơ bản, những mô hình này đã đặt ra tiêu chuẩn mới trong lĩnh vực AI tạo sinh, cung cấp hiệu suất vượt trội ở các quy mô khác nhau. LFMs, với kiến trúc sáng tạo và khả năng tiên tiến, được dự đoán sẽ thách thức các mô hình AI hàng đầu hiện nay, bao gồm ChatGPT.
Liquid AI được thành lập bởi một nhóm các nhà nghiên cứu từ MIT, bao gồm Ramin Hasani, Mathias Lechner, Alexander Amini, và Daniela Rus. Trụ sở chính của công ty đặt tại Boston, Massachusetts, với sứ mệnh tạo ra các hệ thống AI đa năng, hiệu quả dành cho các doanh nghiệp ở mọi quy mô. Nhóm này ban đầu tiên phong phát triển các mạng nơ-ron lỏng, một loại mô hình AI lấy cảm hứng từ hoạt động của não bộ, và hiện tại họ đang mở rộng khả năng của các hệ thống AI từ các thiết bị biên đến các triển khai cấp doanh nghiệp.
Liquid Foundation Models (LFMs) là gì?
Liquid Foundation Models đại diện cho một thế hệ hệ thống AI mới, có hiệu quả cao trong việc sử dụng bộ nhớ và năng lực tính toán. Được xây dựng trên nền tảng của hệ thống động học, xử lý tín hiệu, và đại số tuyến tính số, các mô hình này được thiết kế để xử lý nhiều loại dữ liệu tuần tự như văn bản, video, âm thanh và tín hiệu với độ chính xác đáng kinh ngạc.
Liquid AI đã phát triển ba mô hình ngôn ngữ chính trong lần ra mắt này:
- LFM-1B: Mô hình dày đặc với 1,3 tỷ tham số, được tối ưu hóa cho các môi trường hạn chế về tài nguyên.
- LFM-3B: Mô hình 3,1 tỷ tham số, lý tưởng cho các kịch bản triển khai ở biên, chẳng hạn như ứng dụng di động.
- LFM-40B: Mô hình Mixture of Experts (MoE) với 40,3 tỷ tham số, được thiết kế để xử lý các nhiệm vụ phức tạp với hiệu suất xuất sắc.
Những mô hình này đã đạt được kết quả vượt trội trong các tiêu chuẩn AI hàng đầu, biến chúng trở thành đối thủ đáng gờm so với các mô hình AI tạo sinh hiện tại.
Hiệu Suất Tiên Tiến
Các mô hình LFM của Liquid AI mang lại hiệu suất hàng đầu trong nhiều tiêu chuẩn đánh giá khác nhau. Chẳng hạn, LFM-1B vượt trội hơn các mô hình dựa trên transformer trong cùng phân khúc, trong khi LFM-3B cạnh tranh với các mô hình lớn hơn như Phi-3.5 của Microsoft và loạt mô hình Llama của Meta. Mô hình LFM-40B, dù có kích thước lớn, vẫn đủ hiệu quả để cạnh tranh với các mô hình có số lượng tham số lớn hơn, mang lại sự cân bằng độc đáo giữa hiệu suất và hiệu quả tài nguyên.
Một số điểm nổi bật về hiệu suất của LFM bao gồm:
- LFM-1B: Vượt trội trong các tiêu chuẩn như MMLU và ARC-C, đặt ra tiêu chuẩn mới cho các mô hình 1 tỷ tham số.
- LFM-3B: Vượt qua các mô hình như Phi-3.5 và Gemma 2 của Google về hiệu quả, đồng thời duy trì mức tiêu thụ bộ nhớ thấp, lý tưởng cho các ứng dụng AI trên thiết bị di động và biên.
- LFM-40B: Kiến trúc MoE của mô hình này cung cấp hiệu suất tương đương với các mô hình lớn hơn, với 12 tỷ tham số hoạt động tại bất kỳ thời điểm nào.
Kỷ Nguyên Mới Trong Hiệu Quả AI
Một thách thức lớn trong AI hiện đại là quản lý bộ nhớ và tính toán, đặc biệt khi làm việc với các nhiệm vụ có ngữ cảnh dài như tóm tắt tài liệu hoặc tương tác chatbot. LFMs vượt trội trong lĩnh vực này bằng cách nén dữ liệu đầu vào một cách hiệu quả, giúp giảm tiêu thụ bộ nhớ trong quá trình suy luận. Điều này cho phép các mô hình xử lý các chuỗi dữ liệu dài hơn mà không cần nâng cấp phần cứng đắt đỏ.
Ví dụ, LFM-3B cung cấp độ dài ngữ cảnh lên đến 32k token—biến nó trở thành một trong những mô hình hiệu quả nhất cho các nhiệm vụ yêu cầu xử lý lượng lớn dữ liệu đồng thời.
Kiến Trúc Cách Mạng
LFMs được xây dựng trên một khung kiến trúc độc đáo, khác biệt so với các mô hình transformer truyền thống. Kiến trúc này tập trung vào các toán tử tuyến tính thích ứng, điều chỉnh việc tính toán dựa trên dữ liệu đầu vào. Cách tiếp cận này cho phép Liquid AI tối ưu hóa hiệu suất đáng kể trên nhiều nền tảng phần cứng khác nhau, bao gồm NVIDIA, AMD, Cerebras và Apple.
Không gian thiết kế của LFMs bao gồm sự kết hợp mới mẻ giữa các cấu trúc trộn token và trộn kênh, giúp cải thiện cách mô hình xử lý dữ liệu. Điều này dẫn đến khả năng khái quát hóa và suy luận vượt trội, đặc biệt là trong các nhiệm vụ có ngữ cảnh dài và các ứng dụng đa phương tiện.
Mở Rộng Biên Giới AI
Liquid AI có những tham vọng lớn đối với LFMs. Bên cạnh các mô hình ngôn ngữ, công ty đang mở rộng các mô hình nền tảng của mình để hỗ trợ nhiều loại dữ liệu khác nhau, bao gồm video, âm thanh và dữ liệu chuỗi thời gian. Những tiến bộ này sẽ cho phép LFMs phát triển trong nhiều ngành công nghiệp, chẳng hạn như dịch vụ tài chính, công nghệ sinh học, và điện tử tiêu dùng.
Công ty cũng tập trung vào việc đóng góp cho cộng đồng khoa học mở. Mặc dù các mô hình hiện tại chưa được mã nguồn mở, Liquid AI dự định công bố các phát hiện nghiên cứu, phương pháp và bộ dữ liệu liên quan để khuyến khích sự hợp tác và đổi mới trong cộng đồng AI rộng lớn hơn.
Quyền Truy Cập Sớm và Ứng Dụng
Liquid AI hiện đang cung cấp quyền truy cập sớm vào các mô hình LFM của mình thông qua nhiều nền tảng khác nhau, bao gồm Liquid Playground, Lambda (giao diện trò chuyện và API), và Perplexity Labs. Các doanh nghiệp muốn tích hợp hệ thống AI tiên tiến vào hoạt động của mình có thể khám phá tiềm năng của LFMs trong nhiều môi trường triển khai, từ thiết bị biên đến các giải pháp tại chỗ.
Phương pháp khoa học mở của Liquid AI khuyến khích những người dùng đầu tiên chia sẻ kinh nghiệm và thông tin chi tiết. Công ty đang tích cực tìm kiếm phản hồi để tinh chỉnh và tối ưu hóa các mô hình của mình cho các ứng dụng thực tế. Các nhà phát triển và tổ chức quan tâm đến việc tham gia hành trình này có thể đóng góp vào các nỗ lực kiểm tra bảo mật và giúp Liquid AI cải thiện hệ thống AI của mình.
Kết Luận
Việc ra mắt Liquid Foundation Models đánh dấu một bước tiến quan trọng trong lĩnh vực AI. Với trọng tâm là hiệu suất, khả năng thích ứng và tính hiệu quả, LFMs sẵn sàng thay đổi cách các doanh nghiệp tiếp cận việc tích hợp AI. Khi nhiều tổ chức áp dụng các mô hình này, tầm nhìn của Liquid AI về các hệ thống AI đa năng có thể mở rộng sẽ trở thành nền tảng của kỷ nguyên AI tiếp theo.
Nếu bạn quan tâm đến việc khám phá tiềm năng của LFMs cho tổ chức của mình, Liquid AI mời bạn liên hệ và tham gia cộng đồng những người tiên phong đang định hình tương lai của AI.