10 tháng 5 năm 2023
Tác giả: Zoubin Ghahramani – Phó Chủ tịch, Google DeepMind
(Đọc trong 4 phút)
Khi nhìn lại những bước tiến lớn nhất trong lĩnh vực Trí tuệ Nhân tạo trong thập kỷ vừa qua, Google đã luôn đứng ở hàng đầu của nhiều khám phá quan trọng. Công việc đột phá của chúng tôi trong các mô hình cơ sở đã trở thành nền tảng cho ngành công nghiệp và các sản phẩm được trang bị Trí tuệ Nhân tạo mà hàng tỷ người sử dụng hàng ngày. Khi chúng tôi tiếp tục phát triển các công nghệ này một cách có trách nhiệm, có tiềm năng lớn cho các ứng dụng biến đổi trong các lĩnh vực như chăm sóc sức khỏe và sáng tạo của con người.
Trong 10 năm qua, chúng ta đã học được rất nhiều điều về khả năng của việc tăng cường mạng nơ-ron – thực tế là chúng ta đã thấy những khả năng đáng ngạc nhiên và thú vị đã nảy sinh từ các mô hình có kích thước lớn hơn. Tuy nhiên, thông qua nghiên cứu của chúng tôi, chúng ta đã học được rằng không phải lúc nào “lớn hơn cũng tốt hơn,” và sự sáng tạo trong nghiên cứu là quan trọng để xây dựng những mô hình xuất sắc. Những tiến bộ gần đây trong cách chúng ta thiết kế và huấn luyện mô hình đã giúp chúng ta hiểu cách mở khóa đa dạng hóa, tầm quan trọng của việc có phản hồi từ con người trong quá trình phát triển, và cách xây dựng mô hình một cách hiệu quả hơn bao giờ hết. Đây là những khối xây dựng mạnh mẽ khi chúng ta tiếp tục nâng cao trạng thái nghệ thuật trong lĩnh vực Trí tuệ Nhân tạo và xây dựng những mô hình có thể mang lại lợi ích thực sự cho con người trong cuộc sống hàng ngày của họ.
Giới thiệu PaLM 2
Tiếp nối công việc này, hôm nay chúng tôi xin giới thiệu PaLM 2, mô hình ngôn ngữ thế hệ tiếp theo của Google. PaLM 2 là một mô hình ngôn ngữ tiên tiến với khả năng đa ngôn ngữ, tư duy và lập trình cải tiến.
- Đa ngôn ngữ: PaLM 2 đã được đào tạo mạnh mẽ hơn trên văn bản đa ngôn ngữ, bao gồm hơn 100 ngôn ngữ. Điều này đã cải thiện đáng kể khả năng của nó trong việc hiểu, tạo ra và dịch văn bản phức tạp – bao gồm cả thành ngữ, thơ ca và câu đố – trên nhiều ngôn ngữ khác nhau, một vấn đề khó khăn để giải quyết. PaLM 2 cũng đạt được điểm cao trong các kỳ thi về năng lực ngôn ngữ ở mức “thạo nghề”.
- Tăng cường Tư duy: Bộ dữ liệu đa dạng của PaLM 2 bao gồm các bài báo khoa học và trang web chứa các biểu thức toán học. Nhờ đó, nó thể hiện khả năng cải thiện trong lĩnh vực logic, tư duy phổ thông và toán học.
- Lập trình: PaLM 2 đã được đào tạo trước trên một lượng lớn các bộ dữ liệu mã nguồn công khai. Điều này có nghĩa là nó xuất sắc trong các ngôn ngữ lập trình phổ biến như Python và JavaScript, nhưng cũng có thể tạo ra mã chuyên biệt trong các ngôn ngữ như Prolog, Fortran và Verilog.
Một họ mô hình đa năng
Ngay cả khi PaLM 2 có khả năng mạnh mẽ hơn, nó cũng nhanh hơn và hiệu quả hơn so với các mô hình trước — và nó có nhiều kích thước khác nhau, điều này giúp dễ dàng triển khai cho nhiều trường hợp sử dụng khác nhau. Chúng tôi sẽ cung cấp PaLM 2 trong bốn kích thước từ nhỏ nhất đến lớn nhất: Gecko, Otter, Bison và Unicorn. Gecko nhẹ đến mức có thể hoạt động trên thiết bị di động và đủ nhanh để chạy các ứng dụng tương tác tốt trên thiết bị, ngay cả khi không kết nối mạng. Điều đa năng này có nghĩa là PaLM 2 có thể được điều chỉnh tinh chỉnh để hỗ trợ toàn bộ loạt sản phẩm theo nhiều cách khác nhau, để giúp đỡ nhiều người hơn.
Góp mặt vào hơn 25 sản phẩm tiềm năng của Google
Tại sự kiện I/O hôm nay, chúng tôi đã thông báo hơn 25 sản phẩm và tính năng mới được động viên bởi PaLM 2. Điều này có nghĩa là PaLM 2 đang đưa những khả năng Trí tuệ Nhân tạo tiên tiến nhất trực tiếp vào các sản phẩm của chúng tôi và đến người dùng – bao gồm người tiêu dùng, nhà phát triển và các doanh nghiệp của mọi kích thước trên toàn thế giới. Dưới đây là một số ví dụ:
- Khả năng đa ngôn ngữ cải thiện của PaLM 2 cho phép chúng tôi mở rộng Bard đến các ngôn ngữ mới, bắt đầu từ hôm nay. Hơn nữa, nó đang hỗ trợ bản cập nhật lập trình mà chúng tôi vừa thông báo gần đây.
- Các tính năng Workspace giúp bạn viết trong Gmail và Google Docs, cũng như giúp bạn tổ chức trong Google Sheets đều tận dụng khả năng của PaLM 2 với tốc độ giúp người dùng hoàn thành công việc một cách tốt hơn và nhanh chóng hơn.
- Med-PaLM 2, được đào tạo bởi các nhóm nghiên cứu y tế của chúng tôi với kiến thức y học, có khả năng trả lời câu hỏi và tóm tắt thông tin từ nhiều văn bản y học mật độ cao. Nó đạt được kết quả tốt nhất trong năng lực y học và là mô hình ngôn ngữ lớn đầu tiên có thể thực hiện ở mức “chuyên gia” trên các câu hỏi kiểu thi cấp phép y tế của Hoa Kỳ. Hiện tại, chúng tôi đang bổ sung khả năng đa dạng hóa để tổng hợp thông tin như tia X và chụp phim vú để cải thiện kết quả cho bệnh nhân. Med-PaLM 2 sẽ mở cửa cho một nhóm nhỏ khách hàng trên Cloud để thu thập ý kiến vào mùa hè năm nay, nhằm xác định các trường hợp sử dụng an toàn và hữu ích.
- Sec-PaLM là một phiên bản đặc biệt của PaLM 2 được đào tạo cho các trường hợp sử dụng về bảo mật, và là một bước tiến tiềm năng cho phân tích an ninh mạng. Có sẵn thông qua Google Cloud, nó sử dụng Trí tuệ Nhân tạo để giúp phân tích và giải thích hành vi của các script có tiềm năng độc hại, và phát hiện tốt hơn xem script nào thực sự là mối đe dọa đối với cá nhân và tổ chức trong thời gian chưa từng có.
- *Từ tháng 3, chúng tôi đã tiến hành xem trước PaLM API với một nhóm nhỏ nhà phát triển. Bắt đầu từ hôm nay, các nhà phát triển có thể đăng ký sử dụng mô hình PaLM 2, hoặc khách hàng có thể sử dụng mô hình trong Vertex AI với tính riêng tư, bảo mật và quản trị cấp doanh nghiệp. PaLM 2 cũng đang cung cấp sức mạnh cho Duet AI cho Google Cloud, một công cụ hợp tác Trí tuệ Nhân tạo dựng để giúp người dùng học hỏi, xây dựng và vận hành nhanh hơn bao giờ hết.
Thúc đẩy mạnh mẽ hướng tới tương lai
PaLM 2 đã cho chúng ta thấy tác động của các mô hình có khả năng cao về kích thước và tốc độ khác nhau – và rằng các mô hình Trí tuệ Nhân tạo linh hoạt mang lại lợi ích thực sự cho mọi người. Tuy nhiên, chúng tôi cam kết không chỉ phát hành các công cụ Trí tuệ Nhân tạo hữu ích và có trách nhiệm ngày nay, mà còn đang làm việc để tạo ra những mô hình cơ sở tốt nhất cho Google.
Các nhóm nghiên cứu Brain và DeepMind của Google đã đạt được nhiều thời điểm định hình quan trọng trong lĩnh vực Trí tuệ Nhân tạo trong thập kỷ qua, và chúng tôi đang kết hợp hai đội tuyệt vời này thành một đơn vị duy nhất, để tiếp tục tăng tốc tiến bộ của chúng tôi. Google DeepMind, được hỗ trợ bởi tài nguyên tính toán của Google, sẽ không chỉ mang lại những khả năng mới đáng kinh ngạc cho các sản phẩm mà bạn sử dụng hàng ngày, mà còn đảm bảo mở đường cho thế hệ mô hình Trí tuệ Nhân tạo tiếp theo một cách có trách nhiệm.
Chúng tôi đã bắt đầu làm việc trên dự án Gemini – mô hình tiếp theo được tạo từ đầu để đa dạng hóa, hiệu quả cao trong việc tích hợp công cụ và API, và được xây dựng để khuyến khích sự đổi mới trong tương lai, như bộ nhớ và kế hoạch. Gemini vẫn đang trong quá trình đào tạo, nhưng nó đã thể hiện khả năng đa dạng hóa chưa từng thấy trong các mô hình trước đó. Khi được điều chỉnh tinh chỉnh và kiểm tra một cách nghiêm ngặt về an toàn, Gemini sẽ có sẵn ở các kích thước và khả năng khác nhau, giống như PaLM 2, để đảm bảo rằng nó có thể triển khai trên các sản phẩm, ứng dụng và thiết bị khác nhau để mang lại lợi ích cho mọi người.