Tác giả: Michael Nuñez
Ngày 8 tháng 11 năm 2023
Từ những ngày đầu tiên của nghiên cứu trí tuệ nhân tạo vào những năm 1950, các nhà khoa học đã theo đuổi mục tiêu hấp dẫn của việc tạo ra máy móc có khả năng hoạt động tự động như các tác nhân thông minh trong thế giới thực.
Tuần này, giấc mơ đó đã tiến gần hơn một bước nhỏ với sự ra mắt công nghệ mới của OpenAI, nhà sáng tạo của ChatGPT, mở đường cho việc phát triển các tác nhân tự động như vậy. Tại hội nghị phát triển đầu tiên ở San Francisco vào thứ Hai, công ty đã đưa ra một số thông báo lớn, bao gồm việc giới thiệu GPT-4 Turbo và các phiên bản có thể tùy chỉnh của ChatGPT.
Tuy nhiên, ánh đèn sân khấu nên đã tập trung nhiều hơn vào một công cụ mới được gọi là Assistants API. Công cụ này, được ra mắt cuối cùng trong buổi giới thiệu chính, giúp các lập trình viên nhanh chóng xây dựng “assistance” tùy chỉnh vào ứng dụng của họ có khả năng hiểu ngôn ngữ tự nhiên, thực hiện các chức năng trong ứng dụng của họ và sử dụng các dịch vụ như thị giác máy tính.
Romain Huet, trưởng phòng trải nghiệm phát triển tại OpenAI, mô tả việc ra mắt Assistants API như là một “bước đi đầu tiên” vào tương lai của các tác nhân trí tuệ nhân tạo hoàn toàn tự động trong một cuộc trò chuyện với VentureBeat ngay sau khi rời khỏi sân khấu. Mặc dù mô tả của Huet là sự khiêm tốn, “bước đi đầu tiên” này có khả năng biến đổi toàn diện cách chúng ta tương tác hàng ngày với công nghệ.
Trong một bản trình diễn trực tiếp, Huet đã tạo ra một trợ lý cho một ứng dụng du lịch, Wanderlust, sử dụng GPT-4 để đề xuất các địa điểm và API DALL-E 3 để tạo hình minh họa cho từng hướng dẫn du lịch (hiển thị trong video tại điểm 33:16). Trợ lý du lịch, được lắp ráp trong vài phút, đã thể hiện khả năng lập kế hoạch và đặt chỗ cho kỳ nghỉ, một nhiệm vụ truyền thống thường do các đại lý du lịch con người thực hiện.
Quyền lực ẩn sau Assistants API
Huet giải thích rằng Assistants API cho phép các nhà phát triển tích hợp “trợ lý” vào ứng dụng của họ. Những trợ lý này có thể tận dụng các mô hình của OpenAI với hướng dẫn cụ thể để điều chỉnh khả năng và tính cách của chúng, và có thể sử dụng đồng thời nhiều công cụ, bao gồm một trình thông dịch mã và hệ thống truy xuất kiến thức.
Điều đặc biệt đáng chú ý ở đây là tiềm năng cho sự hợp tác chéo giữa những trợ lý trí tuệ nhân tạo này. Khi ngày càng nhiều nhà phát triển bắt đầu tích hợp những trợ lý này vào sản phẩm của họ, dễ dàng hình dung được một thế giới trong đó các trợ lý trí tuệ nhân tạo khác nhau tương tác với nhau để hoàn thành các nhiệm vụ. Một lệnh để đặt một chuyến du lịch có thể kích hoạt một chuỗi các hành động được điều phối giữa nhiều tác nhân trí tuệ nhân tạo: một để đặt chỗ máy bay, một cái khác để đảm bảo đặt phòng khách sạn, và có thể là một cái khác để lập kế hoạch cho các hoạt động.
Sự khác biệt giữa Assistants và Agents
Bằng cách cho phép GPT-4 tương tác và làm việc với các ứng dụng và dịch vụ hiện tại, Assistants API tạo ra một mô hình mới cho các nhiệm vụ được hỗ trợ bởi trí tuệ nhân tạo. Những “trợ lý” trí tuệ nhân tạo này không chỉ là các công cụ chờ lệnh mà là những người tham gia tích cực trong việc thực hiện nhiệm vụ, đưa chúng ta gần hơn với khái niệm về trí tuệ nhân tạo như một trợ lý cá nhân.
Sự phân biệt cốt lõi giữa Assistants API và các tác nhân trí tuệ nhân tạo hoàn toàn tự động nằm ở mức độ độc lập. Trong hình thức lý tưởng của chúng, các tác nhân trí tuệ nhân tạo có thể thực hiện nhiệm vụ độc lập và tích cực, mà không cần sự giám sát của con người. Mặc dù Assistants API chưa đạt đến mức độ tự động này, nhưng đây là một bước quan trọng hướng tới điều đó.
VIễn cảnh tương lai của Trợ lý ảo
Tầm quan trọng của cập nhật này là rộng lớn. Trong tương lai gần, các tác nhân trí tuệ nhân tạo có thể đặt bàn ăn tối, mua sắm đồ dùng gia đình, hoặc đảm bảo được chuyến bay có giá tốt nhất đến New York City. Bằng cách hỗ trợ việc tạo ra những công cụ do trợ lý điều khiển, OpenAI đang đưa chúng ta gần hơn một bước đến tương lai nơi các tác nhân trí tuệ nhân tạo thực hiện các nhiệm vụ thay mặt chúng ta – và tương tác với nhau để hoàn thành các nhiệm vụ khác nhau.
Nói một cách ngắn gọn, Assistants API cho phép tạo ra các tác nhân bán tự động có khả năng làm việc trên nhiều nhiệm vụ và ngành công nghiệp. Như mô tả của Huet, sự ra mắt của Assistants API chỉ là một “bước đi đầu tiên” vào tương lai. Nhưng trong lĩnh vực trí tuệ nhân tạo, ngay cả những bước đi nhỏ cũng có thể đại diện cho những bước tiến đáng kể.