Tác giả: Julian Horsey
ngày 27 tháng 9 năm 2023
Microsoft đã một cách tĩnh lặng phát hành một khung công cụ mới cho phép phát triển ứng dụng mô hình ngôn ngữ lớn (LLM) bằng cách sử dụng nhiều tác nhân có thể trò chuyện với nhau để giải quyết các nhiệm vụ. Các tác nhân AutoGen có thể tùy chỉnh, có khả năng trò chuyện và dễ dàng cho phép sự tham gia của con người. Chúng có thể hoạt động trong các chế độ khác nhau sử dụng sự kết hợp của các LLM, đầu vào của con người và các công cụ. Hướng dẫn nhanh này cung cấp một cái nhìn tổng quan về những gì bạn có thể mong đợi từ hệ thống Microsoft AutoGen AI Agent mới và cách cài đặt nó.
Hợp tác với Đại học Penn State và Đại học Washington, Microsoft đã phát triển và phát hành AutoGen, một công cụ cải tiến khả năng của các mô hình ngôn ngữ lớn (LLMs) bằng cách cho phép trò chuyện đa tác nhân. Khung công cụ sáng tạo này hiện đã có sẵn trên Github, mở ra một thế giới mới về khả năng cho các nhà phát triển và nhà nghiên cứu trong lĩnh vực trí tuệ nhân tạo (AI).
Microsoft AutoGen (AI Agent) được công bố trên Github
AutoGen là một công cụ đột phá giúp đơn giản hóa việc phát triển các ứng dụng LLM thế hệ tiếp theo. Nó làm điều này bằng cách cho phép trò chuyện đa tác nhân một cách tối thiểu, từ đó tối ưu hóa quá trình điều phối, tự động hóa và tối ưu hóa các luồng công việc phức tạp của LLM. Điều này không chỉ làm tối đa hóa hiệu suất của các mô hình LLM mà còn giúp vượt qua nhược điểm bẩm sinh của chúng.
Một trong những tính năng quan trọng của AutoGen là khả năng hỗ trợ các mẫu trò chuyện đa dạng. Nhà phát triển có thể tùy chỉnh và trò chuyện với các tác nhân để xây dựng nhiều mẫu trò chuyện khác nhau. Tính linh hoạt này mở rộng đến khả năng tự động hóa cuộc trò chuyện, số lượng tác nhân và cấu trúc trò chuyện của tác nhân. Điều này làm cho AutoGen nổi bật so với các công cụ trí tuệ nhân tạo khác, cung cấp một mức độ tùy chỉnh và tương tác mà không phải lúc nào cũng có trong các khung công cụ khác.
AutoGen cũng cung cấp một bộ sưu tập các hệ thống hoạt động với các mức độ phức tạp khác nhau. Các hệ thống này bao gồm nhiều ứng dụng khác nhau từ nhiều lĩnh vực, thể hiện tính linh hoạt và tiềm năng rộng lớn của công cụ. Tính năng này là một minh chứng cho tác động tiềm năng của AutoGen trong nhiều lĩnh vực khác nhau, từ dịch vụ khách hàng đến lĩnh vực chăm sóc sức khỏe, giáo dục và xa hơn nữa.
Trợ lý ảo (AssistantAgent)
AssistantAgent được thiết kế để hoạt động như một trợ lý trí tuệ nhân tạo, sử dụng mặc định các mô hình ngôn ngữ lớn (LLMs) nhưng không yêu cầu đầu vào của con người hoặc thực thi mã code. Nó có thể viết mã Python (trong một khối mã Python) để người dùng thực thi khi nhận được một tin nhắn (thông thường là mô tả về một nhiệm vụ cần được giải quyết).
Dưới nền tảng, mã Python được viết bởi LLM (ví dụ, GPT-4). Nó cũng có thể nhận kết quả thực thi và đề xuất mã có sửa lỗi. Hành vi của nó có thể thay đổi bằng cách truyền một tin nhắn hệ thống mới. Cấu hình suy luận LLM có thể được cấu hình thông qua llm_config.
Đại diện ủy nhiệm (UserProxyAgent)
UserProxyAgent là một tác nhân đại diện cho con người theo khái niệm, mặc định yêu cầu đầu vào của con người là phản hồi của tác nhân tại mỗi lượt tương tác và cũng có khả năng thực thi mã code và gọi các hàm. UserProxyAgent tự động kích hoạt thực thi mã code khi nó phát hiện một khối mã có thể thực thi trong tin nhắn nhận được và không có đầu vào từ con người được cung cấp.
Thực thi mã code có thể được tắt bằng cách đặt code_execution_config thành False. Phản hồi dựa trên LLM được tắt mặc định. Nó có thể được kích hoạt bằng cách đặt llm_config thành một từ điển tương ứng với cấu hình suy luận. Khi llm_config được đặt thành một từ điển, UserProxyAgent có thể tạo ra các phản hồi bằng cách sử dụng một LLM khi không thực hiện thực thi mã code.
Về khả năng kỹ thuật, AutoGen cung cấp một phiên bản thay thế dễ dàng cho openai.Completion hoặc openai.ChatCompletion như một API suy luận được cải tiến. Điều này cho phép dễ dàng tinh chỉnh hiệu suất, các tiện ích như thống nhất và lưu trữ API, và các mẫu sử dụng cao cấp, chẳng hạn như xử lý lỗi, suy luận đa cấu hình, lập trình ngữ cảnh và nhiều tính năng khác. Những tính năng này giúp tối ưu hóa tính hiệu quả của các mô hình LLM đắt đỏ như ChatGPT và GPT-4.
Bằng cách tự động hóa cuộc trò chuyện giữa nhiều tác nhân có khả năng, AutoGen cho phép thực hiện tập thể các nhiệm vụ một cách tự động hoặc với phản hồi từ con người. Điều này bao gồm các nhiệm vụ đòi hỏi sử dụng công cụ thông qua mã code, mở rộng thêm khả năng ứng dụng của công cụ này.
Sự ra mắt của AutoGen từ Microsoft là một mốc quan trọng trong sự tiến bộ nhanh chóng của công nghệ trí tuệ nhân tạo. Bằng cách đưa công cụ này lên Github, Microsoft không chỉ đang democritize việc truy cập vào các công cụ trí tuệ nhân tạo tiên tiến mà còn đang tạo ra một môi trường cộng tác, nơi các nhà phát triển và nhà nghiên cứu có thể đóng góp vào sự tiến hóa của công nghệ này.
AutoGen đại diện cho một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo. Khả năng của nó trong việc cho phép các cuộc trò chuyện đa tác nhân, kết hợp với các tác nhân có khả năng tùy chỉnh và trò chuyện, làm nó nổi bật so với các công cụ trí tuệ nhân tạo khác. Khi công nghệ này tiếp tục phát triển, thì việc theo dõi các ứng dụng sáng tạo mà các nhà phát triển và nhà nghiên cứu sẽ tạo ra bằng AutoGen sẽ là điều rất thú vị.