Trợ lý của Amazon hiện có một Alexa LLM dùng riêng, sẵn sàng cải thiện khả năng của các thiết bị trong ngôi nhà của bạn nhờ kiến thức rộng lớn về các giao diện lập trình ứng dụng chuyên dụng cho nhà thông minh.
Tác giả: Jennifer Pattison Tuohy, một nhà đánh giá nhà thông minh đã thử nghiệm các thiết bị kết nối từ năm 2013. Trước đây, bà đã làm việc viết bài cho Wirecutter, Wired và BBC Science Focus.
Ngày 20 tháng 9 năm 2023
Alexa của Amazon sắp sửa bước ra khỏi vỏ bọc của mình, và điều mà sẽ xuất hiện có thể rất thú vị. Tại sự kiện phần cứng thu đông của công ty vào ngày thứ Tư, công ty đã tiết lộ một trợ lý giọng nói Alexa hoàn toàn mới được cung cấp bởi mô hình ngôn ngữ lớn Alexa mới của họ. Theo Dave Limp, SVP hiện tại của Amazon cho các thiết bị và dịch vụ, Alexa mới này có thể hiểu các cụm từ trong cuộc trò chuyện và phản hồi một cách thích hợp, hiểu ngữ cảnh một cách hiệu quả hơn và hoàn thành nhiều yêu cầu từ một lệnh duy nhất.
Các trợ lý giọng nói cần phải có sự đột phá. Sự thiếu sáng tạo chung và sự cải thiện hầu như không thể cảm nhận được về sự hiểu biết đã biến chúng thành các công cụ cơ bản thay vì những tiến bộ công nghệ thú vị mà chúng ta hy vọng khi chúng xuất hiện cách đây hơn một thập kỷ.
Trí tuệ nhân tạo tạo văn bản đã từng được xem như cơ hội sống sót tốt nhất của họ trong một thời gian dài. Tuy nhiên, trong khi các trợ lý kỹ thuật số này luôn có một phần của trí tuệ nhân tạo, chúng thiếu khả năng xử lý phức tạp và tương tác giống con người hơn mà trí tuệ nhân tạo tạo văn bản có thể thực hiện. Điều này là một khoảnh khắc quan trọng đối với nhà thông minh, vì nó có thể đưa tự động hóa nhà cửa lên một tầm cao mới, chuyển nó từ trải nghiệm điều khiển từ xa thành một ngôi nhà thực sự thông minh.
Trong cuộc phỏng vấn với The Verge trước sự kiện, Limp đã giải thích rằng Alexa LLM mới này “là một mô hình ngôn ngữ lớn thực sự có thể tổng quát hóa, được tối ưu hóa rất tốt cho trường hợp sử dụng của Alexa; nó không giống với Bard hoặc ChatGPT hoặc bất kỳ thứ gì khác.”
Tuy nhiên, Alexa hoàn toàn mới này không được tung ra ở mọi nơi, cho tất cả mọi người, cùng một lúc. Công ty sẽ triển khai từ từ thông qua chương trình xem trước “trong tháng tới” và chỉ tại Hoa Kỳ. Rõ ràng, đã có những bài học từ những sai lầm của Microsoft và Google, và Amazon đang tiến hành một cách cẩn thận.
“Khi bạn kết nối một LLM với thế giới thực, bạn muốn giảm thiểu hiện tượng gây ảo tưởng – và trong khi chúng tôi nghĩ rằng chúng tôi đã có các hệ thống đúng đắn, … không có sự thay thế cho việc đưa nó ra thế giới thực,” Limp nói. Nếu bạn muốn nhận thông báo khi có thể tham gia chương trình xem trước, hãy nói với thiết bị Echo của bạn, “Alexa, chúng ta hãy trò chuyện,” và sự quan tâm của bạn sẽ được đăng ký.
Không ngạc nhiên, Alexa siêu mạnh này có thể không phải lúc nào cũng miễn phí. Limp nói rằng trong khi Alexa, như hiện nay, sẽ tiếp tục miễn phí, “ý tưởng về một trợ lý siêu người có thể tăng cường ngôi nhà thông minh của bạn và thậm chí thực hiện nhiệm vụ phức tạp thay bạn có thể cung cấp đủ tiện ích để chúng tôi cuối cùng sẽ thu phí cho nó trong tương lai.”
Thay đổi lớn đầu tiên với Alexa mới sẽ là một trợ lý có khả năng trò chuyện hơn, có thể hiểu nhiều hơn những gì bạn nói và yêu cầu ít hơn về thuật ngữ cụ thể để thực hiện điều bạn yêu cầu. Điều này là một trong những nguyên nhân phổ biến gây frustration với trợ lý giọng nói – phải lặp lại khi bạn yêu cầu nó giảm nhiệt độ hoặc nói, “Một số thứ chia sẻ tên ‘đèn.’ Vui lòng chọn tên độc đáo và chạy quá trình tìm kiếm lại,” lần thứ 900 khi bạn chỉ muốn tìm xem bạn để điều khiển từ xa ở đâu.
Với Alexa mới, bạn có thể nói một cụm từ như “Alexa, tôi lạnh,” và trợ lý sẽ tăng nhiệt độ trên bộ điều khiển nhiệt độ kết nối của bạn. Hoặc, như Limp giải thích, “Nói, ‘Alexa, làm cho phòng này trở nên giống màu của Seahawk,’ và nó sẽ biết phòng tôi đang ở và màu của Seahawk là gì, và thực hiện các chuyển đổi đó giữa các giao diện lập trình ứng dụng.”
Đó chính là các giao diện lập trình ứng dụng (APIs) là yếu tố quan trọng, theo như Limp nói. “Chúng tôi đã đổ một lượng lớn APIs cho nhà thông minh, hơn 200, vào LLM của chúng tôi.” Dữ liệu này, kết hợp với kiến thức của Alexa về các thiết bị có trong ngôi nhà của bạn và phòng bạn đang ở dựa trên loa Echo bạn đang trò chuyện, sẽ cung cấp cho Alexa ngữ cảnh cần thiết để quản lý ngôi nhà thông minh của bạn một cách tự động và mượt mà hơn.
Hiểu biết ngữ cảnh này sẽ mở rộng ra ngoài việc biết những thiết bị kết nối khác mà bạn có thể muốn kiểm soát đến như việc suy đoán khi có điều gì đó thay đổi trong ngôi nhà của bạn. “Nếu bạn thêm một thiết bị mới vào nhà, bạn có thể nói, ‘Alexa, bật đèn mới,’ và nó sẽ biết đèn mới là gì. Nó sẽ làm rõ các thứ, vì vậy nếu bạn thêm một ổ cắm thông minh hoặc đèn mới, việc kiểm soát sẽ dễ dàng hơn,” Limp giải thích.
Một khả năng mới khác là khả năng phản hồi đồng thời cho nhiều yêu cầu. Điều này không chỉ đơn giản là những điều cơ bản mà nó đã có thể làm (một phần), như “Alexa tắt đèn và khóa cửa.” Điều này phức tạp hơn. “Bạn có thể nói, ‘Alexa, bật bộ tưới và mở cửa garage của tôi, và tắt đèn ngoài trời,’ và nó sẽ hiểu tất cả những điều đó,” Limp nói.
Khả năng này sẽ mở rộng ra việc tạo Ra lệnh ngay lập tức chỉ bằng giọng nói – mà không cần lập trình thủ công trong ứng dụng Alexa. “Sáng nay, tôi đã thiết lập một cho con tôi chỉ bằng cách nói, ‘Alexa, mỗi sáng lúc 8 giờ, bật đèn, phát nhạc đánh thức cho con tôi trong phòng ngủ của con và bắt đầu máy pha cà phê,'” Limp nói. “Điều đó có thể phức tạp và mơ hồ đến mức bạn muốn, và ngay lập tức, nó sẽ xuất hiện trong ứng dụng của bạn dưới dạng Lịch trình.”
Ban đầu, tính năng lệnh đa lệnh chỉ hoạt động với một số loại thiết bị – bao gồm đèn, ổ cắm thông minh và một số thiết bị khác, theo Limp. Nhưng nhóm đang làm việc để bổ sung tất cả.
Các nhà phát triển cũng sẽ có khả năng tận dụng các chức năng kognitif mới của Alexa. Amazon đang giới thiệu hai công cụ cho phép Alexa mới này kiểm soát các tính năng đặc biệt của sản phẩm của nhà sản xuất bên thứ ba mà không nhất thiết phải có trong bộ công cụ của hệ thống nhà thông minh của Amazon. Chúng được gọi là Dynamic Controller và Action Controller.
Dynamic Controller sẽ cho phép các tính năng như cảnh chiếu sáng có sẵn để kiểm soát nhiều hơn một cách tự nhiên. Ví dụ, nếu bạn có bóng đèn màu GE Cync và nói, “Alexa, làm cho nó trông đáng sợ ở đây,” Alexa sẽ biết phải làm gì mà không cần bạn phải lập trình một Lịch trình hoặc nhập cảnh vào ứng dụng Alexa.
Tương tự, Action Controller cho phép các nhà phát triển thêm các hành động đơn giản mà Alexa có thể thực hiện. Ví dụ, nếu bạn nói, “Alexa, sàn bẩn,” trợ lý sẽ biết bạn muốn robot hút bụi bắt đầu làm việc.
Amazon cho biết họ đã đang làm việc với GE Cync, Philips, GE Appliances, iRobot, Roborock và Xiaomi về những tính năng này và đang mở cửa chương trình này cho nhiều nhà phát triển hơn. Amazon chưa cung cấp thông tin về cách hoặc khi nào các nhà phát triển sẽ có quyền truy cập vào các công cụ này; chúng tôi đã liên hệ để làm rõ thêm.
Limp cho biết đây chỉ là khởi đầu của hành trình mới của Alexa. “Chúng tôi đã xây dựng một mô hình ngôn ngữ lớn tạo văn bản mới sẽ – theo thời gian – cung cấp năng lượng cho nhiều lĩnh vực của Alexa, bao gồm nhiều trải nghiệm nhà thông minh mới,” ông nói. “Phần đầu tiên là cố gắng đơn giản hóa những nhiệm vụ hàng ngày này.” Nơi mà nó sẽ đi tiếp sẽ là một hành trình thú vị để theo dõi.
Trợ lý giọng nói mới được cung cấp bởi Alexa LLM sẽ ra mắt trước tiên trong chương trình xem trước tại Hoa Kỳ và sẽ có sẵn cho bất kỳ ai sử dụng thiết bị Echo. Amazon chưa công bố ngày khởi đầu của chương trình xem trước, và các tính năng nhà thông minh mới được cung cấp bởi Alexa LLM sẽ là một phần của một chương trình xem trước giới hạn bởi lời mời. Bạn có thể yêu cầu lời mời sau khi tham gia chương trình xem trước. Amazon cho biết rằng những lời mời sẽ có sẵn vào một thời điểm sau này.