Tác giả: Orr Danon
Ngày 17 tháng 11 năm 2023
Ở đầu tiên, có internet, đã thay đổi cuộc sống của chúng ta mãi mãi – cách chúng ta giao tiếp, mua sắm, và thực hiện kinh doanh. Sau đó, vì lý do về độ trễ, quyền riêng tư, và hiệu quả chi phí, internet di chuyển đến mép mạng, tạo nên “internet của mọi vật.”
Bây giờ có Trí tuệ Nhân tạo, làm cho mọi hoạt động trên internet của chúng ta trở nên dễ dàng hơn, cá nhân hóa hơn, thông minh hơn. Tuy nhiên, để sử dụng nó, cần có các máy chủ lớn và khả năng tính toán cao, nên nó bị giới hạn trong đám mây. Nhưng những động lực tương tự – độ trễ, quyền riêng tư, hiệu quả chi phí – đã thúc đẩy các công ty như Hailo phát triển các công nghệ cho phép Trí tuệ Nhân tạo ở mép mạng.
Không nghi ngờ, đại sự mới tiếp theo là Trí tuệ Nhân tạo sinh sản. Trí tuệ Nhân tạo sinh sản mang lại tiềm năng lớn trong nhiều ngành. Nó có thể được sử dụng để tối ưu hóa công việc và tăng cường hiệu suất của các người sáng tạo khác nhau – luật sư, nhà văn nội dung, nhà thiết kế đồ họa, nhạc sĩ, và nhiều người khác. Nó có thể giúp khám phá các loại thuốc trị liệu mới hoặc hỗ trợ trong các thủ tục y tế. Trí tuệ Nhân tạo sinh sản có thể cải thiện tự động hóa công nghiệp, phát triển mã nguồn phần mềm mới và nâng cao an ninh giao thông thông qua tổng hợp tự động của video, âm thanh, hình ảnh, và nhiều hơn nữa.
Tuy nhiên, Trí tuệ Nhân tạo sinh sản như nó tồn tại ngày nay bị hạn chế bởi công nghệ làm cho nó có thể. Điều này bởi vì Trí tuệ Nhân tạo sinh sản diễn ra trong đám mây – các trung tâm dữ liệu của bộ xử lý máy tính đắt tiền và tiêu tốn năng lượng, nằm xa người dùng thực tế. Khi ai đó gửi một yêu cầu đến một công cụ Trí tuệ Nhân tạo sinh sản như ChatGPT hoặc một giải pháp họp trực tuyến mới dựa trên trí tuệ nhân tạo, yêu cầu được truyền qua internet đến đám mây, nơi nó được xử lý bởi các máy chủ trước khi kết quả được trả về qua mạng.
Khi các công ty phát triển các ứng dụng mới cho Trí tuệ Nhân tạo sinh sản và triển khai chúng trên các loại thiết bị khác nhau – camera video và hệ thống an ninh, robot công nghiệp và cá nhân, máy tính xách tay và thậm chí là ô tô – đám mây trở thành một chai lọ trong việc băng thông, chi phí và kết nối.
Đối với các ứng dụng như hỗ trợ lái xe, phần mềm máy tính cá nhân, họp trực tuyến và an ninh, việc liên tục chuyển dữ liệu qua mạng có thể gây rủi ro về quyền riêng tư.
Giải pháp là cho phép các thiết bị này xử lý Trí tuệ Nhân tạo sinh sản tại mép mạng. Trên thực tế, Trí tuệ Nhân tạo sinh sản dựa trên mép mạng có thể mang lại nhiều lợi ích cho nhiều ứng dụng mới nổi.
Trí tuệ Nhân tạo tạo sinh đang trỗi dậy
Hãy cân nhắc rằng vào tháng 6, Mercedes-Benz đã thông báo rằng họ sẽ giới thiệu ChatGPT vào các mô hình xe của họ. Trong một chiếc Mercedes được cải tiến bằng ChatGPT, ví dụ, người lái có thể yêu cầu xe – hoàn toàn không cần sử dụng tay – một công thức nấu ăn dựa trên các nguyên liệu họ đã có ở nhà. Tức là, nếu chiếc xe được kết nối với internet. Tại một bãi đỗ xe hoặc địa điểm xa lạ, mọi dự đoán đều không còn.
Trong vài năm gần đây, họp trực tuyến đã trở thành thói quen thứ hai đối với hầu hết chúng ta. Đã có các công ty phần mềm tích hợp các hình thức của Trí tuệ Nhân tạo vào các giải pháp họp trực tuyến. Có thể là để tối ưu hóa chất lượng âm thanh và video ngay lập tức, hoặc để “đặt” những người tham gia vào cùng không gian ảo. Bây giờ, họp trực tuyến được hỗ trợ bởi Trí tuệ Nhân tạo sinh sản có thể tự động tạo ra bản ghi cuộc họp hoặc thu hút thông tin liên quan từ nguồn thông tin của công ty trong thời gian thực khi các chủ đề khác nhau được thảo luận.
Tuy nhiên, nếu một chiếc ô tô thông minh, hệ thống họp trực tuyến hoặc bất kỳ thiết bị mép mạng nào khác không thể kết nối lại với đám mây, thì trải nghiệm Trí tuệ Nhân tạo sinh sản sẽ không thể xảy ra. Nhưng và nếu chúng không cần phải? Điều này nghe có vẻ là một nhiệm vụ đáng sợ khi xét đến sự xử lý lớn của Trí tuệ Nhân tạo đám mây, nhưng giờ đây đã trở nên khả thi.
Trí tuệ Nhân tạo tạo sinh tại cận biên mạng
Hiện tại, đã có các công cụ Trí tuệ Nhân tạo sinh sản, ví dụ, có thể tự động tạo ra bài thuyết trình PowerPoint phong phú và hấp dẫn. Tuy nhiên, người dùng cần hệ thống hoạt động từ bất kỳ đâu, thậm chí mà không cần kết nối internet.
Tương tự, chúng ta đã thấy một loại mới của các trợ lý “đồng lái” dựa trên Trí tuệ Nhân tạo, sẽ thay đổi cách chúng ta tương tác với các thiết bị máy tính của mình bằng cách tự động hóa nhiều công việc hàng ngày, như tạo báo cáo hoặc minh họa dữ liệu. Hãy tưởng tượng mở một chiếc laptop, laptop nhận diện bạn thông qua camera của nó, sau đó tự động tạo ra một kế hoạch hành động cho ngày/tuần/tháng dựa trên các công cụ bạn sử dụng nhiều nhất, chẳng hạn như Outlook, Teams, Slack, Trello, v.v. Tuy nhiên, để duy trì quyền riêng tư dữ liệu và một trải nghiệm người dùng tốt, bạn phải có khả năng chạy Trí tuệ Nhân tạo sinh sản cục bộ.
Ngoài việc đối mặt với những thách thức của kết nối không đáng tin cậy và quyền riêng tư dữ liệu, Trí tuệ Nhân tạo tại mép mạng còn có thể giúp giảm yêu cầu băng thông và nâng cao hiệu suất ứng dụng. Ví dụ, nếu một ứng dụng Trí tuệ Nhân tạo sinh sản đang tạo ra nội dung giàu dữ liệu, như không gian họp ảo, qua đám mây, quá trình này có thể bị chậm trễ tùy thuộc vào băng thông có sẵn (và đắt đỏ). Và một số loại ứng dụng Trí tuệ Nhân tạo sinh sản cụ thể, như an ninh, robot học, hoặc chăm sóc sức khỏe, yêu cầu phản hồi có hiệu suất cao và độ trễ thấp mà kết nối đám mây không thể xử lý được.
Trong lĩnh vực an ninh video, khả năng nhận diện lại người khi họ di chuyển giữa nhiều camera – một số được đặt ở những nơi mà mạng không thể tiếp cận – đòi hỏi mô hình dữ liệu và xử lý Trí tuệ Nhân tạo trực tiếp trong các camera thực tế. Trong trường hợp này, Trí tuệ Nhân tạo sinh sản có thể được áp dụng để mô tả tự động về những gì camera thấy thông qua các truy vấn đơn giản như, “Tìm đứa trẻ 8 tuổi mặc áo phông đỏ và nón baseball.”
Đó là Trí tuệ Nhân tạo tại mép mạng.
Các Tiến Triển trong Trí tuệ Nhân tạo tại cận biên mạng
Qua việc áp dụng một loại mới của bộ xử lý Trí tuệ Nhân tạo và phát triển các mô hình dữ liệu Trí tuệ Nhân tạo mạnh mẽ nhưng gọn nhẹ và hiệu quả hơn, các thiết bị mép mạng có thể được thiết kế để hoạt động một cách thông minh ở những nơi mà kết nối đám mây không khả thi hoặc không mong muốn.
Tất nhiên, xử lý đám mây sẽ vẫn là một thành phần quan trọng của Trí tuệ Nhân tạo sinh sản. Ví dụ, việc huấn luyện các mô hình Trí tuệ Nhân tạo vẫn sẽ diễn ra trong đám mây. Nhưng việc áp dụng đầu vào người dùng cho những mô hình đó, được gọi là “inferencing,” có thể – và trong nhiều trường hợp nên – xảy ra tại mép mạng.
Ngành công nghiệp đang phát triển các mô hình Trí tuệ Nhân tạo gọn nhẹ, nhỏ gọn, hiệu quả hơn có thể được tải lên các thiết bị mép mạng. Các công ty như Hailo sản xuất các bộ xử lý Trí tuệ Nhân tạo được thiết kế đặc biệt để thực hiện xử lý mạng neural. Những bộ xử lý mạng neural này không chỉ xử lý các mô hình Trí tuệ Nhân tạo cực kỳ nhanh chóng, mà còn làm điều đó với lượng điện năng ít hơn, làm cho chúng hiệu quả năng lượng và thích hợp cho nhiều thiết bị mép mạng, từ điện thoại thông minh đến camera.
Việc xử lý Trí tuệ Nhân tạo sinh sản tại mép mạng cũng có thể cân bằng tải công việc ngày càng tăng, cho phép các ứng dụng mở rộng một cách ổn định hơn, giảm áp lực xử lý đắt đỏ cho các trung tâm dữ liệu đám mây và giúp chúng giảm lượng khí thải carbon của mình.
Trí tuệ Nhân tạo sinh sản đang chuẩn bị thay đổi lĩnh vực máy tính một lần nữa. Trong tương lai, LLM trên laptop của bạn có thể tự cập nhật theo cách tương tự như hệ điều hành của bạn hiện nay – và hoạt động một cách tương tự. Nhưng để đạt được điều này, chúng ta sẽ cần kích hoạt xử lý Trí tuệ Nhân tạo sinh sản tại mép mạng. Kết quả hứa hẹn là hiệu suất, hiệu quả năng lượng, quyền riêng tư và an ninh tốt hơn. Tất cả những điều này dẫn đến các ứng dụng Trí tuệ Nhân tạo có thể thay đổi thế giới cũng nhiều như Trí tuệ Nhân tạo sinh sản chính nó.