ngày 25 tháng 2 năm 2025
Bởi Oleg Grynets, CTO, Data Practice, EPAM Systems, Inc.
Là đơn vị tiền tệ của tương lai, việc thu thập dữ liệu là một quy trình quen thuộc đối với các công ty. Tuy nhiên, các công nghệ và bộ công cụ trong thời kỳ trước đã giới hạn doanh nghiệp chỉ trong phạm vi dữ liệu có cấu trúc đơn giản, chẳng hạn như thông tin giao dịch, cuộc trò chuyện với khách hàng và trung tâm chăm sóc khách hàng. Từ đó, các thương hiệu sử dụng phân tích cảm xúc để đánh giá phản hồi của khách hàng về sản phẩm hoặc dịch vụ.
Các công cụ và khả năng AI mới mang đến cơ hội to lớn cho các công ty vượt ra ngoài dữ liệu có cấu trúc và khai thác các tập dữ liệu phức tạp, không có cấu trúc, mở khóa giá trị lớn hơn cho khách hàng. Chẳng hạn, các mô hình ngôn ngữ lớn (LLM) có thể phân tích tương tác của con người và trích xuất những thông tin quan trọng giúp nâng cao trải nghiệm khách hàng (CX).
Tuy nhiên, trước khi các tổ chức có thể khai thác sức mạnh của AI, họ cần thực hiện nhiều bước để chuẩn bị cho việc tích hợp AI, trong đó một trong những yếu tố quan trọng nhất (và thường bị bỏ qua) là hiện đại hóa hệ sinh thái dữ liệu. Dưới đây là một số phương pháp và chiến lược tốt nhất mà doanh nghiệp có thể áp dụng để đảm bảo hệ sinh thái dữ liệu của họ sẵn sàng cho AI.
Làm Chủ Hệ Sinh Thái Dữ Liệu
Để sẵn sàng cho AI, doanh nghiệp cần thu thập và tổ chức dữ liệu vào một kho lưu trữ tập trung, hay còn gọi là hệ sinh thái dữ liệu. Hệ sinh thái dữ liệu của một công ty là cơ sở hạ tầng lưu trữ và quản lý tất cả dữ liệu, với mục tiêu chính là giúp dữ liệu luôn sẵn sàng cho đúng người vào đúng thời điểm, hỗ trợ ra quyết định dựa trên dữ liệu hoặc cung cấp cái nhìn tổng thể về tài sản dữ liệu của doanh nghiệp. Tuy nhiên, hầu hết các công ty không hiểu rõ hệ sinh thái dữ liệu hiện tại của mình do những ràng buộc từ hệ thống cũ, dữ liệu bị phân mảnh, kiểm soát truy cập kém hoặc kết hợp nhiều lý do khác.
Để đạt được hiểu biết sâu hơn về hệ sinh thái dữ liệu của mình, doanh nghiệp nên hợp tác với một đối tác cung cấp giải pháp AI, chẳng hạn như nền tảng điều phối AI tổng hợp thống nhất. Nền tảng này có thể giúp doanh nghiệp đẩy nhanh quá trình thử nghiệm và đổi mới trên các mô hình ngôn ngữ lớn (LLM), ứng dụng AI gốc, tiện ích bổ sung tùy chỉnh và quan trọng nhất là kho dữ liệu. Ngoài ra, nền tảng này còn có thể hoạt động như một không gian làm việc AI an toàn, có khả năng mở rộng và tùy chỉnh, giúp doanh nghiệp hiểu rõ hơn về hệ sinh thái dữ liệu của mình và cải thiện các giải pháp kinh doanh dựa trên AI.
Việc hiểu rõ hơn về hệ sinh thái dữ liệu không chỉ nâng cao hiệu quả của các giải pháp AI mà còn giúp tổ chức sử dụng công cụ AI một cách có trách nhiệm, ưu tiên bảo mật dữ liệu. Nhờ các quy trình và khả năng do AI hỗ trợ, dữ liệu ngày càng trở nên chi tiết hơn, điều này nhấn mạnh tầm quan trọng của việc tuân thủ các yêu cầu bảo mật kỹ thuật và áp dụng các phương pháp AI có trách nhiệm.
Nâng Cao Quản Trị và Bảo Mật Dữ Liệu
Các khung quản trị dữ liệu của doanh nghiệp cần được cải tiến đáng kể để sẵn sàng cho AI. Trước đây, các khung này chủ yếu tập trung vào tài sản dữ liệu truyền thống. Tuy nhiên, trong bối cảnh hiện nay, ngoài dữ liệu có cấu trúc, doanh nghiệp còn phải xử lý dữ liệu phi cấu trúc như thông tin nhận dạng cá nhân (PII), email, phản hồi của khách hàng, v.v. – những loại dữ liệu mà các khung quản trị dữ liệu hiện tại chưa thể xử lý hiệu quả.
Bên cạnh đó, AI tạo sinh (Gen AI) đang thay đổi mô hình quản trị dữ liệu từ quy tắc cứng nhắc sang thiết lập ranh giới (guardrails). Thay vì dựa vào các quy tắc cố định, doanh nghiệp cần xác định giới hạn rõ ràng, bởi vì một lần thành công hay thất bại riêng lẻ không cung cấp nhiều thông tin có giá trị. Bằng cách thiết lập ranh giới, tính toán tỷ lệ thành công của một tập dữ liệu cụ thể và đo lường xem đầu ra có nằm trong các thông số đã định hay không, doanh nghiệp có thể đánh giá mức độ tuân thủ kỹ thuật của một giải pháp AI và điều chỉnh nếu cần thiết.
Các tổ chức phải áp dụng và triển khai các công cụ, phương pháp và cách tiếp cận mới để quản trị dữ liệu. Các thương hiệu hàng đầu hiện nay đang sử dụng kỹ thuật máy học để tự động hóa quy trình quản trị dữ liệu và đảm bảo chất lượng. Đặc biệt, bằng cách thiết lập trước các chính sách và ngưỡng tiêu chuẩn, doanh nghiệp có thể dễ dàng tự động hóa việc thực thi các tiêu chuẩn dữ liệu. Một số phương pháp quản trị dữ liệu tốt nhất khác bao gồm triển khai nghiêm ngặt các giao thức xử lý và lưu trữ dữ liệu, ẩn danh dữ liệu khi có thể và hạn chế thu thập dữ liệu không cần thiết.
Bối cảnh pháp lý về thu thập dữ liệu bằng AI đang không ngừng thay đổi, và việc không tuân thủ có thể dẫn đến các khoản phạt nghiêm trọng cũng như ảnh hưởng tiêu cực đến danh tiếng doanh nghiệp. Để thích ứng với các quy định mới, doanh nghiệp cần một khung quản trị dữ liệu toàn diện, đảm bảo tuân thủ các luật bảo vệ dữ liệu theo từng khu vực hoạt động, chẳng hạn như Đạo luật AI của EU.
Bên cạnh đó, doanh nghiệp cũng cần nâng cao năng lực hiểu biết về dữ liệu trên toàn tổ chức. Điều này không chỉ giới hạn ở các chuyên gia kỹ thuật như kỹ sư hay nhà khoa học dữ liệu, mà còn phải được triển khai ở mọi cấp bậc. Trước tiên, doanh nghiệp nên thực hiện đánh giá mức độ trưởng thành về dữ liệu, xác định năng lực bảo mật dữ liệu của các nhóm khác nhau. Điều này giúp nhận diện các vấn đề, chẳng hạn như các bộ phận không sử dụng chung một ngôn ngữ kinh doanh. Sau khi xác định được điểm xuất phát, doanh nghiệp có thể xây dựng kế hoạch nâng cao nhận thức về dữ liệu và bảo mật.
Nâng Cao Khả Năng Xử Lý Dữ Liệu
Nếu chưa rõ ràng, dữ liệu phi cấu trúc chính là yếu tố quyết định sự thành công hay thất bại của các thương hiệu. Như đã đề cập, dữ liệu phi cấu trúc bao gồm thông tin nhận dạng cá nhân (PII), email, phản hồi khách hàng và bất kỳ dữ liệu nào không thể được lưu trữ trong các tệp văn bản thông thường, PDF, bảng tính Microsoft Excel, v.v. Bản chất khó kiểm soát của dữ liệu phi cấu trúc khiến việc phân tích hay tìm kiếm trở nên phức tạp. Hầu hết các công cụ và nền tảng công nghệ dữ liệu hiện nay không thể tích hợp và xử lý hiệu quả loại dữ liệu này, đặc biệt là trong bối cảnh các tương tác hàng ngày với khách hàng.
Để vượt qua thách thức của dữ liệu phi cấu trúc, các tổ chức cần thu thập, trích xuất và ánh xạ thông tin này vào một cơ sở tri thức doanh nghiệp nhằm tạo ra bức tranh toàn diện về hệ sinh thái dữ liệu của họ. Trước đây, quá trình quản lý tri thức này đòi hỏi nhiều công sức, nhưng AI đang giúp đơn giản hóa và tiết kiệm chi phí hơn bằng cách thu thập dữ liệu từ nhiều nguồn khác nhau, khắc phục sự không nhất quán, loại bỏ dữ liệu trùng lặp, phân loại dữ liệu quan trọng và không quan trọng, v.v.
Sau khi AI được tích hợp vào hệ sinh thái dữ liệu, nó có thể tự động hóa quy trình xử lý các loại tài sản dữ liệu phức tạp như tài liệu pháp lý, hợp đồng, cuộc trò chuyện tại trung tâm chăm sóc khách hàng, v.v. AI cũng có thể hỗ trợ xây dựng các đồ thị tri thức (knowledge graph) để tổ chức dữ liệu phi cấu trúc, giúp các ứng dụng AI tạo sinh (Gen AI) hoạt động hiệu quả hơn. Hơn nữa, Gen AI còn giúp doanh nghiệp thu thập và phân loại dữ liệu dựa trên những điểm tương đồng, đồng thời phát hiện các mối quan hệ phụ thuộc còn thiếu.
Mặc dù các công cụ phân tích dữ liệu dựa trên AI đang ngày càng giúp doanh nghiệp hiểu và khai thác dữ liệu hỗn loạn, nhưng doanh nghiệp cũng cần hiện đại hóa hệ thống công nghệ của mình để hỗ trợ các tập dữ liệu phức tạp này. Việc nâng cấp hệ thống công nghệ bắt đầu bằng một cuộc đánh giá toàn diện — cụ thể là xác định những hệ thống nào đang hoạt động hiệu quả với các công nghệ hiện đại và những hệ thống nào đã lỗi thời. Đồng thời, doanh nghiệp cũng cần xác định các hệ thống hiện có có thể tích hợp với các công cụ mới để tối ưu hóa khả năng xử lý dữ liệu.
Tìm Kiếm Hỗ Trợ Để Sẵn Sàng Cho AI
Việc chuẩn bị hệ sinh thái dữ liệu để tích hợp AI là một quy trình phức tạp, tốn nhiều thời gian và trải qua nhiều giai đoạn, đòi hỏi trình độ chuyên môn cao. Chỉ một số ít doanh nghiệp có đủ kiến thức và kỹ năng này nội bộ. Nếu một thương hiệu quyết định hợp tác với một đối tác có chuyên môn để chuẩn bị hệ sinh thái dữ liệu cho AI, họ cần ưu tiên một số tiêu chí quan trọng trong quá trình tìm kiếm.
Trước hết, một đối tác lý tưởng phải có chuyên môn kỹ thuật trên nhiều lĩnh vực liên quan (không chỉ riêng AI), bao gồm điện toán đám mây, bảo mật, dữ liệu, trải nghiệm khách hàng (CX), v.v. Một dấu hiệu quan trọng khác của một đối tác xuất sắc là khả năng thích ứng nhanh. Khi công nghệ thay đổi ngày càng nhanh chóng, việc dự đoán tương lai trở nên khó khăn hơn. Do đó, một đối tác lý tưởng không nên cố gắng đoán trước xu hướng, mà thay vào đó, giúp doanh nghiệp linh hoạt hơn để thích nghi với các xu hướng thị trường và nhu cầu của khách hàng.
Bên cạnh đó, như đã đề cập, AI không chỉ dành riêng cho nhóm khoa học dữ liệu mà áp dụng cho tất cả mọi người trong tổ chức. Việc ứng dụng AI đòi hỏi sự tham gia của toàn bộ doanh nghiệp. Mọi nhân viên, dù ở bất kỳ cấp độ nào, đều cần có kiến thức cơ bản về AI. Một đối tác tốt sẽ giúp thu hẹp khoảng cách này, kết hợp giữa chuyên môn kinh doanh và con người để hỗ trợ doanh nghiệp phát triển các năng lực cần thiết ngay trong nội bộ.