8 công cụ phát hiện văn bản từ AI bạn có thể thử

Tháng Chín 18, 2023

Mục lục

Với nội dung do được sản sinh ra từ AI ngày càng tăng vì vậy việc phân biệt được những nội dung do con người hay AI viết là điều cần thiết. Dưới đây là một số trình phát hiện văn bản AI chính xác nhất mà bạn có thể thử.

Khi các mô hình ngôn ngữ như GPT tiếp tục được cải tiến, việc phân biệt giữa văn bản do AI tạo ra và văn bản do con người viết ngày càng trở nên khó khăn hơn. Tuy nhiên, trong một số trường hợp, chẳng hạn như trong học thuật, cần phải đảm bảo rằng văn bản không được viết bởi AI.

Đây là lúc trình phát hiện văn bản AI phát huy tác dụng. Mặc dù hiện tại không có công cụ nào phát hiện một cách hoàn toàn chắc chắn (và họ cũng không tuyên bố làm như vậy), một số công cụ này cung cấp kết quả khá chính xác. Vì vậy, ở đây, chúng tôi liệt kê tám trình phát hiện văn bản AI chính xác nhất mà bạn có thể thử.

1. GPTZero

GPTZero ban đầu được xây dựng để giúp giáo viên xác định xem bài tập mà học sinh của họ nộp có được tạo ra bằng AI hay không. Nhưng vì GPTZero phát hiện chính xác nội dung do ChatGPT tạo nên bạn không nhất thiết phải là giáo viên mới có thể hưởng lợi từ công cụ này.

GPTZero phân tích văn bản và cho biết văn bản đó được viết bởi con người hay AI, làm nổi bật các câu cụ thể mà nó tin là do AI tạo ra. Nó cũng cung cấp điểm số về mức độ phức tạp và mức độ bùng nổ, là thước đo cho tính ngẫu nhiên và độ biến thiên của tính ngẫu nhiên. Nhìn chung, những điểm số này cao đối với văn bản do con người viết và thấp đối với AI.

Để kiểm tra công cụ này, trước tiên, chúng tôi dán một đoạn trích từ tác phẩm Ngôi nhà của người lính của nhà văn Ernest Hemingway. GPTZero đã dán nhãn chính xác cho văn bản là “hầu hết có thể là do con người viết”. Tương tự như vậy, nó có thể xác định chính xác văn bản do ChatGPT tạo là “được viết hoàn toàn bởi AI”.

Cuối cùng, chúng tôi đã nhập một đoạn trích từ văn bản do AI viết có xen lẫn nội dung của con người. Điều đáng kinh ngạc là GPTZero đã xác định gần như chính xác tất cả các câu được AI viết. Nhưng nó cũng đánh dấu một số văn bản do con người viết ra.

Nhìn chung, GPTZero phát hiện văn bản AI rất tốt nhưng cũng tạo ra kết quả giả. Nó cũng có tính năng Tải lên tệp hàng loạt cho phép bạn quét nhiều tệp chỉ bằng một cú nhấp chuột. Bên cạnh gói miễn phí, GPTZero còn có hai gói trả phí với các tính năng bổ sung và giới hạn cao hơn.

2. Winston AI

Winston AI tuyên bố có thể phát hiện nội dung do AI tạo ra với độ chính xác 99,6%. Mặc dù chúng tôi không thể xác minh tuyên bố này nhưng Winston AI đã hoạt động tốt trong các thử nghiệm của chúng tôi.

Đầu tiên, nó phát hiện Ngôi nhà của người lính của Hemingway là do con người viết 100%. Tương tự như vậy, nó gắn nhãn văn bản AI là 0% do con người viết. Tốt hơn nữa, nó đánh dấu sự kết hợp giữa AI và văn bản của con người là 35% con người, làm nổi bật gần như chính xác tất cả các câu do AI tạo ra.

Winston AI cũng hiển thị điểm dễ đọc và đạo văn (nếu bạn nâng cấp lên bất kỳ gói trả phí nào). Nó cung cấp bản dùng thử miễn phí chỉ 2000 từ, sau đó bạn sẽ phải chuyển sang tài khoản trả phí.

3. Content at Scale – Trình phát hiện nội dung AI ở quy mô lớn

Content at Scale là một trình tạo văn bản AI tập trung vào việc tạo ra nội dung dạng dài chỉ bằng một vài cú nhấp chuột. Nó cũng có một công cụ phát hiện AI ấn tượng.

Content at Scale AI Detector cung cấp điểm số về xác suất, kiểu mẫu và khả năng dự đoán cùng với điểm tổng thể. Chúng được thể hiện dưới dạng phần trăm. Tỷ lệ phần trăm càng cao thì càng có nhiều khả năng văn bản được viết bởi con người. Công cụ này cũng đánh dấu các câu mà nó tin là do AI viết.

Trong các thử nghiệm của chúng tôi, nó cho điểm 100% đối với nội dung do con người viết, 16% đối với văn bản của ChatGPT và 64% đối với sự kết hợp của cả hai. Nói về các câu cụ thể, nó gần như xác định được tất cả các câu do AI viết. Tuy nhiên, giống như GPTZero, nó đã gắn nhãn sai cho một số câu do con người viết là do AI tạo ra.

Công cụ này cũng miễn phí và mang lại kết quả khá giống với GPTZero.

4. Originality AI

Originality AI là trình phát hiện văn bản AI phổ biến được tuyên bố là có thể phát hiện chính xác văn bản do GPT 3, GPT 3.5 và ChatGPT tạo ra. Nó đưa ra tỷ lệ phần trăm khả năng văn bản được tạo ra bởi con người hoặc AI và làm nổi bật các câu có khả năng do AI tạo ra.

Mô hình Phát hiện AI 2.0 độc đáo (phiên bản nâng cấp của công cụ gốc) đã đánh dấu văn bản do con người viết là 100% có khả năng được viết bởi con người, điều này khá ấn tượng. Tương tự, Originality AI đã phát hiện chính xác câu trả lời của ChatGPT và gắn nhãn đó là 100% AI. Khi được yêu cầu phân tích sự kết hợp giữa văn bản con người và AI, Originality đã đánh dấu nó là 68% AI và 32% là con người.

Không giống như hầu hết các công cụ khác cung cấp gói miễn phí, Originality AI là một công cụ phát hiện phải trả phí. Nó cũng có thể kiểm tra nội dung xem có đạo văn hay không, nhưng sẽ tốn thêm tín dụng.

5. Trình phát hiện Writefull GPT

Writefull nhằm mục đích làm cho việc viết học thuật trở nên dễ dàng hơn. Để đạt được mục đích đó, nó có một số công cụ AI, bao gồm cả trình phát hiện GPT. Công cụ này được sử dụng miễn phí và mã hóa dữ liệu để đảm bảo quyền riêng tư.

Writefull GPT Detector có thể xác định nội dung được viết bởi GPT-3 cũng như ChatGPT. Sau khi phân tích, nó đưa ra điểm số cho biết xác suất nội dung đó được viết bởi AI.

Trong các thử nghiệm của chúng tôi, Writefull đã phát hiện chính xác văn bản do con người viết và cho điểm 1% (tức là 1% khả năng văn bản đó được tạo ra bởi AI). Tuy nhiên, nó lại cho điểm 39% đối với văn bản của ChatGPT. Tương tự như vậy, khi chúng tôi kết hợp nội dung do AI tạo với văn bản của con người, Writefull đã đánh dấu nội dung đó là “2% khả năng nội dung này đến từ GPT-3 hoặc ChatGPT”.

Vì vậy, mặc dù nó nhận dạng văn bản của con người và AI một cách chính xác ở một mức độ nào đó, Writefull đã sai lầm khi chúng tôi kết hợp cả hai. Công cụ này cung cấp khả năng tích hợp với Word và Overleaf, đồng thời có API cho GPT Detector.

6. Phát hiện văn bản Hive Moderation

Hive Moderation không chỉ có công cụ phát hiện văn bản AI mà còn phát hiện các hình ảnh do AI tạo ra.

Công cụ phát hiện văn bản đã phân tích chính xác văn bản do con người viết là “có khả năng chứa 0% văn bản AI”. Tương tự, văn bản do AI tạo ra cũng được xác định như vậy. Nhưng giống như hầu hết những người khác, nó không thể phát hiện chính xác sự kết hợp của cả hai văn bản.

Trên trang web của nó, bạn có thể sử dụng công cụ demo miễn phí mà không cần đăng ký. Nhưng bạn sẽ phải liên hệ với họ để có toàn quyền truy cập. Tương tự, trình phát hiện hình ảnh có thể giúp bạn phát hiện các hình ảnh được tạo bởi các công cụ AI như DALL-E 2 hoặc Midjourney.

7. Crossplag

Crossplag là một công cụ kiểm tra đạo văn phổ biến khác với công cụ phát hiện AI. Nó có giao diện đơn giản cho phép bạn dán văn bản và kiểm tra xem nó có được tạo bởi AI hay không.

Bên cạnh việc cho biết khả năng một đoạn văn bản được tạo ra bởi AI, Crossplag nêu bật những câu cụ thể mà nó tin là do AI tạo ra.

Khi chúng tôi thử nghiệm Crossplag, nó đã xác định chính xác ChatGPT và văn bản do con người viết. Tuy nhiên, khi được yêu cầu quét nội dung hỗn hợp, Crossplag đã gắn nhãn nhầm nội dung đó là 100% của con người.

Mặc dù trình phát hiện đạo văn của nó yêu cầu nâng cấp lên gói trả phí nhưng công cụ phát hiện AI của Crossplag được sử dụng miễn phí.

8. Trình phát hiện nội dung AI Copyleaks

Copyleaks, một trong những công cụ phát hiện đạo văn phổ biến nhất , có một công cụ khác để phát hiện ChatGPT, GPT-3 và các mô hình ngôn ngữ tương tự khác. Điều khiến nó trở nên nổi bật là nó có thể phát hiện nội dung được viết bằng các ngôn ngữ khác, như tiếng Tây Ban Nha và tiếng Pháp.

Công cụ này có thể xác định chính xác truyện ngắn của Ernest là do con người viết với xác suất khoảng 98,8%. Tương tự, nó đã phát hiện văn bản AI với độ chắc chắn 83,9%. Nó đã mắc lỗi ở chỗ sự kết hợp giữa AI và nội dung của con người, vì nó đánh dấu 67,2% có khả năng là văn bản của con người.

Trình phát hiện nội dung AI của Copyleaks có tiện ích mở rộng của Chrome. Điều tuyệt vời nhất là nó cung cấp tích hợp API và LMS.

Phát hiện văn bản do AI tạo chỉ bằng một cú nhấp chuột

Nhờ các công cụ nêu trên, bạn có thể nhận ra văn bản do AI viết khá dễ dàng. Tuy nhiên, những điều này vẫn chưa hoàn toàn chính xác. Chỉ cần thay đổi một vài câu là có thể đánh lừa các máy dò này. Và mối quan tâm nghiêm trọng hơn với những công cụ này là những kết quả giả mà bạn có thể gặp phải.

Ngay cả khi bạn không muốn phụ thuộc hoàn toàn vào các máy dò này, văn bản AI vẫn chứa một số dấu hiệu nhận biết mà bạn có thể phát hiện nếu chú ý một chút.

8 công cụ phát hiện văn bản từ AI bạn có thể thử - MyGPT