Các công cụ phát hiện nội dung do AI tạo ra đang nổi tiếng là kém hiệu quả. Chúng thường xuyên đánh dấu nhầm các bài viết do con người tạo ra là “AI-generated” vì những lý do như ngữ pháp, lựa chọn từ ngữ và phong cách viết. Điều này đang gây ra nhiều rắc rối lớn cho sinh viên, nhà văn và bất kỳ ai phụ thuộc vào ngôn ngữ viết.
Vậy, nếu bạn liên tục bị các công cụ kiểm tra AI gắn cờ bài viết của mình, đây là lý do — và cách bạn có thể khắc phục tình trạng này.
Ngữ Pháp Của Bạn Quá “Hoàn Hảo”
Một trong những cách mà công cụ kiểm tra AI nhận diện nội dung do AI tạo ra là dựa vào mức độ hoàn hảo của ngữ pháp, cũng như việc sử dụng chủ yếu các cấu trúc câu tiêu chuẩn hoặc phổ biến. Về lý thuyết, AI không mắc lỗi ngữ pháp, nhưng ngay cả những người viết giỏi nhất cũng có thể mắc lỗi nhỏ khi viết. Tương tự, nếu bài viết của bạn ít có sự phá cách về phong cách và trở nên quá chuẩn mực về ngữ pháp, điều này cho thấy thiếu đi một phong cách viết cá nhân, từ đó có thể kích hoạt các bộ lọc phát hiện AI.
Để minh họa, dưới đây là một đoạn văn được tạo bởi ChatGPT, dựa trên bài viết gốc này, và được dán vào GPTZero. Kết quả cho thấy khả năng rất cao là đoạn văn này được viết bởi AI, với tỷ lệ 100%.
GPTZero nhận diện đoạn văn do ChatGPT tạo ra là 100% AI
Nếu tôi thêm một vài lỗi ngữ pháp nhỏ bằng cách xóa bớt một số dấu phẩy và thêm một lỗi chính tả, cùng với một vài thay đổi nhỏ về phong cách, điểm số GPTZero giảm đáng kể xuống 81%.
Điểm GPTZero giảm xuống 81% sau khi thêm lỗi ngữ pháp nhỏ vào văn bản AI
Bạn Sử Dụng Những Từ Ngữ Phổ Biến Mà AI Hay Dùng
Khi đọc một đoạn văn, nhiều người trong chúng ta đã phát triển một cảm giác trực giác về việc liệu nó có được viết bởi AI hay không, ví dụ như các đoạn văn dài dòng, mơ hồ hoặc những từ ngữ mà AI thường xuyên sử dụng như “delve” (nghiên cứu sâu), “highlight” (nhấn mạnh), “underscore” (gạch chân), “pose” (đặt ra), “the world of” (thế giới của), “strive” (phấn đấu), và vô số từ/cụm từ khác. Điều này được thể hiện rõ qua sự gia tăng đột biến của từ “delve” được sử dụng trong các bài nghiên cứu học thuật vào năm 2023, trùng khớp với thời điểm ChatGPT ra mắt.
Sử dụng cùng văn bản từ ví dụ trước, nếu tôi thực hiện một vài thay đổi nhỏ đối với các phân đoạn bị gắn cờ AI nhiều nhất, điểm số GPTZero tiếp tục giảm xuống còn 49% – một điểm số được coi là “do con người tạo ra”, mặc dù nó vẫn có thể không vượt qua được sự kiểm tra học thuật nghiêm ngặt. Rõ ràng, các công cụ kiểm tra AI có thể dễ dàng bị đánh lừa chỉ với một vài chỉnh sửa nhỏ, đây là một trong nhiều ví dụ làm nổi bật sự kém hiệu quả của chúng.
GPTZero đánh giá văn bản là do con người viết với điểm 49% sau khi chỉnh sửa từ ngữ
Trong thời gian làm gia sư viết, tôi nhận thấy rằng những sinh viên nói tiếng Anh như ngôn ngữ thứ hai thường phàn nàn nhiều hơn về việc nhận được kết quả dương tính giả (false positive) từ các công cụ kiểm tra AI. Khi tạo các mô hình ngôn ngữ lớn (LLMs), các công ty AI thường thuê ngoài việc chú thích dữ liệu cho các quốc gia nơi tiếng Anh là ngôn ngữ thứ hai phổ biến. Do đó, một số từ chúng ta liên kết với văn bản AI, chẳng hạn như “delve”, có thể là kết quả của việc chú thích dữ liệu được thực hiện bởi những người nói tiếng Anh là ngôn ngữ thứ hai, những người sử dụng các từ này trong vốn từ vựng của họ.
Điều này còn phức tạp hơn bởi nhiều người thành thạo tiếng Anh như ngôn ngữ thứ hai thường hiểu và nắm vững các quy tắc ngữ pháp tốt hơn những người bản xứ, vốn tiếp cận ngôn ngữ một cách trực giác hơn. Do đó, những người nói tiếng Anh là ngôn ngữ thứ hai có thể đối mặt với nguy cơ bị “gắn cờ kép” bởi các công cụ kiểm tra AI vì ngữ pháp chuẩn xác và lựa chọn từ vựng theo khuôn mẫu.
Việc Lạm Dụng Công Cụ Hỗ Trợ Viết AI Có Thể Kích Hoạt Cờ Đỏ
Cả hai vấn đề trên có thể xuất hiện ngay cả khi không sử dụng công cụ AI tạo sinh. Nếu bạn nghiêm túc cố gắng viết bài gốc và sử dụng các công cụ hỗ trợ viết như Grammarly, bài viết của bạn có nhiều khả năng bị gắn cờ là do AI viết. Đây chắc chắn là một khu vực “vùng xám” trong học thuật, vì các công cụ này về cơ bản là trợ lý AI tạo sinh, và sinh viên thường sử dụng chúng để thay thế việc học thay vì như một công cụ bổ trợ hữu ích.
Theo kinh nghiệm gia sư của tôi, tôi thấy rằng những người quá phụ thuộc vào Grammarly để sửa bài viết của mình thường là những người sợ nhất các công cụ kiểm tra AI khi nộp bài. Khi một tỷ lệ đáng kể văn bản của ai đó được viết lại theo đề xuất của trợ lý AI, một phần lớn bài viết của bạn, trên thực tế, là do AI tạo ra. Do đó, khi sử dụng các công cụ như Grammarly, hãy cẩn thận nếu bạn quá phụ thuộc vào chúng và hãy coi các đề xuất của Grammarly là cơ hội học hỏi thay vì chấp nhận một cách mù quáng.
Sao Chép Kết Quả Từ ChatGPT Là Một “Nhận Diện Đúng”
Cuối cùng và rõ ràng nhất, nếu bạn thực sự sử dụng ChatGPT và không làm gì nhiều để sửa đổi đầu ra của nó, các công cụ kiểm tra AI gần như chắc chắn sẽ gắn cờ bạn; đây không phải là một kết quả dương tính giả. Tuy nhiên, ngay cả khi bạn nghiêm túc cố gắng viết một bài hoàn toàn gốc, không có sự hỗ trợ, ngữ pháp hoàn hảo và một số lựa chọn từ vựng và cụm từ nhất định vẫn có thể khiến bạn bị gắn cờ dương tính giả.
Bạn đã từng bị công cụ phát hiện AI gắn cờ nhầm bài viết của mình chưa? Hãy chia sẻ kinh nghiệm và cách bạn đã xử lý vấn đề này trong phần bình luận bên dưới!