Trình phát hiện AI, đôi khi được đề cập là trình phát hiện nội dung AI hoặc văn bản AI, phục vụ mục đích xác định xem văn bản đã được soạn thảo một phần hay toàn bộ bởi các công cụ trí tuệ nhân tạo như ChatGPT.
Những máy dò này rất hữu ích để xác định các trường hợp trong đó một đoạn văn bản có khả năng được tạo ra bởi AI. Ứng dụng có lợi theo những cách sau:
- Xác thực bài làm của sinh viên. Các nhà giáo dục có thể sử dụng nó để xác nhận tính xác thực của các bài tập và dự án viết ban đầu của học sinh.
- Chống lại đánh giá sản phẩm giả mạo. Người điều hành có thể sử dụng nó để xác định và giải quyết các đánh giá sản phẩm giả mạo nhằm thao túng nhận thức của người tiêu dùng.
- Xử lý nội dung spam. Nó hỗ trợ phát hiện và loại bỏ các dạng nội dung spam khác nhau có thể làm sai lệch chất lượng và độ tin cậy của nền tảng trực tuyến.
Những công cụ này vẫn còn mới và đang được thử nghiệm, vì vậy hiện tại chúng tôi không hoàn toàn chắc chắn về độ tin cậy của chúng. Trong các phần tiếp theo, chúng ta sẽ đi sâu vào chức năng của chúng, kiểm tra mức độ đáng tin cậy của chúng và khám phá một loạt các ứng dụng thực tế mà chúng cung cấp.
Các tổ chức giáo dục, bao gồm cả các trường đại học, đang trong quá trình xây dựng quan điểm của họ về việc sử dụng ChatGPT và các công cụ tương tự một cách thích hợp. Điều cần thiết là ưu tiên các hướng dẫn của tổ chức của bạn hơn bất kỳ lời khuyên nào bạn tìm thấy trực tuyến. |
Máy dò AI hoạt động như thế nào?
Trình phát hiện AI thường sử dụng các mô hình ngôn ngữ giống như mô hình trong các công cụ viết AI mà chúng đang cố gắng tìm kiếm. Về cơ bản, mô hình ngôn ngữ xem xét đầu vào và hỏi, "Cái này có giống thứ gì đó mà tôi có thể đã làm không?" Nếu nó nói có, mô hình đoán rằng văn bản có thể được tạo bởi AI.
Cụ thể, các mô hình này tìm kiếm hai đặc điểm trong một văn bản: “sự phức tạp” và “sự bùng nổ”. Khi hai khía cạnh này thấp hơn, thì khả năng cao là văn bản được tạo bởi AI.
Tuy nhiên, chính xác thì những thuật ngữ không phổ biến này có ý nghĩa gì?
Sự bối rối
Sự phức tạp là một thước đo quan trọng được sử dụng để đánh giá mức độ thành thạo của các mô hình ngôn ngữ. Nó đề cập đến mức độ tốt mà mô hình có thể dự đoán từ tiếp theo trong một chuỗi từ.
Các mô hình ngôn ngữ AI hướng tới việc tạo ra các văn bản có độ phức tạp thấp, dẫn đến tăng tính mạch lạc, trôi chảy và có thể dự đoán được. Ngược lại, chữ viết của con người thường thể hiện độ phức tạp cao hơn do sử dụng nhiều tùy chọn ngôn ngữ giàu trí tưởng tượng hơn, mặc dù đi kèm với tần suất lỗi đánh máy cao hơn.
Các mô hình ngôn ngữ hoạt động bằng cách dự đoán từ nào sẽ tự nhiên xuất hiện tiếp theo trong câu và chèn từ đó vào. Bạn có thể xem một ví dụ dưới đây.
Ví dụ tiếp tục | Sự bối rối |
Tôi không thể hoàn thành dự án cuối cùng đêm. | Thấp: Có lẽ là sự tiếp tục có khả năng nhất |
Tôi không thể hoàn thành dự án cuối cùng thời gian tôi không uống cà phê vào buổi tối. | Thấp đến trung bình: Ít có khả năng hơn, nhưng nó có ý nghĩa ngữ pháp và logic |
Tôi không thể hoàn thành dự án học kỳ trước nhiều lần vì lúc đó tôi không có động lực như thế nào. | Trung bình: Câu văn mạch lạc nhưng cấu trúc khá bất thường và dài dòng |
Tôi không thể hoàn thành dự án cuối cùng Hân hạnh được gặp bạn. | Cao: Sai ngữ pháp và phi logic |
Độ phức tạp thấp được coi là bằng chứng cho thấy văn bản do AI tạo ra.
sự bùng nổ
"Burstiness" là một cách để xem các câu khác nhau như thế nào về cách chúng được đặt cùng nhau và độ dài của chúng. Nó hơi giống sự bối rối nhưng đối với cả câu thay vì chỉ từ.
Khi một văn bản chủ yếu có các câu tương tự nhau về cách chúng được tạo ra và độ dài của chúng, thì nó có mức độ bùng nổ thấp. Điều này có nghĩa là nó đọc trơn tru hơn. Nhưng nếu một văn bản có các câu rất khác nhau về cách chúng được xây dựng và độ dài của chúng, thì nó có tính bùng nổ cao. Điều này làm cho văn bản cảm thấy ít ổn định hơn và đa dạng hơn.
Văn bản do AI tạo có xu hướng ít biến đổi hơn trong các mẫu câu so với văn bản do con người viết. Khi các mô hình ngôn ngữ đoán từ có thể tiếp theo, chúng thường đặt câu dài khoảng 10 đến 20 từ và tuân theo các mẫu thông thường. Đây là lý do tại sao việc viết AI đôi khi có vẻ đơn điệu.
độ bùng nổ thấp cho biết rằng một văn bản có thể do AI tạo ra.
Một lựa chọn khác để xem xét: Hình mờ
OpenAI, người tạo ra ChatGPT, được cho là đang phát triển một phương pháp gọi là “watermarking”. Hệ thống này liên quan đến việc thêm một dấu chưa nhìn thấy vào văn bản do công cụ tạo ra, dấu này sau này có thể được một hệ thống khác xác định để xác nhận nguồn gốc AI của văn bản.
Tuy nhiên, hệ thống này vẫn đang được phát triển và các chi tiết chính xác về cách thức hoạt động của nó vẫn chưa được tiết lộ. Hơn nữa, không rõ liệu có bất kỳ hình mờ được đề xuất nào sẽ còn nguyên vẹn khi thực hiện các chỉnh sửa đối với văn bản đã tạo hay không.
Mặc dù ý tưởng sử dụng khái niệm này để phát hiện AI trong tương lai có vẻ đầy hy vọng, nhưng điều quan trọng cần lưu ý là các chi tiết và xác nhận cuối cùng về việc đưa nó vào thực tế vẫn đang chờ xử lý. |
Độ tin cậy của máy dò AI là gì?
- Trình phát hiện AI thường hoạt động hiệu quả, đặc biệt là với các văn bản dài hơn, nhưng chúng có thể gặp sự cố nếu văn bản do AI tạo ra có chủ đích ít được mong đợi hơn hoặc bị thay đổi sau khi được tạo.
- Các máy dò AI có thể nhầm tưởng rằng văn bản do con người viết thực sự là do AI tạo ra, đặc biệt nếu nó đáp ứng các điều kiện có độ phức tạp và độ bùng nổ thấp.
- Nghiên cứu về máy dò AI chỉ ra rằng không có công cụ nào có thể cung cấp độ chính xác hoàn toàn; độ chính xác cao nhất là 84% trong công cụ cao cấp hoặc 68% trong công cụ miễn phí tốt nhất.
- Những công cụ này cung cấp thông tin chi tiết có giá trị về khả năng một văn bản do AI tạo ra, nhưng chúng tôi khuyên bạn không nên chỉ dựa vào chúng làm bằng chứng. Với sự tiến bộ không ngừng của các mô hình ngôn ngữ, các công cụ phát hiện chúng sẽ cần phải làm việc chăm chỉ hơn để theo kịp.
- Các nhà cung cấp tự tin hơn thường thừa nhận rằng các công cụ của họ không thể dùng làm bằng chứng thuyết phục về văn bản do AI tạo ra.
- Hiện tại, các trường đại học không có niềm tin mạnh mẽ vào những công cụ này.
Việc cố gắng ẩn chữ viết do AI tạo ra thực sự có thể khiến văn bản có vẻ rất lạ hoặc không phù hợp với mục đích sử dụng của nó. Chẳng hạn, việc cố ý đưa ra các lỗi chính tả hoặc sử dụng các lựa chọn từ phi logic trong văn bản có thể làm giảm khả năng nó bị máy dò AI nhận dạng. Tuy nhiên, một văn bản chứa đầy những lỗi này và những lựa chọn kỳ lạ có lẽ sẽ không được coi là bài viết học thuật hay. |
Máy dò AI được sử dụng cho mục đích gì?
Máy dò AI dành cho những cá nhân muốn xác minh xem một văn bản có thể được tạo ra bởi trí tuệ nhân tạo hay không. Những người có thể sử dụng nó là:
- Nhà giáo dục và giáo viên. Đảm bảo tính xác thực của bài làm của học sinh và ngăn ngừa đạo văn.
- Học sinh kiểm tra bài làm của mình. Kiểm tra để đảm bảo rằng nội dung của chúng là duy nhất và không vô tình trông giống văn bản do AI tạo ra.
- Nhà xuất bản và biên tập viên xem xét bài gửi. Muốn đảm bảo rằng họ chỉ xuất bản nội dung do con người viết.
- Các nhà nghiên cứu. muốn phát hiện bất kỳ tài liệu hoặc bài báo nghiên cứu tiềm năng nào do AI tạo ra.
- Các blogger và nhà văn: Muốn xuất bản nội dung do AI tạo ra nhưng lo lắng rằng nó có thể xếp hạng thấp hơn trong các công cụ tìm kiếm nếu được công nhận là viết bằng AI.
- Chuyên gia kiểm duyệt nội dung. Xác định thư rác do AI tạo, đánh giá giả mạo hoặc nội dung không phù hợp.
- Doanh nghiệp đảm bảo nội dung tiếp thị gốc. Xác minh rằng tài liệu quảng cáo không bị nhầm lẫn với văn bản do AI tạo ra, duy trì uy tín thương hiệu.
Do lo lắng về độ tin cậy của chúng, nhiều người dùng do dự khi phụ thuộc hoàn toàn vào máy dò AI vào lúc này. Tuy nhiên, những công cụ phát hiện này đã trở nên phổ biến hơn như một dấu hiệu cho thấy một văn bản có thể do AI tạo ra, đặc biệt là khi người dùng đã nghi ngờ. |
Phát hiện thủ công văn bản do AI tạo
Bên cạnh việc sử dụng công cụ phát hiện AI, bạn cũng có thể tự học cách xác định các đặc điểm độc đáo của bài viết AI. Không phải lúc nào cũng dễ dàng thực hiện điều này một cách đáng tin cậy—chữ viết của con người đôi khi nghe giống như máy móc và chữ viết của AI đang trở nên thuyết phục hơn với con người—nhưng với thực tế, bạn có thể phát triển ý thức tốt về nó.
Các quy tắc cụ thể mà máy dò AI tuân theo, chẳng hạn như độ phức tạp thấp và độ bùng nổ, có vẻ phức tạp. Tuy nhiên, bạn có thể cố gắng tự mình tìm ra những đặc điểm này bằng cách xem văn bản để tìm một số dấu hiệu nhất định:
- Điều đó đọc đơn điệu, với ít thay đổi trong cấu trúc câu hoặc độ dài
- Sử dụng các từ được mong đợi và không độc đáo lắm và có rất ít yếu tố bất ngờ
Bạn cũng có thể sử dụng các phương pháp mà máy dò AI không có, bằng cách chú ý:
Phương pháp | Giải thích |
lịch sự thái quá | Chatbots như ChatGPT được tạo ra để trở thành trợ lý hữu ích, vì vậy chúng thường sử dụng ngôn ngữ lịch sự và trang trọng, nghe có vẻ không bình thường cho lắm. |
Không nhất quán trong giọng nói | Nếu bạn đã quen với cách một người nào đó thường viết (chẳng hạn như học sinh), bạn thường có thể nhận thấy khi nào đó họ viết khác hẳn với phong cách thông thường của họ. |
ngôn ngữ phòng hộ | Hãy chú ý xem liệu không có nhiều ý tưởng mạnh mẽ và mới mẻ, đồng thời cũng để ý xem có thói quen sử dụng các cụm từ thể hiện sự không chắc chắn quá nhiều không: “Điều quan trọng cần lưu ý là…” “X được nhiều người coi là…” “X được coi là … ” “Một số người có thể tranh luận rằng…”. |
Khiếu nại không có nguồn gốc hoặc được trích dẫn không chính xác | Khi nói đến bài viết học thuật, điều quan trọng là phải đề cập đến nơi bạn lấy thông tin của mình. Tuy nhiên, các công cụ viết AI thường không tuân theo quy tắc này hoặc mắc lỗi (như trích dẫn các nguồn không tồn tại hoặc không liên quan). |
Lỗi lôgic | Mặc dù văn bản AI ngày càng trở nên tự nhiên hơn nhưng đôi khi các ý tưởng trong đó không ăn khớp với nhau. Hãy chú ý đến những chỗ mà văn bản nói những điều không khớp, nghe có vẻ khó tin hoặc trình bày những ý tưởng không kết nối suôn sẻ. |
Nhìn chung, thử nghiệm với nhiều công cụ viết AI khác nhau, xem các loại văn bản mà chúng có thể tạo ra và làm quen với cách chúng viết có thể giúp bạn phát hiện văn bản có thể do AI tạo ra tốt hơn. |
Máy dò hình ảnh và video AI
Trình tạo hình ảnh và video AI, đặc biệt là những trình tạo phổ biến như DALL-E và Synthesia, có thể tạo ra hình ảnh chân thực và có thể thay đổi. Điều này khiến việc xác định các hình ảnh và video “giả sâu” hoặc do AI tạo ra là rất quan trọng để ngăn chặn sự lan truyền thông tin sai lệch.
Hiện nay, nhiều biển báo có thể tiết lộ hình ảnh, video do AI tạo ra, chẳng hạn như:
- Bàn tay có quá nhiều ngón tay
- Chuyển động kỳ lạ
- Văn bản vô nghĩa trong hình ảnh
- Đặc điểm khuôn mặt không thực tế
Tuy nhiên, việc phát hiện những dấu hiệu này có thể khó hơn khi AI ngày càng tốt hơn.
Có các công cụ được thiết kế để phát hiện những hình ảnh do AI tạo ra này, bao gồm:
- Phần mềm sâu
- FakeCatcher của Intel
- sự chiếu sáng
Hiện vẫn chưa rõ mức độ hiệu quả và độ tin cậy của những công cụ này nên cần thử nghiệm thêm.
Sự phát triển không ngừng của việc tạo và phát hiện hình ảnh và video AI tạo ra nhu cầu liên tục phát triển các phương pháp phát hiện chính xác và chắc chắn hơn để giải quyết các rủi ro tiềm ẩn liên quan đến deepfakes và hình ảnh do AI tạo ra.
Kết luận
Trình phát hiện AI giúp xác định văn bản được tạo bởi các công cụ như ChatGPT. Họ chủ yếu tìm kiếm sự “bối rối” và “bùng nổ” để phát hiện nội dung do AI tạo ra. Độ chính xác của chúng vẫn là một mối lo ngại, ngay cả những cái tốt nhất cũng có lỗi. Khi công nghệ AI tiến bộ, việc phân biệt con người với nội dung do AI sản xuất, bao gồm hình ảnh và video, trở nên khó khăn hơn, điều này nhấn mạnh sự cần thiết phải cẩn thận khi trực tuyến. |
Các câu hỏi thường gặp
1. Đâu là sự khác biệt giữa máy dò AI và Kiểm tra đạo văn? A: Cả công cụ phát hiện AI và công cụ kiểm tra đạo văn đều được sử dụng trong các trường đại học để ngăn chặn sự gian dối trong học thuật, tuy nhiên chúng khác nhau về phương pháp và mục tiêu: • Trình phát hiện AI nhằm mục đích xác định văn bản giống như đầu ra từ các công cụ viết AI. Điều này liên quan đến việc phân tích các đặc điểm của văn bản như sự phức tạp và sự bùng nổ, thay vì so sánh chúng với cơ sở dữ liệu. • Trình kiểm tra đạo văn nhằm mục đích phát hiện văn bản sao chép từ các nguồn khác. Họ đạt được điều này bằng cách so sánh văn bản với một cơ sở dữ liệu rộng lớn về nội dung đã xuất bản trước đó và luận điểm của sinh viên, xác định những điểm tương đồng—mà không cần dựa vào việc phân tích các đặc điểm cụ thể của văn bản. 2. Tôi có thể sử dụng ChatGPT như thế nào? A: Để sử dụng ChatGPT, chỉ cần tạo một tài khoản miễn phí: • Theo liên kết này đến trang web ChatGPT. • Chọn “Đăng ký” và cung cấp thông tin được yêu cầu (hoặc sử dụng tài khoản Google của bạn). Đăng ký và sử dụng công cụ là miễn phí. • Nhập lời nhắc vào hộp trò chuyện để bắt đầu! Phiên bản iOS của ứng dụng ChatGPT hiện có thể truy cập được và có kế hoạch cho một ứng dụng Android đang được triển khai. Ứng dụng hoạt động tương tự như trang web và bạn có thể sử dụng cùng một tài khoản để đăng nhập trên cả hai nền tảng. 3. ChatGPT sẽ miễn phí đến bao giờ? A: Tính khả dụng miễn phí của ChatGPT trong tương lai vẫn chưa chắc chắn, không có mốc thời gian cụ thể nào được công bố. Ban đầu, công cụ này được giới thiệu vào tháng 2022 năm XNUMX dưới dạng "bản xem trước nghiên cứu" để nhiều người dùng thử nghiệm miễn phí. Thuật ngữ "xem trước" đề xuất các khoản phí tiềm ẩn trong tương lai, nhưng không có xác nhận chính thức nào về việc chấm dứt quyền truy cập miễn phí. Tùy chọn nâng cao, ChatGPT Plus, có giá 20 USD/tháng và bao gồm các tính năng nâng cao như GPT-4. Không rõ liệu phiên bản cao cấp này sẽ thay thế phiên bản miễn phí hay phiên bản sau sẽ tiếp tục. Các yếu tố như chi phí máy chủ có thể ảnh hưởng đến quyết định này. Khóa học tương lai vẫn chưa chắc chắn. 4. Tôi có thể đưa ChatGPT vào các trích dẫn của mình không? A: Trong một số ngữ cảnh nhất định, bạn nên tham khảo ChatGPT trong công việc của mình, đặc biệt khi nó đóng vai trò là nguồn quan trọng để nghiên cứu các mô hình ngôn ngữ AI. Một số trường đại học có thể yêu cầu trích dẫn hoặc xác nhận nếu ChatGPT hỗ trợ quá trình nghiên cứu hoặc viết của bạn, chẳng hạn như trong việc phát triển các câu hỏi nghiên cứu; bạn nên tham khảo hướng dẫn của tổ chức của mình. Tuy nhiên, do ChatGPT có độ tin cậy khác nhau và nguồn không đáng tin cậy, tốt nhất bạn không nên trích dẫn nó để biết thông tin thực tế. Trong Kiểu APA, bạn có thể coi phản hồi ChatGPT là thông tin liên lạc cá nhân vì người khác không thể truy cập câu trả lời của nó. Trong văn bản, trích dẫn nó như sau: (ChatGPT, giao tiếp cá nhân, ngày 11 tháng 2023 năm XNUMX). |