Việc kiểm duyệt nội dung dường như là một trận chiến vô tận giữa các công ty công nghệ và những cá nhân ác ý. Các công ty công nghệ đưa ra các quy định để điều hành nội dung; các cá nhân ác ý tìm cách né tránh chúng bằng cách đăng bài với biểu tượng cảm xúc hoặc mất chính tả cố ý để tránh bị phát hiện. Sau đó, các công ty cố gắng để bít các lỗ hổng, những kẻ thực hiện lại tìm cách mới và vòng lặp đó lại tiếp tục.

Bây giờ, hãy đến với các mô hình ngôn ngữ lớn…

Như vậy đó là khó đủ rồi. Tuy nhiên, sớm sẽ trở nên khó hơn nhiều nhờ sự xuất hiện của trí tuệ nhân tạo tổng hợp và các mô hình ngôn ngữ lớn như ChatGPT. Công nghệ hiện tại vẫn còn một số vấn đề—ví dụ như xu hướng tự tin đưa ra những điều không đúng và trình bày chúng như sự thật—nhưng có một điều rõ ràng: trí tuệ nhân tạo đang ngày càng tốt hơn trong việc sử dụng ngôn ngữ… rất nhiều.

Với việc đó, điều đó có nghĩa gì đối với việc kiểm duyệt nội dung?

Cả DiResta và Farid đều nói còn quá sớm để nói điều gì sẽ diễn ra, nhưng cả hai đều có vẻ thận trọng. Mặc dù nhiều hệ thống lớn như GPT-4 và Bard có bộ lọc kiểm duyệt nội dung tích hợp sẵn nhưng chúng vẫn có thể bị dụ để tạo ra những sản phẩm không mong muốn, ví dụ như lời phát biểu kích động hoặc hướng dẫn làm một chiếc bom.

Trí tuệ nhân tạo tổng hợp có thể cho phép các cá nhân ác ý thực hiện các chiến dịch lan truyền tin giả thuyết phục với phạm vi và tốc độ lớn hơn rất nhiều. Điều đó rất đáng sợ, đặc biệt là khi phương pháp xác định và nhãn dán nội dung được tạo bởi trí tuệ nhân tạo vẫn còn rất thiếu sót.

Nhưng ngược lại, các mô hình ngôn ngữ lớn nhất hiện nay cũng tốt hơn rất nhiều trong việc giải thích văn bản so với các hệ thống trí tuệ nhân tạo trước đây. Về lý thuyết, chúng có thể được sử dụng để nâng cao việc kiểm duyệt nội dung tự động.

Để làm cho việc đó có thể thực hiện, các công ty công nghệ cần đầu tư vào việc thay đổi các mô hình ngôn ngữ lớn đối với mục đích cụ thể ấy. Tuy nhiên, trong khi một số công ty, như Microsoft, đã bắt đầu nghiên cứu về điều này, thì chưa có hoạt động đáng chú ý nào.

"