Chỉ vừa giới thiệu ChatGPT đã bị hacker "đột kích" và cố gắng vượt qua các cơ chế bảo vệ để bóp méo và nói ra những điều không hợp lí hoặc obscenity. Nhưng bây giờ, nhà sản xuất của nó, OpenAI, và các nhà cung cấp trí tuệ nhân tạo lớn khác như Google và Microsoft, đang phối hợp với chính quyền Biden để để hàng nghìn hacker thử sức trong việc kiểm tra giới hạn công nghệ của các họ. Một số điều mà họ sẽ tìm kiếm: Làm thế nào để một trợ lý ảo có thể bị điều khiển để gây hại? Liệu chúng có chia sẻ thông tin riêng tư mà chúng ta tin tưởng cho người dùng khác? Và tại sao chúng lại cho rằng một bác sĩ là một người đàn ông và một y tá là một phụ nữ?
"Đây là lý do tại sao chúng tôi cần hàng nghìn người," nói Rumman Chowdhury, người điều phối chính của sự kiện hack hàng loạt được dự định cho hội nghị hacker DEF CON diễn ra tại Las Vegas vào mùa hè năm nay, dự kiến sẽ thu hút hàng nghìn người tham gia. "Chúng tôi cần nhiều người với nhiều kinh nghiệm thực tiễn, chuyên môn chủ đề và nền tảng khác nhau để hack các mô hình này và tìm kiếm vấn đề có thể được khắc phục sau đó."
Bất kỳ ai đã thử ChatGPT, trợ lý ảo Bing của Microsoft hoặc Bard của Google đều sớm nhận ra rằng chúng có xu hướng tạo ra thông tin giả và tự tin trình bày nó như một sự thật. Những hệ thống này, xây dựng trên những gì được biết đến là mô hình ngôn ngữ lớn, cũng mô phỏng những định kiến văn hóa mà chúng học được từ việc được đào tạo trên những kho dữ liệu lớn từ những gì mà con người đã viết trực tuyến.
Ý tưởng hack hàng loạt đã thu hút sự chú ý của các quan chức chính phủ Mỹ vào tháng 3 tại lễ hội South by Southwest tại Austin, Texas, nơi Sven Cattell, người sáng lập của AI Village của DEF CON và Austin Carson, Chủ tịch của SeedAI, một tổ chức phi lợi nhuận về trí tuệ nhân tạo có trách nhiệm hướng dẫn các sinh viên cao đẳng tấn công vào một mô hình trí tuệ nhân tạo. Carson cho biết những cuộc trò chuyện đó cuối cùng đã nảy sinh thành một đề xuất để kiểm tra các mô hình ngôn ngữ trí tuệ nhân tạo theo hướng dẫn của Chính phủ Biden cho một Điều lệ Quyền lợi về Trí tuệ nhân tạo - một bộ nguyên tắc để giới hạn các ảnh hưởng của định kiến thuật toán, giao cho người dùng quyền kiểm soát dữ liệu của họ và đảm bảo rằng các hệ thống tự động được sử dụng an toàn và minh bạch.