Một số người dùng Snapchat đã phát hiện ra cách jailbreak chatbot My AI của nền tảng này bằng cách kích hoạt "DAN Mode". Snapchat đã phát hành bot trò chuyện dựa trên ChatGPT mang tên My AI cho các thuê bao trả phí vào tháng 2 năm 2023. Hai tháng sau đó, Snapchat đã đưa bot này cho tất cả người dùng miễn phí sử dụng. Mặc dù Snap nói họ đã đưa ra các biện pháp để ngăn chặn tránh mọi hoạt động không thích hợp của trí tuệ nhân tạo này, vẫn có những lo ngại xung quanh sự an toàn của bot này, đặc biệt là khi được sử dụng bởi trẻ em và thiếu niên.

DAN Mode, viết tắt của "do anything now", là một trò jailbreak ChatGPT cho phép chất lượng cao hơn của đại diện trí tuệ nhân tạo này hoạt động bên ngoài các hạn chế bình thường bằng cách đóng vai trò như một người mẫu với ít giới hạn hơn. Với DAN Mode được kích hoạt, chatbot được cấp phép chất lượng cao và có thể trả lời các câu hỏi mà AI thông thường từ chối trả lời vì lý do đạo đức. Nó có thể tuyên truyền những thuyết âm mưu hoặc đưa ra những ý kiến không đúng. Trò này đã trở thành một tín hiệu phổ biến đối với người sử dụng ChatGPT của OpenAI và lan rộng sang My AI (mà được cung cấp sức mạnh bởi GPT) sau khi bot được phát hành cho công chúng.

The Snapchat My AI avatar is pictured thinking with a cursing emoji in a thought bubble

Snap đã hiểu về cách tấn công Jailbreak

Việc kích hoạt DAN Mode được thực hiện bằng lời nhắc hoặc chuỗi lời nhắc, số phiên bản của đó đã được lưu hành trên Reddit, Twitter và GitHub trong nhiều tháng. Lời nhắc chỉ ra hướng dẫn cho chatbot để theo dõi khi nó đóng vai trò như một kẻ vi phạm. Thông thường, đây không phải là một trao đổi trực tiếp; nhiều người đã mô tả quá trình này trực tuyến nói họ phải nhắc nhau nhiều lần để chatbot ở trong vai diễn của một người vi phạm.

Kể từ khi DAN Mode bắt đầu trở nên phổ biến đối với người dùng ChatGPT, OpenAI đã phát hành các bản vá để chặn nó. Cùng với đó, tình trạng tương tự đã xảy ra với phiên bản được sử dụng bởi Snapchat. Nhiều lời nhắc trước đó kích hoạt DAN Mode cho ChatGPT và My AI sẽ bị bot từ chối. Tuy nhiên, các "jailbreaker" đã điều chỉnh các lời nhắc DAN để vượt qua các hạn chế mới. Trên các phương tiện truyền thông xã hội, người dùng đã cố gắng và chia sẻ báo cáo pha trộn về sự thành công của họ. Trong kiểm tra của Screen Rant, bot Snapchat cho biết nó không thể trả lời yêu cầu DAN Mode, trích dẫn chương trình đang hoạt động.

Chatbot My AI của Snapchat chưa có mặt trong thời gian dài và chắc chắn sẽ tiếp tục phát triển khi Snap tìm hiểu thêm về cách mà mọi người sử dụng nó. Đã có nhiều cải tiến được cài đặt cho các phản hồi của chatbot để cắt giảm các "yêu cầu không thích hợp" và đưa vào công cụ đánh dấu tuổi để bảo vệ tốt hơn cho người dùng chưa đủ tuổi. Nhưng cho đến nay, người viết lời nhắc thông minh đã luôn nhanh hơn một bước.

Nguồn: Reddit, Snap