Microsoft và OpenAI đã bị kiện vào thứ Tư bởi mười sáu cá nhân giả danh, nguyên nhân là các sản phẩm trí tuệ nhân tạo của hai công ty này dựa trên ChatGPT đã thu thập và tiết lộ thông tin cá nhân của họ mà không có thông báo hoặc sự đồng ý đầy đủ.
Tại liên quan này [PDF], đã được đệ trình tại tòa án liên bang tại San Francisco, California, cáo trạng cho biết hai công ty đã không tuân thủ các phương pháp pháp lý để thu thập dữ liệu cho mô hình trí tuệ nhân tạo của mình, mà lại chọn cách thu thập nó mà không trả phí.
"Dù đã có những quy định cho việc mua và sử dụng thông tin cá nhân, các bị đơn đã có một hướng tiếp cận khác: trộm cắp," cáo trạng nói. "Họ đã theo cách thức tự động thu thập 300 tỷ từ ngữ từ internet, 'sách, bài viết, trang web và bài đăng - bao gồm thông tin cá nhân thu thập được mà không có sự đồng ý.' OpenAI đã thực hiện điều đó một cách bí mật, và không đăng ký làm nhà môi giới dữ liệu như nó phải làm theo pháp luật hiện hành."
Thông qua các sản phẩm trí tuệ nhân tạo của mình, hai công ty được cho là "thu thập, lưu trữ, theo dõi, chia sẻ và tiết lộ" thông tin cá nhân của hàng triệu người, bao gồm chi tiết sản phẩm, thông tin tài khoản, tên, thông tin liên hệ, thông tin đăng nhập, email, thông tin thanh toán, hồ sơ giao dịch, dữ liệu trình duyệt, thông tin mạng xã hội, nhật ký trò chuyện, dữ liệu sử dụng, phân tích, cookie, tìm kiếm và hoạt động trực tuyến khác.
Cáo trạng khẳng định rằng Microsoft và OpenAI đã tích hợp thông tin cá nhân của hàng triệu người vào các sản phẩm trí tuệ nhân tạo của họ, phản ánh sở thích, niềm tin tôn giáo, quan điểm chính trị, lịch sử bầu cử, thành viên trong các nhóm xã hội và nhóm hỗ trợ, giới tính và định danh giới, lịch sử làm việc, ảnh gia đình, bạn bè và dữ liệu khác xuất phát từ giao tiếp trực tuyến.
OpenAI đã phát triển một dòng sản phẩm mô hình ngôn ngữ lớn sinh văn bản, bao gồm GPT-2, GPT-4 và ChatGPT; Microsoft không chỉ ủng hộ công nghệ này mà còn "đóng gói" nó vào các phần của đế chế của mình, từ Windows đến Azure.
"Theo thông tin cá nhân xác định được, các bị đơn đã không đủ chặt chẽ để loại bỏ nó khỏi các mô hình đào tạo, đặt hàng triệu người có nguy cơ thông tin đó được tiết lộ một cách tức thì hoặc không, cho những người lạ trên khắp thế giới," cáo trạng nói, trích dẫn báo cáo đặc biệt của The Register ngày 18 tháng 3 năm 2021.
Đơn kêu oan dày 157 trang này chủ yếu trích dẫn từ các nguồn truyền thông và học thuật bày tỏ lo ngại về mô hình AI và đạo đức, nhưng ít nêu ra các trường hợp rõ ràng gây hại cụ thể.
Đối với 16 đơn kiện, đơn kêu oan cho biết họ đã sử dụng ChatGPT, cùng các dịch vụ internet khác như Reddit, và mong đợi rằng các tương tác kỹ thuật số của họ sẽ không được sử dụng trong một mô hình AI.
Việc xem xét xem liệu dữ liệu và siêu dữ liệu do các đơn kiện tạo ra đã bị lợi dụng và liệu ChatGPT hay các mô hình khác có tái tạo các dữ liệu đó hay không đang chờ đồng chính thức.
Trước đây, OpenAI đã xử lý việc tái tạo thông tin cá nhân bằng cách lọc nó.
Vụ kiện này đang xin cấp phép tổ chức tập thể và đòi bồi thường 3 tỷ đô la, nhưng con số này có thể đã chỉ được điền tạm. Bất kỳ thiệt hại cụ thể nào sẽ được xác định nếu các đơn kiện thành công, dựa trên kết quả tìm thấy của tòa án.
Đơn kêu oan cáo buộc Microsoft và OpenAI đã vi phạm Đạo luật Bảo hiểm Thông tin Điện tử của Mỹ bằng cách thu thập và sử dụng thông tin cá nhân, cũng như vi phạm quyền ngăn chặn giao tiếp giữa người dùng và dịch vụ bên thứ ba thông qua việc tích hợp với ChatGPT và các sản phẩm tương tự.
Vụ kiện còn cáo buộc các bị đơn đã vi phạm Đạo luật Lừa dối và Đổi mới Cạnh tranh của California, Đạo luật Bảo vệ Thông tin Sinh học và Luật Lừa dối Người tiêu dùng và Thực hành kinh doanh không công bằng của Illinois, cùng với Đạo luật kinh doanh New York và các thiệt hại tổng quát (tự tội) như sơ suất và làm giàu không công.
Microsoft và OpenAI từ chối bình luận.
Microsoft, công ty con GitHub và OpenAI đã bị kiện ngược đầu tháng 11 vừa qua vì bị cáo buộc tái tạo mã từ hàng triệu nhà phát triển phần mềm mà không tuân thủ các yêu cầu cấp phép thông qua dịch vụ Copilot, dựa trên một mô hình OpenAI mà GitHub cung cấp. Vụ việc này vẫn đang tiếp tục.