Google đã cập nhật chính sách bảo mật của mình vào cuối tuần, đặc biệt nêu rõ công ty có quyền thu thập gần như mọi thông tin mà bạn đăng trực tuyến để xây dựng công cụ AI của mình. Nếu Google có thể đọc lời bạn viết, hãy giả định rằng chúng thuộc về công ty bây giờ và hãy mong rằng chúng đang đặt ở một nơi nào đó trong lòng của một chatbot.
"Google sử dụng thông tin để cải thiện dịch vụ của chúng tôi và phát triển các sản phẩm, tính năng và công nghệ mới có lợi cho người dùng và công chúng," chính sách mới của Google nói. "Ví dụ, chúng tôi sử dụng thông tin được công khai để giúp đào tạo mô hình AI của Google và xây dựng các sản phẩm và tính năng như Google Dịch, Bard và các khả năng AI của Cloud."
May mắn cho những người yêu làm việc với lịch sử, Google có một "lịch sử các thay đổi" về các điều khoản dịch vụ. Ngôn ngữ mới đính kèm đã điều chỉnh chính sách hiện có, nêu rõ cách mà những suy nghĩ trực tuyến của bạn có thể được sử dụng cho công cụ AI của gigant công nghệ.
Trước đây, Google nói rằng dữ liệu sẽ được sử dụng "cho các mô hình ngôn ngữ," thay vì "các mô hình AI," và trong chính sách cũ chỉ đề cập đến Google Dịch, Bard và Cloud AI.
Điều này là một điều khoản không thường thấy trong một chính sách bảo mật. Thông thường, những chính sách này mô tả các cách mà một doanh nghiệp sử dụng thông tin mà bạn đăng trên các dịch vụ của công ty. Ở đây, có vẻ như Google dự trữ quyền thu thập và sử dụng dữ liệu đăng trên bất kỳ phần nào của web công cộng, như thể toàn bộ internet là sân chơi AI riêng của công ty. Google không đáp ứng ngay lập tức yêu cầu bình luận.
Thực tế này đặt ra những câu hỏi mới và thú vị về quyền riêng tư. Mọi người thông thường hiểu rằng các bài viết công khai là công khai. Nhưng ngày nay, bạn cần có một mô hình tư duy mới về việc viết cái gì đó trực tuyến. Đó không còn là câu hỏi ai có thể nhìn thấy thông tin nữa mà là cách nó có thể được sử dụng. Có khả năng lớn là Bard và ChatGPT đã tiếp thu những bài viết blog bị lãng quên hoặc những đánh giá nhà hàng cách đây 15 năm của bạn. Khi bạn đọc điều này, các chatbot có thể đang tái hiện một phiên bản biến thể của lời bạn bằng cách không thể dự đoán và khó hiểu.
Một trong những vấn đề phức tạp ít được nhìn thấy ở thế giới sau ChatGPT là câu hỏi về việc chatbot đói dữ liệu này lấy thông tin từ đâu. Các công ty bao gồm Google và OpenAI đã thu thập một phần rất lớn của internet để cung cấp dữ liệu cho các ứng dụng robot của họ. Điều này không rõ ràng có pháp luật hay không và trong vài năm tới, tòa án sẽ phải giải quyết các vấn đề về bản quyền mà trước đây dường như chỉ có trong tiểu thuyết khoa học. Trong khi chờ đó, hiện tượng này đã ảnh hưởng đến người tiêu dùng ở những cách không ngờ tới.
Những người có quyền cao cấp tại Twitter và Reddit cảm thấy cả hai công ty bị xúc phạm đặc biệt về vấn đề AI và đã thay đổi gây tranh cãi để khóa chặt nền tảng của mình. Cả hai công ty đã tắt quyền truy cập miễn phí vào API của họ cho phép bất kỳ ai muốn tải về lượng lớn bài viết. Về mặt nguyên tắc, điều đó nhằm bảo vệ các trang mạng xã hội khỏi việc khai thác tài sản sáng tạo của họ, nhưng nó đã gây ra những hậu quả khác.
Twitter và API của Reddit đã làm hư hỏng các công cụ phiên bản thứ ba mà nhiều người đã sử dụng để truy cập vào những trang web đó. Trong một khoảnh khắc, Twitter thậm chí dường như sẽ buộc các cơ quan công cộng như thời tiết, giao thông và khẩn cấp phải trả phí nếu muốn Tweet, một động thái mà công ty đã rút lại sau khi nhận được nhiều ý kiến phản đối.
Gần đây, việc thu thập dữ liệu trên web là mối lo ngại hàng đầu của Elon Musk. Musk đã đổ lỗi cho một số thảm họa trên Twitter gần đây là do nhu cầu của công ty ngăn người khác lấy dữ liệu từ trang web của ông, ngay cả khi các vấn đề này dường như không có liên quan. Cuối tuần, Twitter đã giới hạn số lượng tweet mà người dùng được phép xem trong một ngày, khiến dịch vụ này gần như không thể sử dụng được. Musk cho biết đó là một phản ứng cần thiết đối với "quá trình thu thập dữ liệu" và "thao túng hệ thống." Tuy nhiên, hầu hết các chuyên gia công nghệ thông tin đồng ý rằng việc giới hạn tốc độ này có thể là sự phản ứng khẩn cấp đối với các vấn đề kỹ thuật do sự quản lý kém, vô hiệu hoặc cả hai gây ra. Twitter không trả lời câu hỏi của Gizmodo về vấn đề này.
Trên Reddit, tác động của các thay đổi API đặc biệt ồn ào. Reddit về cơ bản được điều hành bởi các quản trị viên không được trả tiền, những người giữ các diễn đàn khỏe mạnh. Những mod của các nhóm con lớn có xu hướng phụ thuộc vào các công cụ bên thứ ba cho công việc của họ, các công cụ được xây dựng trên các API không thể truy cập được ngay bây giờ. Điều đó đã tạo ra một cuộc biểu tình đông người, trong đó các quản trị viên về cơ bản đã đóng Reddit lại. Mặc dù cuộc tranh cãi vẫn đang diễn ra, có khả năng nó sẽ có hậu quả vĩnh viễn khi các quản trị viên bị tức giận từ bỏ công việc của họ.