Cập nhật
Sau một bản nâng cấp, ChatGPT sẽ cho phép người dùng tải lên hình ảnh, nói chuyện với trò chuyện tự động và nghe nó nói lại.
Theo thông báo của OpenAI vào ngày thứ Hai, những tính năng mới nhất sẽ được triển khai cho các khách hàng trả phí và doanh nghiệp trong hai tuần tới trên cả web, ứng dụng iOS và Android, và sau đó mới áp dụng cho phiên bản miễn phí.
Tất nhiên, với khả năng mới đến những cách sử dụng sai mục đích mới. Vì vậy, OpenAI cũng đã chia sẻ rằng họ đã hạn chế khả năng để nhận xét về những loại hình ảnh cụ thể để tránh việc tạo ra những nhận xét cá nhân không phù hợp, thiên vị hoặc xúc phạm.
"Những mô hình dựa trên thị giác cũng đặt ra những thách thức mới, từ việc mơ hồ về người đến việc phụ thuộc vào sự hiểu sai của mô hình về hình ảnh trong các lĩnh vực quan trọng. Trước khi triển khai rộng rãi, chúng tôi đã thử nghiệm mô hình với nhóm red team để đánh giá rủi ro trong các lĩnh vực như khủng bố và hiểu biết khoa học, cũng như một nhóm người thử nghiệm alpha đa dạng. Nghiên cứu của chúng tôi đã giúp chúng tôi đi đến một số chi tiết quan trọng về việc sử dụng có trách nhiệm," OpenAI nói.
"Chúng tôi cũng đã thực hiện các biện pháp kỹ thuật để giới hạn khả năng của ChatGPT trong việc phân tích và đưa ra các tuyên bố trực tiếp về con người, vì ChatGPT không luôn chính xác và hệ thống này nên tôn trọng sự riêng tư của cá nhân."
Việc xử lý các loại dữ liệu khác ngoài văn bản mở rộng đáng kể khả năng của ChatGPT. Ví dụ, người dùng có thể tải lên hình ảnh về các địa điểm lịch sử để tìm hiểu thêm về chúng, hoặc hình ảnh bên trong tủ lạnh của họ để cho trò chuyện tự động thấy những gì họ có thể làm với những nguyên liệu mà họ có. Họ cũng có thể yêu cầu ChatGPT tập trung vào một phần cụ thể của hình ảnh bằng cách làm nổi bật một phần bằng cách thủ công.
OpenAI đã tích hợp mô hình nhận dạng giọng nói của mình, Whisper, để trang bị ChatGPT khả năng chuyển ghi âm thành văn bản và đã thêm một hệ thống mới để chuyển đổi văn bản thành giọng nói.
Người dùng có thể lựa chọn âm thanh của chatbot từ năm giọng AI được tạo ra.
Spotify đang sử dụng mô hình âm thanh tạo ra mới để dịch các podcast sang các ngôn ngữ khác nhau trong khi vẫn giữ nguyên âm điệu của giọng nói của người nói, theo như được tuyên bố.
Hiện tại, ChatGPT chỉ có thể ghi chép nói tiếng Anh và không hiệu quả với các ngôn ngữ khác, đặc biệt là các ngôn ngữ không sử dụng bảng chữ cái dựa trên chữ cái La Tinh, OpenAI đã giải thích.
Các mô hình ngôn ngữ lớn là một công nghệ mạnh mẽ nhưng chúng vẫn không hoàn hảo và cũng dễ tạo ra thông tin sai lệch. Có lẽ tốt nhất không nên tin tưởng vào trợ lý ảo để đưa ra những quyết định liều lĩnh, như nhận biết nấm để ăn chẳng hạn. Như Sir Terry Pratchett đã nói - "Tất cả nấm đều có thể ăn. Một số loại nấm chỉ có thể ăn một lần".
The Register đã yêu cầu OpenAI làm rõ liệu họ có thu thập giọng nói và hình ảnh của người dùng hay không. Trước đây, công ty đã nói rằng họ sẽ không huấn luyện dữ liệu từ khách hàng doanh nghiệp hoặc từ cuộc trò chuyện của những người tắt lịch sử chat của họ.
Cập nhật mới thêm
OpenAI đã xác nhận rằng họ sẽ sử dụng dữ liệu từ "các dịch vụ tiêu dùng không phải API như ChatGPT hoặc DALL-E" để huấn luyện mô hình của mình, trừ khi người dùng khóa bỏ. Điều này có vẻ cũng đúng với Whisper.
Tải ứng dụng Tech của chúng tôi.