Andy Slawetsky - Các tiến bộ gần đây của OpenAI trong ChatGPT đã mang đến một thời kỳ mới cho tương tác trí tuệ nhân tạo. Bằng cách tích hợp khả năng giọng nói, xử lý hình ảnh và bây giờ, khả năng lấy dữ liệu hiện tại từ internet, ChatGPT đã chuyển từ một giao diện chủ yếu dựa trên văn bản thành một công cụ đa chiều, linh hoạt. Hãy cùng xem những tính năng mới nhất này và thảo luận về tác động tiềm năng của chúng đối với trải nghiệm người dùng ChatGPT.

Định nghĩa lại tương tác và truy cập thông tin

  1. Khả năng giọng nói: Người dùng hiện có thể đắm chìm vào cuộc đối thoại âm thanh với ChatGPT. Tính năng thân thiện với người dùng này tối ưu hóa tương tác, đặc biệt trong những lúc gõ chữ không thuận tiện, và mang đến một trải nghiệm tương tác giống con người hơn.

Ví dụ: Trong quá trình làm bánh, nếu bạn quên một bước trong công thức, bạn có thể truy vấn ChatGPT bằng giọng nói và nhận được câu trả lời nói ngay lập tức.

  1. Hiểu hình ảnh: Bằng cách tận dụng khả năng của mô hình GPT đa phương thức, ChatGPT có thể "nhìn thấy" và phân tích một loạt các hình ảnh từ hình ảnh thông thường đến biểu đồ phức tạp. Cải tiến này mở rộng các phương pháp mà người dùng có thể tìm kiếm hiểu biết dựa trên nội dung hình ảnh.

Ví dụ: Bối rối với một bài toán toán học khó? Chụp một tấm hình, tô đậm vấn đề cần giải quyết, và ChatGPT có thể cung cấp giải pháp dựa trên hình ảnh.

  1. Truy cập dữ liệu web thời gian thực: Với một bước tiến biến đổi, ChatGPT hiện có thể truy cập dữ liệu hiện tại trên internet. Điều này có nghĩa là người dùng có thể lấy thông tin, thống kê hoặc tin tức cập nhật, biến ChatGPT thành một nguồn thông tin đa chiều và thời sự.

Ví dụ: Thay vì tìm kiếm trên các trang web khác nhau để cập nhật thông tin chứng khoán mới nhất hoặc tiêu đề tin tức, người dùng có thể hỏi ChatGPT về dữ liệu thời gian thực. Bây giờ bạn có thể đặt câu hỏi và ChatGPT sẽ tìm kiếm trên các trang web hiện tại, không chỉ trang web trước năm 2021 như các phiên bản trước.

An toàn, trách nhiệm và các vấn đề liên quan

Khi khả năng của ChatGPT mở rộng, OpenAI vẫn luôn cảnh giác với các vấn đề về đạo đức và an toàn:

  1. An toàn giọng nói: Đây là một vấn đề lớn. Công nghệ giọng nói tổng hợp độc đáo mang đến một số thách thức riêng, đặc biệt là rủi ro giả mạo. Những kẻ xấu nhất định sẽ cố gắng sử dụng công nghệ này cho hành vi tội phạm. Hãy tưởng tượng ai đó đang trò chuyện với mẹ bạn bằng giọng nói của bạn. Đó là một vấn đề tiềm năng và chúng ta sẽ xem OpenAI xử lý thách thức này như thế nào.
  2. Hình ảnh đầu vào: Các mô hình thị giác, mặc dù hứa hẹn, cũng mang theo những lo ngại đặc biệt trong việc diễn giải nội dung quan trọng. Sẽ thú vị khi xem các ứng dụng mà sẽ xuất hiện nhờ khả năng mới này.
  3. Truy cập dữ liệu web: Mặc dù tính năng này tăng cường sự hữu ích của ChatGPT, việc chính xác và không thiên vị của dữ liệu là điều cần lưu ý. OpenAI đã triển khai các cơ chế để đảm bảo người dùng nhận được thông tin chính xác và không thiên vị, nhưng luôn khuyến nghị người dùng xác minh dữ liệu quan trọng từ các nguồn đáng tin cậy.

ChatGPT tiếp tục gia tăng tính hữu ích. Khi những khả năng mới này được triển khai, có thể là trong vài tuần tới, người dùng sẽ có sức mạnh ngay trong tầm tay chưa từng có. Mặc dù vẫn có những lo ngại và cần thiết thiết lập các biện pháp kiểm soát, nhưng những khả năng mới này sẽ mang đến cho người dùng điều mà họ đã muốn từ ngày đầu; dữ liệu thời gian thực và khả năng thu thập thông tin từ các trang web hiện tại, tin tức và thống kê của tất cả các loại. Đây là một khoảnh khắc đột phá.

Nguồn: Industry Analysts Inc.

Elatec trình diễn Tương lai của Thành phố thông minh, Sạc xe điện và Các đổi mới trong In ấn