Internet và Công nghệ Mọi người trên internet đều hào hứng với tính năng "thị giác" mới của ChatGPT.
Những cập nhật mới nhất của công cụ OpenAI bắt đầu được triển khai từ tuần trước. Chúng cho phép ChatGPT "nhìn thấy" khi người dùng tải lên hình ảnh và sau đó có thể thảo luận về chúng với trò chuyện. Các tính năng "nghe" và "nói" bổ sung cho phép người dùng có cuộc trò chuyện với ChatGPT.
Các khả năng trí tuệ nhân tạo (AI) mới này sử dụng GPT-3.5 và GPT-4, mà "áp dụng kỹ năng lập luận ngôn ngữ vào một loạt các hình ảnh, chẳng hạn như ảnh chụp, ảnh chụp màn hình và tài liệu chứa cả văn bản và hình ảnh", theo một bài viết trên blog của OpenAI vào thứ Hai.
Trên hình minh họa trên, ứng dụng điện thoại thông minh ChatGPT được bao quanh bởi các ứng dụng trí tuệ nhân tạo khác ở Vaasa, Phần Lan, ngày 6 tháng 6 năm 2023. Người dùng ChatGPT đang thử nghiệm tính năng thị giác mới nhất của chatbot và chia sẻ cách sử dụng yêu thích của họ trên mạng xã hội.
OLIVIER MORIN/AFP qua Getty Images
Mọi người trên thế giới đã bắt đầu thử nghiệm các tính năng mới này và chia sẻ trải nghiệm của mình trên mạng xã hội. Dưới đây là 10 cách sáng tạo mà người dùng ChatGPT đang tận dụng tính năng thị giác mới này.
Nhận diện cảnh phim
Trên X, trước đây là Twitter, một số người dùng đã thông báo với người theo dõi rằng họ có thể tải lên một screenshot từ một bộ phim và nhờ ChatGPT nhận diện phim đó. Một ví dụ được đăng bởi @skalskip92, ChatGPT đã nhận diện được bộ phim Pulp Fiction từ một screenshot hiển thị các diễn viên John Travolta và Samuel Jackson.ChatGPT cũng chia sẻ thông tin về bối cảnh lịch sử của bộ phim và, khi được hỏi, đánh giá của nó trên IMDB.
Bạn có thể sử dụng ChatGPT Vision để nhận diện các bộ phim.
Chỉ cần chụp một bức ảnh của cảnh phim và yêu cầu điểm số trên IMDB. pic.twitter.com/ZjiIxA2svy
— SkalskiP (@skalskip92) 26 tháng 9, 2023
Nhà văn Peter Yang cũng đã thử nghiệm khả năng này với một ảnh chụp từ bộ phim Gladiator năm 2000 do Ridley Scott đạo diễn.
Làm bài tập về nhà cho trẻ em
Nhà phát triển trí tuệ nhân tạo McKay Wrigley đã đăng một video trên X cho thấy ChatGPT có thể giải thích các sơ đồ khoa học cho học sinh. Ví dụ của Wrigley là một sơ đồ biểu hiện bên trong tế bào người và ông yêu cầu được giúp đỡ để hiểu mục đích của từng cấu thành. ChatGPT đưa ra mô tả ngắn gọn cho mỗi phần của tế bào.Yang cũng đã thử nghiệm chức năng giống như một người hướng dẫn bằng cách gửi ChatGPT một hình ảnh bài tập cộng trong một lớp học toán. ChatGPT đã cung cấp đáp án cho tất cả các bài toán toán học trên bài.
"Trẻ em sẽ không bao giờ làm bài tập về nhà nữa," Yang tweet.
Cung cấp mẹo huấn luyện
Đồng sáng lập công ty Create Labs Abran Maldonado tweet rằng ông đã cung cấp cho ChatGPT hai bức ảnh được chụp trong một trận đấu bóng đá "nhân dịp mùa bóng đá". ChatGPT sau đó giải thích những gì đang diễn ra trong từng bức ảnh và đưa ra sáu mẹo huấn luyện cho vị trí của quarterback. Maldonado dự đoán rằng tính năng hình ảnh mới này "sẽ thay đổi mãi mãi huấn luyện và phân tích thể thao."Một trong những demo yêu thích tôi đã thử nghiệm, nhân dịp mùa bóng đá, ChatGPT Vision sẽ thay đổi mãi mãi huấn luyện và phân tích thể thao. Dù tôi có xây dựng nó hay không, ChatGPT dành cho huấn luyện sẽ có mặt trên mỗi đường biên của giải đấu. Hãy nhớ lời tôi. pic.twitter.com/uUYhsKpEGh
— Abran Maldonado (@abran) 27 tháng 9, 2023
Viết code
Người dùng cũng phát hiện ra rằng ChatGPT có thể viết code dựa trên hình ảnh, biểu đồ và sơ đồ đã được tải lên.Một ví dụ, Wrigley đã chia sẻ một tấm hình trên X với các sơ đồ được vẽ trên một bảng trắng mà ChatGPT sau đó biến thành mã.
Một số người dùng X đã chia sẻ một video khác cho thấy cách ChatGPT tạo ra một trang web với thiết kế phù hợp với một bản phác thảo được vẽ trên giấy, một bức ảnh của nó sau đó được tải lên để chatbot đánh giá.
🔥 Từ Bản Vẽ đến Trang Web với ChatGPT-4. Tương lai đã đến rồi🔥 Điều gì sẽ xảy ra nếu một bức vẽ đơn giản có thể trở thành một trang web hoạt động đầy đủ? Trí tuệ nhân tạo hiện đã có thể tạo ra các trang web từ bản vẽ 🤯
Muốn biết thêm thông tin đột phá như thế này? Hãy kiểm tra email newsletter của chúng tôi. 📧 Liên kết trong hồ sơ của tôi. pic.twitter.com/VZ5d8qlybY
— Captain YAR (@SobkoYaroslav) 27 tháng 9 năm 2023
Điều chỉnh yên xe đạp
ChatGPT có thể hướng dẫn người dùng qua các hướng dẫn cách thức cho nhiều hoạt động ngẫu nhiên, bao gồm điều chỉnh yên xe đạp. Trong một ví dụ được chia sẻ bởi OpenAI, một người dùng gặp khó khăn khi giảm yên xe của họ có thể chụp ảnh chiếc xe đạp và làm theo các hướng dẫn từng bước để chỉnh sửa cần thiết. Người dùng có thể đặt câu hỏi liên quan và gửi ảnh bổ sung để giải quyết các bước cụ thể khi gặp vấn đề, theo OpenAI trong đoạn video của họ. Tính năng nhìn thấy cũng có thể được sử dụng để sửa chữa các vật phẩm ngẫu nhiên khác trong nhà, bài đăng trên blog của OpenAI nói.Chụp ảnh tốt hơn
Ethan Mollick, một giáo sư nghiên cứu về tác động của trí tuệ nhân tạo đối với giáo dục, đã nói trên X rằng tính năng nhìn thấy của ChatGPT có thể giúp người dùng tạo ra những bức ảnh tốt hơn. Mollick đã tải lên một bức ảnh lên ChatGPT và yêu cầu những hướng dẫn cụ thể về cách cải thiện hình ảnh. Phản hồi mà ông nhận được cho thấy ChatGPT cung cấp lời khuyên về cách cắt cảnh, ánh sáng, góc nhìn và nhiều hơn nữa.Một cách sử dụng thú vị và không ngờ của GPT-4 với tính năng nhìn thấy - nó trở thành một huấn luyện viên hình ảnh thông minh khá tốt.
Bạn có thể yêu cầu nó đưa ra những gợi ý cụ thể (những ý tưởng này không tồi & việc xác định tác phẩm điêu khắc trâu rừng là thú vị) và sau đó cho nó xem phiên bản sửa đổi để có thêm ý tưởng.pic.twitter.com/o8yRyC7k5c
— Ethan Mollick (@emollick) 29 tháng 9 năm 2023
Pietro Schirano, người được mô tả trong tiểu sử X làm việc về trí tuệ nhân tạo, đã đăng trên X rằng ChatGPT cũng đóng góp vào việc đề xuất một tên cho một phong cách thiết kế nội thất sau khi các ảnh về phong cách đó được tải lên. ChatGPT miêu tả các yếu tố thiết kế không gian và giải thích ngữ cảnh lịch sử cho đề xuất tên.
Sử dụng GPT-4 Vision để đặt tên cho các phong cách kiến trúc chưa từng thấy được tạo ra với Midjourney
Nó xuất sắc trong việc nhận diện các yếu tố đa dạng và gán tên cho những sáng tạo đặc biệt này. 🏛️✨ pic.twitter.com/lLb4p8Etkf
- Pietro Schirano (@skirano) 27 tháng 9, 2023
Tránh việc bị xử phạt đỗ xe
Yang tweet rằng anh ta "sẽ không bị phạt đỗ xe nữa" từ khi tính năng thị giác của ChatGPT xuất hiện. Yang đăng một bức ảnh về một biển báo trong đó hiển thị một số hướng dẫn đỗ xe khác nhau, mỗi hướng dẫn cho biết được khi nào người ta có thể và không thể đỗ xe trong khu vực đó. Yang cung cấp cho ChatGPT một thời gian cụ thể và ngày trong tuần, hỏi xem có an toàn để đỗ xe không.Phân tích tác phẩm nghệ thuật
ChatGPT tìm hiểu về phân tích nghệ thuật khi Schirano hỏi về ý nghĩa phía sau một bức tranh bốn phần. Phân tích của ChatGPT chia bức tranh thành từng phần và đưa ra đánh giá tổng quan về ý nghĩa của nó cuối cùng.Giải mã ghi chú viết tay
ChatGPT có thể đọc được chữ viết tay lộn xộn hoặc nghệ thuật. Trong một ví dụ được chia sẻ trên X bởi Mollick, một bức ảnh về một phần của một bản thảo viết tay đã được tải lên ChatGPT để giải mã. Theo Mollick, chatbot đã làm tốt khá tốt."Chắc chắn sẽ là một vấn đề quan trọng cho nhiều lĩnh vực học thuật, đặc biệt là khi trí tuệ nhân tạo có thể 'suy luận' về văn bản," anh ấy tweet.
Khá thú vị. Trí tuệ nhân tạo giỏi hơn tôi trong việc giải mã chữ viết tay. GS. Breen hỏi xem GPT-4 có thể đọc được bản thảo viết tay của Robert Boyle không. Nó làm tốt!
Chắc chắn sẽ là một vấn đề quan trọng cho nhiều lĩnh vực học thuật, đặc biệt là khi trí tuệ nhân tạo có thể "suy luận" về văn bản. https://t.co/n9jUjqeEw3 pic.twitter.com/78jYWfIhCY
- Ethan Mollick (@emollick) 27 tháng 9, 2023
Tìm Waldo
Có lẽ quan trọng nhất là ChatGPT có thể giúp trẻ em (và người lớn) trên toàn thế giới tìm thấy Waldo."Tìm thấy rồi!" ChatGPT phản hồi trên một trang Where's Waldo? được Schirano tải lên, cung cấp hướng dẫn về nơi tìm kiếm Waldo.