Công cụ AI tạo ra như ChatGPT đã mang đến một sự thay đổi công nghệ to lớn, đặc biệt là với khả năng thực hiện các nhiệm vụ phức tạp dựa trên các chỉ thị đơn giản, thông dụng. Các tính năng đang chuẩn bị trở nên càng phức tạp hơn với việc OpenAI, nhà tạo ra ChatGPT, tung ra một phần mở rộng mạnh mẽ mới được gọi là Trình thông dịch Code. Trình thông dịch này có thể thực hiện các chức năng phức tạp chỉ trong vài giây.
Trình thông dịch Code là một phần của gói trả phí của ChatGPT được gọi là ChatGPT Plus, có giá 20 đô la mỗi tháng. ChatGPT Plus được xây dựng trên mô hình trí tuệ nhân tạo GPT-4 mới hơn, được huấn luyện trên một tập dữ liệu mở rộng hơn và do đó, có độ chính xác cao hơn cũng như giảm thiểu các phản hồi sai hoặc hiện tượng "thấy hình".
Nếu bạn là người dùng thuộc gói trả phí, bạn có thể truy cập các tính năng sắp tới như các phần mở rộng, giúp bạn tương tác với các ứng dụng bên thứ ba. Tương tự, Trình thông dịch Code, đã được chuyển từ giai đoạn alpha sang giai đoạn beta gần đây, đã được mở cho tất cả các thuê bao ChatGPT Plus thử nghiệm. Mặc dù tên gọi của nó, tính năng này không chỉ đơn giản là thông dịch mã; nó còn có thể làm nhiều hơn, từ viết mã đến phân tích dữ liệu, tạo biểu đồ biểu diễn hình ảnh và giải quyết các vấn đề toán học phức tạp. Mặc dù ưu điểm thật sự ở đây là đối với các nhà phân tích dữ liệu, công cụ mới này có thể xử lý các loại tệp thông thường và thực hiện nhiều chức năng khác nhau.
Dưới đây là tất cả những điều bạn cần biết về Trình thông dịch Code của ChatGPT.
Trình thông dịch Code mới của ChatGPT là gì?
Trình thông dịch Code mới của ChatGPT có thể đọc và hiểu dữ liệu từ các tập dữ liệu lớn, thực hiện nhiều phân tích khác nhau và trình bày dưới dạng hình ảnh hoặc đồ thị cuối cùng. Nó cũng có thể kết hợp dữ liệu với các hình thức truyền thông khác để hiển thị hình ảnh, GIF hoặc đồ thị chuyển động.
Trình thông dịch Code cơ bản khác biệt với các trò chuyện với chatbot trí tuệ nhân tạo như ChatGPT, Microsoft Bing AI và Google Bard. Điều đó là do các chatbot này dựa vào một mô hình ngôn ngữ lớn được gọi là LLM, là một mô hình học máy dự đoán câu trả lời thông qua việc xuất ra một từ mỗi lần. So với đó, Trình thông dịch Code là một môi trường lập trình mà đáp ứng các câu hỏi của người dùng bằng cách viết mã cụ thể cho các nhiệm vụ bằng ngôn ngữ lập trình Python.
Trong khi ChatGPT có khả năng viết mã, bạn phải chạy và gỡ lỗi mã thủ công. Trình thông dịch Code, ngược lại, không chỉ viết mã Python mà còn chạy chúng trong giao diện của ChatGPT. Vì Trình thông dịch Code quản lý nhiệm vụ bằng cách viết mã Python thay vì dựa vào LLM, điều này cải thiện độ chính xác kết quả và dự kiến sẽ có ít hiện tượng hiện tượng. Điều này bởi vì kết quả được thu được từ quá trình suy luận tức thì thay vì dữ liệu văn bản từ các nguồn được viết - bao gồm sách, bài viết và trang web trên internet.
Đây là cách sử dụng Trình thông dịch Code của ChatGPT
Trước khi nói về Trình thông dịch Code chi tiết, dưới đây là các bước bạn phải làm để bắt đầu sử dụng nó:
Mặc dù hiện tại bạn phải là thành viên trả phí của ChatGPT để truy cập được vào Code Interpreter, tính năng này có thể cũng sẽ xuất hiện trên Microsoft's Bing Chat AI trong những tháng tới. Ngoài việc rằng Bing Chat đã chạy trên GPT-4, sự cho rằng của chúng tôi còn dựa trên lời hứa gần đây của Microsoft về việc hỗ trợ tải tệp lên cho chatbot của họ.
Code Interpreter có thể làm gì?
Code Interpreter có thể làm nhiều điều với tập dữ liệu lớn, bao gồm phân tích và mạng lưới dự đoán, làm sạch và cấu trúc lại, và suy luận dựa trên dữ liệu. Nó có thể trả lời những câu hỏi cụ thể về dữ liệu, được hỗ trợ bằng lý do hợp lý, và thậm chí điều chỉnh phương pháp dựa trên hướng dẫn đơn giản. Sau đó, nó có thể tạo ra biểu đồ 2D hoặc 3D để biểu thị dữ liệu đó, tạo ra bản đồ và thậm chí là đồ họa chuyển động dựa trên dữ liệu.Điều này khá thú vị: Tôi đã tải lên một tệp CSV chứa vị trí của mọi ngọn hải đăng ở Mỹ.
"ChatGPT Code Interpreter: Tạo một file gif của bản đồ vị trí của những ngọn hải đăng, trong đó bản đồ rất tối nhưng mỗi ngọn hải đăng sẽ lấp lánh." Vài giây sau đó... pic.twitter.com/f14JLWQCyB
— Ethan Mollick (@emollick) 2 tháng 5, 2023
Ngoài việc phân tích và biểu đồ hóa dữ liệu, Code Interpreter cho phép bạn sao chép mã Python để chạy trong môi trường cục bộ. Nó cũng có thể được sử dụng để tạo bảng điều khiển dữ liệu có thể tải xuống và cho một loạt các mục đích khác có thể được thực hiện bằng cách viết mã Python. Nhà khoa học máy tính Gavriel Cohen cho biết công cụ này hiện hỗ trợ hơn 300 gói và thư viện Python.
Bạn chỉ cần thêm các tệp cần xử lý vào Code Interpreter và viết hướng dẫn vào thanh chat. Hiện tại, nó hỗ trợ tài liệu văn bản, tệp PDF, ảnh, video, tệp âm thanh và trang HTML. Nó cũng có thể phân tích cơ sở dữ liệu được biên soạn trong Microsoft Excel (hoặc các phiên bản miễn phí của nó), SQLite và tệp CSV, và truy cập vào mã được viết bằng Python, Java, JavaScript, C++, vv.
Trong khi OpenAI không quy định kích thước tệp tối đa bạn có thể tải lên trong Code Interpreter, nhà nghiên cứu Ethan Mollic chú thích trong bài đăng blog của họ rằng kích thước tệp tối đa được hỗ trợ là 100MB, nhưng bạn cũng có thể tải lên các tệp nén dưới định dạng ZIP.
Lo ngại với Code Interpreter
Về lý thuyết, Code Interpreter là một công cụ mạnh mẽ có thể thực hiện công việc mà trước đây có thể được coi là công việc vất vả tốn thời gian. Như Mollic lưu ý, nó có khả năng hoàn thành công việc trong vài giây mà họ mất rất nhiều thời gian để nắm bắt trong quá trình học tiến sĩ của họ. Nhà nghiên cứu cũng cho rằng họ hy vọng trí tuệ nhân tạo sẽ không thay thế con người mà sẽ giải phóng chúng ta khỏi "những phần làm phiền, lặp đi lặp lại trong công việc để chúng ta có thể tập trung vào những điều tốt đẹp".Dù có khả năng của nó, một số nhà học thuật, bao gồm Giáo sư đại học Leeds Peter Tennant, phản đối việc sử dụng Code Interpreter cho phân tích dữ liệu. Tennant tin rằng sự phụ thuộc vào thuật toán cho các nhiệm vụ phức tạp yêu cầu chuyên môn của con người và nhiều năm kinh nghiệm có thể dẫn đến kết quả không đủ và không tin cậy.
Phân tích dữ liệu tốt thật khó khăn. Nó đòi hỏi kiến thức, sự đào tạo và suy nghĩ. Đó không phải là cách chặn cửa, mà đó là một sự thật đối với hầu hết các nhiệm vụ khoa học!
Công cụ học máy có thể hấp dẫn, nhưng phân tích dữ liệu theo hướng dẫn không đầy đủ có thể dẫn đến những thông tin sai lạc nguy hiểm. Chúng ta cần nhiều suy nghĩ hơn, chứ không phải ít hơn.
- Peter Tennant, Tiến sĩ (@PWGTennant) July 9, 2023
Đồng thời, Code Interpreter cũng dễ dàng gặp những vấn đề về quyền riêng tư tương tự như ChatGPT - hoặc trí tuệ nhân tạo nói chung. OpenAI vẫn chưa cập nhật chính sách quyền riêng tư của mình để làm rõ liệu nó sử dụng dữ liệu được tải lên công cụ để cải tiến nó hay không. Trong khi thử nghiệm khả năng của Code Interpreter với dữ liệu từ miền mở không được xem là vấn đề, nhà nghiên cứu cần phải cẩn trọng trước khi nhập bất kỳ dữ liệu bí mật nào.