Cách đây vài tuần, OpenAI cuối cùng đã tung ra một ứng dụng iOS gốc cho ChatGPT.
Tính năng thú vị của ứng dụng là bạn có thể nói chuyện với ChatGPT để tạo một lời nhắn thay vì viết bằng đôi ngón tay của bạn.
Sau khi làm như vậy vài lần, tôi nhận ra một điều không rõ ràng ban đầu. Bản ghi âm chuyển văn bản mà ứng dụng đang thực hiện tốt hơn bất kỳ bản ghi âm chuyển văn bản nào mà tôi từng thấy. Nó tốt hơn cả các công cụ chuyển văn bản được cung cấp bởi trình soạn thảo iMessage của Apple hoặc các công cụ chuyển văn bản riêng biệt khác được vận hành bằng trí tuệ nhân tạo phổ biến.
Hãy xem điều đó có ý nghĩa gì.
Hôm qua, tôi đã viết một bài về cáo buộc mới nhất đối với Trump và tôi muốn trích dẫn từ một trong số các podcast yêu thích của mình, Serious Trouble.
Về cuối chương trình, cộng tác viên Josh Barro đã hỏi luật sư bào chữa lớn trở thành luật sư tấn công Ken White nếu Trump sẽ bị bắt và đưa ra tòa án.
Đây là cách một trong những dịch vụ chuyển văn bản được vận hành bởi trí tuệ nhân tạo hàng đầu, Otter.ai, phân tích câu trả lời của White:
"Bây giờ có khả năng, từ một lệnh đòi hỏi, anh ấy sẽ đầu hàng theo kỹ thuật của Cục đội Marshall của Hoa Kỳ. Và họ sẽ kỹ thuật có ảnh và dấu vân tay của anh ấy, và kiểu đó. Nhưng đó không phải là một chuyện bị còng tay như layup, bạn chỉ cần đi vào văn phòng Marshal một cách lịch sự và họ sẽ giữ lịch sự vào phòng tòa án, đặc biệt là khi bạn tự nguyện và được hiển thị trên 99,9% chắc chắn anh ta sẽ được một khoản kế hoạch dễ chịu, có lẽ chỉ là một khu vực ghi nhận, không phải là khoản kế hoạch. Và anh ấy sẽ được sắp xếp, anh ấy sẽ được thông báo về các cáo buộc. Và có lẽ họ sẽ không đưa ra tuyên bố không tội bây giờ. Có lẽ họ sẽ gửi nó đến thẩm phán Cannon, và cô ấy sẽ đưa ra tuyên bố. Đôi khi các thẩm phán liên bang, họ muốn để thẩm phán thẩm phán để đưa ra tuyên bố, đôi khi thẩm phán thích sử dụng tuyên bố là một việc của phòng tòa án, nhưng không nhiều điều lớn lao sẽ xảy ra trong cuộc xuất hiện đầu tiên".
Và đây là ChatGPT chuyển văn bản White:
"Bây giờ, có khả năng, từ khi họ mời anh ấy, anh ấy sẽ kỹ thuật đầu hàng cho Cục đội Marshall của Hoa Kỳ, và họ kỹ thuật có dấu vân tay và ảnh và kiểu đó, nhưng có khả năng đó không phải là một chuyện bị còng tay. , có lẽ. Bạn biết, bạn chỉ cần đi vào văn phòng của Marshall một cách lịch sự và họ sẽ đi lịch sự vào phòng tòa án. Đặc biệt là khi bạn tự nguyện xuất hiện. Tôi chắc chắn 99,9% anh ấy sẽ được một khoản kế hoạch dễ chịu, có lẽ chỉ là một khu vực ghi nhận, không phải là khoản kế hoạch. Và anh ấy sẽ được sắp xếp, anh ấy sẽ được thông báo về các cáo buộc, và có lẽ họ sẽ không đưa ra tuyên bố không tội bây giờ, có lẽ họ sẽ gửi nó đến Thẩm phán Cannon, và cô ấy sẽ cầu xin. Đôi khi các thẩm phán liên bang, họ muốn thẩm phán tòa án phụ trách để đưa ra tuyên bố, đôi khi chính thẩm phán muốn đưa ra tuyên bố là một việc của tòa án. Phòng tòa án, nhưng không có nhiều thành phần lớn sẽ xảy ra trong cuộc xuất hiện đầu tiên".
Tôi đã không chỉnh sửa bất kỳ đoạn nào. Tôi chỉ sao chép và dán một từ Otter.ai và từ ChatGPT.
Sự khác biệt đó rõ ràng, đúng không? Bạn gần như có thể nghe người nói trong phiên bản ChatGPT.
Tôi đã gửi email cho Sam Altman, giám đốc điều hành của OpenAI, để hỏi ông tại sao ChatGPT lại tốt đến vậy. Ông nói lý do ứng dụng ChatGPT tốt đến vậy là vì nó đang sử dụng một công nghệ OpenAI khác được gọi là "Whisper".
Đây là cách OpenAI tiếp thị/phân tích "Whisper" trên trang web của họ:
"Kiến trúc Whisper là một phương pháp từ đầu đến cuối đơn giản, được thực hiện dưới dạng Bộ mã hóa-mã giải Transformer. Âm thanh đầu vào được chia thành mảnh 30 giây, được chuyển đổi thành một dải phổ log-Mel, và sau đó được đưa vào bộ mã hóa. Một trình giải mã được đào tạo để dự đoán chú thích văn bản tương ứng, xen kẽ với các mã đặc biệt để chỉ đạo một mô hình đơn lẻ để thực hiện các nhiệm vụ như nhận dạng ngôn ngữ, đánh dấu thời gian cụm từ, chuyển đổi chữ nói đa ngôn ngữ và chuyển đổi tiếng anh".