Bạn Có Lẽ Đang Đánh Giá Thấp Chatbot Trí Tuệ Nhân Tạo

Vào mùa xuân năm 2007, tôi là một trong bốn nhà báo được Steve Jobs chọn để đánh giá iPhone. Đây có lẽ là sản phẩm được chờ đợi nhất trong lịch sử công nghệ. Nó sẽ ra sao? Nó có phải là một điểm dừng cho các thiết bị không? Nhìn lại những đánh giá của tôi ngày hôm nay, tôi rất vui mừng khi nó không khiến tôi xấu hổ: tôi nhận ra tầm quan trọng của thiết bị đó. Nhưng bằng những lời khen ngợi tôi đưa ra cho iPhone, tôi đã không đưa ra dự đoán về những tác động phụ diễn ra về sau, chẳng hạn như sự kết hợp kỳ lạ giữa phần cứng, hệ điều hành và ứng dụng hoặc tác động lôi cuốn của nó đến sự chú ý của chúng ta. (Tôi đã khuyên Apple "khuyến khích các nhà phát triển bên ngoài tạo ra những ứng dụng mới" cho thiết bị.) Và tôi cũng chưa đề xuất rằng chúng ta nên mong đợi sự xuất hiện của các dịch vụ như Uber hay TikTok hoặc dự đoán bữa tối của gia đình sẽ biến thành trạng thái mê tín điện tử. Tất nhiên, công việc chính của tôi là giúp đỡ mọi người quyết định liệu họ có nên chi tiền 500 đô la (rất đắt đỏ cho một chiếc điện thoại lúc bấy giờ) để mua sản phẩm đó hay không. Nhưng khi đọc lại bài đánh giá bây giờ, có lẽ ai đó sẽ tự hỏi tại sao tôi lại phàn nàn về mạng của AT&T hoặc khả năng không thể xử lý nội dung Flash của trình duyệt web. Đó giống như nhầm lẫn giữa việc phàn nàn về đôi dép đi khi một cơn sóng thần ba tầng sắp đổ về.

Tôi nhớ đến sự thiếu hiểu biết của mình khi đọc về kinh nghiệm của những người dùng những ứng dụng AI gần đây, chẳng hạn như chatbot ngôn ngữ lớn và các bộ tạo hình ảnh. Hoàn toàn đúng, mọi người đang tập trung vào tác động của một loạt các hệ thống AI có khả năng đáng kinh ngạc bất ngờ này, mặc dù các nhà khoa học thường nhấn mạnh rằng những bước đột phá này có vẻ nhanh chóng nhưng thực tế đã được thực hiện trong hàng thập kỷ. Nhưng giống như lúc tôi chạm vào iPhone lần đầu tiên vào năm 2007, chúng ta đang có nguy cơ không đưa ra được các quỹ đạo tiềm năng của tương lai được trang bị của chúng ta bởi vì quá tập trung vào các phiên bản hiện tại của các sản phẩm như Bing chat của Microsoft, ChatGPT của OpenAI, Claude của Anthropic và Bard của Google.

Điều này có thể dễ dàng quan sát được trong thể loại truyền thông mới và phổ biến, được mô tả tốt nhất là prompt-and-pronounce. Phương pháp hoạt động là cố gắng thực hiện một số nhiệm vụ trước đây chỉ giới hạn cho con người và sau đó, thường là không quan tâm đến những lời cảnh báo của nhà phát minh, đưa nó đến một cấp độ cao hơn. Nhà báo thể thao tuyệt vời Red Smith đã từng nói rằng viết một cột rất đơn giản-chỉ cần mở một tĩnh mạch và chảy máu. Nhưng các chuyên gia khác giờ đây đang quảng cáo một phiên bản thiếu máu của nó: bạn chỉ cần mở một trình duyệt và khởi động. (Lưu ý: bản tin này được sản xuất theo cách cũ, bằng cách mở một tĩnh mạch.)

Thông thường, các cột prompt-and-pronounce đòi hỏi ngồi xuống với một trong những hệ thống này và xem nó thay thế công việc trước đó chỉ được giới hạn trong lĩnh vực của con người. Trong một ví dụ điển hình, một phóng viên của tờ New York Times đã sử dụng ChatGPT để trả lời tất cả các cuộc liên lạc công việc của cô ấy trong một tuần. Nhà đánh giá sản phẩm của The Wall Street Journal quyết định sao chép giọng nói của mình (này, chúng tôi đã làm điều đó đầu tiên!) Và diện mạo bằng cách sử dụng AI để xem liệu bản sao của cô có thể khiến người khác lầm tưởng rằng đó là thứ thật sự không. Có hàng chục ví dụ tương tự khác.

Nói chung, những người thực hiện các thủ thuật như vậy kết luận về hai điểm: những mô hình này tuyệt vời, nhưng chúng rất yếu so với những gì con người làm tốt nhất. Các email không thể thu thập được những chi tiết tại nơi làm việc. Những người sao chép có một chân chạy trong thung lũng kinh hoàng. Điều quan trọng nhất, các bộ tạo văn bản này không đưa ra thông tin chính xác khi được hỏi, là hiện tượng được biết đến như "ảo giác", đó là tai họa hiện tại của AI. Và văn bản xuất bản của những mô hình hiện nay thường có chất lượng khô cứng.

Một khía cạnh của vấn đề này là kinh hoàng - liệu thế giới tương lai của chúng ta có được điều hành bởi những "trẻ đầu óc" không hoàn hảo, như nhà robot học Hans Moravec gọi các kế nhiệm số của chúng ta? Nhưng trong một khía cạnh khác, những yếu điểm đó là trấn an. Chắc chắn rằng các AI hiện tại có thể thực hiện rất nhiều nhiệm vụ cấp thấp và không thể bị đánh bại trong việc đưa ra các chuyến đi Disneyland trông hợp lý và lựa chọn menu tiệc tối không chứa gluten, nhưng suy nghĩ của chúng ta sẽ luôn luôn cần có các sửa chữa và tăng cường văn phong.

Bạn Có Lẽ Đang Đánh Giá Thấp Chatbot Trí Tuệ Nhân Tạo

Tin AI