Sáng minh, Coleman Hughes đã phỏng vấn Eliezer Yudkowsky, Gary Marcus và Scott Aaronson về chủ đề nguy cơ trí tuệ nhân tạo. Bình luận này về khó khăn trong việc phát hiện những lỗi trong GPT-4 đã thu hút sự chú ý của tôi:
GARY: Yeah, một phần vấn đề của việc nghiên cứu ở đây là — ý kiến của tôi, tôi nghĩ bạn [Scott] biết rõ hơn vì bạn đã làm việc bán thời gian, hoặc bất cứ điều gì, tại OpenAI — nhưng cảm nhận của tôi là rất nhiều ví dụ được đăng trên Twitter, đặc biệt là bởi những người như tôi và những người phê phán khác, hoặc những người hoài nghi tôi nên nói. Hệ thống được huấn luyện dựa trên những thứ đó. Hầu hết mọi điều mà mọi người viết về nó, tôi nghĩ là có trong tập huấn luyện. Vì thế là khó khăn trong việc thực hiện khoa học khi hệ thống liên tục được huấn luyện, đặc biệt là trong phần về lĩnh vực học tăng cường và học từ cảm xúc. Và chúng ta thực sự không biết điều gì có trong GPT-4, nên chúng ta còn không biết nếu có các biểu thức chính quy và, bạn biết, các quy tắc đơn giản hoặc những thứ như vậy. Vì vậy, chúng ta không thể thực hiện loại khoa học mà chúng ta từng làm.
Điều này tương tự với vấn đề mà các nhà dự báo kinh tế phải đối mặt. Họ có thể phân tích hàng loạt dữ liệu và đưa ra dự báo về sự suy thoái hoặc dự đoán về lạm phát cao. Nhưng Fed sẽ xem xét những dự báo của họ và cố gắng ngăn chặn mọi kết quả xấu. Người dự báo thời tiết không đối mặt với vấn đề đó.
Cần lưu ý rằng “vấn đề vòng tròn” này khác với lời phê phán thông thường về dự đoán giá cổ phiếu trên thị trường. Theo giả thiết thị trường hiệu quả, một dự đoán rằng một cổ phiếu cụ thể có khả năng thành công vì X, Y hoặc Z (được công khai) sẽ không hiệu quả, vì X, Y và Z đã được tích hợp vào giá cổ phiếu.
Ngược lại, vấn đề vòng tròn được mô tả ở trên còn áp dụng ngay cả khi thị trường không hiệu quả. Bởi vì lương danh nghĩa không linh hoạt, thị trường lao động không hiệu quả theo nghĩa mà thị trường tài chính hiệu quả. Điều này có nghĩa là nếu không có Fed, cần phải có thể dự đoán những biến động trong sản lượng thực.
Trước khi Fed được thành lập, có thể đã có thể dự đoán kinh tế toàn cầu. Vì vậy, một thông báo về việc khai thác vàng tại California có thể dẫn đến những dự đoán về sự tăng trưởng GDP nhanh hơn vào năm 1849. Không có “sự đối ngẫu tiền tệ” dưới chuẩn vàng. Điều này cho thấy chuyển đổi sang tiền giấy có thể làm cho việc dự báo kinh tế ít đáng tin cậy hơn so với dưới chuẩn vàng. Ngân hàng trung ương sẽ bắt đầu cố gắng chứng minh dự báo sai lầm của nhà dự báo.
Chúng ta tend phỏng đoán rằng các lĩnh vực phát triển theo thời gian, rằng chúng ta thông minh hơn tổ tiên. Nhưng logic của chính sách tiền tệ tùy ý ngụ ý rằng hiện tại chúng ta nên kém hơn trong việc dự đoán kinh tế hơn chúng ta trước đây 120 năm.
Trong một chuyến thăm Đại học Kinh tế London vào lúc cuộc khủng hoảng tài chính năm 2008 đang cận kề, Nữ hoàng Elizabeth đặt câu hỏi mà không nghi ngờ đã xuất hiện trong tâm trí của nhiều người dân của bà: "Tại sao không ai thấy điều đó đến?" Phản ứng, ít nhất là của nhà kinh tế đại học Chicago Robert Lucas, là thẳng thừng: Kinh tế không thể cung cấp dịch vụ hữu ích cho cuộc khủng hoảng năm 2008 vì lý thuyết kinh tế đã thiết lập rằng nó không thể dự đoán những cuộc khủng hoảng như vậy.¹ Như John Kay viết, "Trước một phản ứng như vậy, một vị vua khôn ngoan sẽ tìm kiếm lời khuyên ở nơi khác." Và chúng ta cũng có thể như vậy.
Nếu Robert Lucas đã đúng dự đoán về cuộc khủng hoảng năm 2008 thì ông không xứng đáng nhận giải Nobel Kinh tế.
P.S. Tôi rất khuyên xem phỏng vấn của Coleman Hughes. Đó là ví dụ tốt nhất mà tôi từng thấy về cuộc trò chuyện về an toàn AI mà dành cho người mới như tôi. Hầu hết mọi thứ tôi đọc về AI đều quá phức tạp đối với tôi hoặc quá cơ bản.
P.P.S. Phần bình luận cũng rất thú vị. Ở đây, một người bình luận đã trình bày một phân tích tương tự giữa những người cho rằng một trí tuệ nhân tạo chỉ có thể trở nên thông minh hơn bằng cách thêm dữ liệu (so với việc tự chơi) và những người tin rằng một loại tiền tệ chỉ có giá trị nếu có "đảm bảo" từ một tài sản có giá trị.
Một cách (rõ ràng) khác người ta nghĩ về những hạn chế của dữ liệu tổng hợp là nghĩ rằng nó giống như cách mà việc đặt câu hỏi có thể phát triển khả năng mà mô hình đã có sẵn, bằng cách chi phối cuộc thảo luận đến một số loại văn bản từ dữ liệu đào tạo khác. Nói cách khác, họ khẳng định rằng nó không bao giờ thêm bất kỳ khả năng cơ bản mới vào bức tranh. Hãy tưởng tượng khẳng định đó với một hệ thống chơi cờ đào tạo thông qua tự chơi...
Nhiều cách nhìn sai lầm về dữ liệu tổng hợp này hơi giống như người ta không hiểu được cách "tiền tệ phi tín dụng" có thể có giá trị. Họ nghĩ rằng nếu nó không được đảm bảo bằng vàng chẳng hạn, thì toàn bộ thị trường này sẽ sụp đổ. Giá trị nằm ở khả năng nó mang lại, những việc nó cho phép bạn làm, chứ không phải là một đối tượng vật chất, bên ngoài như vàng (hoặc kiến thức thực tế).