Nghiên cứu phát hiện vấn đề xác thực nguồn gốc ảnh hưởng đến tính đáng tin cậy của ChatGPT

ChatGPT đang dần trở nên phổ biến. Nhiều tập đoàn lớn như Morgan Stanley, Duolingo, Snapchat, Coca-Cola và Instacart đã ký kết hợp tác cùng với ChatGPT. ChatGPT cũng được sử dụng rộng rãi ở nhiều lĩnh vực như lập trình viên, thiết kế web, ngành dược, nhạc sĩ, nhà văn, dịch giả và hầu hết các loại hình kinh doanh. Chỉ trong vòng nửa năm, ChatGPT đã thu hút hơn 100 triệu người dùng trên toàn thế giới và xử lý hơn 10 triệu yêu cầu trong một ngày.

Mỗi ngày, chúng ta đều nghe nhiều những câu chuyện về tiềm năng của ChatGPT trong việc thay đổi từ mô hình kinh doanh cho đến thói quen cá nhân. Chính vì vậy, ai cũng muốn tham gia đóng góp ý tưởng của mình vào ChatGPT.

Tuy nhiên, một vài người lại nổi lên và đặt ra nhiều câu hỏi về những hướng tiêu cực của ChatGPT - ứng dụng tăng trưởng nhanh chóng nhất trong lịch sử. Trước hết phải kể đến là một lá thư của hơn 1.000 chuyên gia được ký vào tháng Ba, yêu cầu ngừng mở rộng công nghệ trí tuệ nhân tạo cho đến khi hiểu được sâu hơn về những rủi ro và nguy hiểm của nó.

Trong khi những người hoài nghi nhìn nhận vấn đề chủ yếu liên quan đến khả năng của kẻ xấu lợi dụng AI (Trí tuệ nhân tạo) cho mục đích xấu hoặc tưởng tượng ra một kịch bản khả thi trong đó các mô hình AI tự quyết định hành động độc hại, người khác lại tập trung vào một vấn đề càng thêm trực tiếp: độ chính xác.

Tờ Wall Street Journal gần đây đã cảnh báo: "Các trò chuyện của trợ lý ảo trí tuệ nhân tạo và các chương trình tạo ra trí tuệ cũng như gương phản chiếu của dữ liệu mà chúng tiêu thụ. Chúng tái tạo và kết hợp lại những gì mà chúng được cung cấp để đạt được các hiệu quả ấn tượng - và đồng thời thất bại đáng kể."

Nhóm nghiên cứu Trí tuệ nhân tạo tập trung vào con người của Đại học Stanford đã xuất bản một bài báo trên máy chủ trước in arXiv vào tháng trước, nêu ra câu hỏi về tính đáng tin cậy của dữ liệu được truy xuất trong các mô hình ngôn ngữ lớn.

"Điều kiện tiên quyết của một công cụ tìm kiếm sản xuất đáng tin cậy là có thể xác minh được," Nelson Liu, một sinh viên nghiên cứu tiến sĩ tại Stanford và một trong những tác giả của báo cáo, nói. Sau khi nghiên cứu đầu ra từ bốn công cụ tìm kiếm phổ biến, Liu và hai đồng nghiệp của anh ấy là Tianyi Zhang và Percy Jiang đã báo cáo rằng kết quả là "trôi chảy và có vẻ thông tin hữu ích, nhưng thường chứa những tuyên bố không được chứng minh và trích dẫn không chính xác."

Các công cụ tìm kiếm tạo ra từ ngôn ngữ lớn mà họ nghiên cứu là Bing Chat, NeevaAI, perplexity.ai và YouChat. Các môn học bao gồm dữ liệu tiểu sử về ca sĩ Alicia Keys và vấn đề kiểm duyệt trên mạng xã hội.

Các nhà nghiên cứu đã tìm hiểu bốn đặc điểm: độ trôi chảy, độ hữu ích, siêu nhớ lại (mức độ tuyên bố được tạo ra có được chứng minh đầy đủ bởi các trích dẫn) và độ chính xác của việc trích dẫn các tuyên bố liên quan. Một công cụ tìm kiếm sản xuất đáng tin cậy được xem là một công cụ tìm kiếm đạt được mức độ siêu nhớ lại và độ chính xác cao. Kết quả của nghiên cứu là không khí.

Đội ngũ nghiên cứu này đã tìm thấy các câu trả lời "thường có tính trôi chảy và được cho là hữu ích, nhưng thường chứa những tuyên bố không được chứng minh hoặc trích dẫn không chính xác." Chỉ khoảng một nửa các câu được tạo ra được chứng minh đầy đủ bằng các trích dẫn và một phần tư trích dẫn không hỗ trợ câu liên quan.

Hơn nữa, độ siêu nhớ lại và độ chính xác của các trích dẫn đã đảo ngược với độ trôi chảy và độ hữu ích. "Các câu trả lời có vẻ hữu ích hơn thường là những bài không được chứng minh hoặc trích dẫn không chính xác," họ quan sát.

Vì vậy, họ kết luận rằng "mặt nạ của tính đáng tin cậy này sẽ tăng cường khả năng của các công cụ tìm kiếm để dẫn dắt người dùng sai lầm."

Một bài báo mới đây trong ExtremeTech đề cập đến vấn đề về nguồn gốc: "Các trợ lý ảo trí tuệ nhân tạo như ChatGPT và Bing Chat đang làm giảm độ tin cậy, khó phân biệt sự chính xác và giả mạo, đặc biệt là trong vài giây người dùng dành cho trang kết quả của công cụ tìm kiếm."

Các nhà nghiên cứu Stanford cho biết kết quả của nghiên cứu của họ "rất đáng lo ngại đối với các hệ thống có thể phục vụ làm công cụ chủ yếu cho người sử dụng tìm kiếm thông tin - đặc biệt là với bề ngoài độ tin cậy của chúng."

Các nhà nghiên cứu hy vọng rằng nghiên cứu của họ sẽ "thúc đẩy sự phát triển của các công cụ tìm kiếm sản xuất đáng tin cậy và giúp các nhà nghiên cứu và người dùng hiểu rõ hơn về những điểm yếu của các hệ thống thương mại hiện đang tồn tại."

Nghiên cứu phát hiện vấn đề xác thực nguồn gốc ảnh hưởng đến tính đáng tin cậy của ChatGPT

Tin tức ChatGPT