bởi Peter Grad, Tech Xplore

Luồng quyết định của SIDE từ một tuyên bố trên Wikipedia đến một đề xuất cho một trích dẫn mới như sau: (1) tuyên bố được gửi đến máy tìm kiếm Sphere, từ đó tạo ra một danh sách các tài liệu ứng cử viên tiềm năng từ bộ sưu tập Sphere; (2) bộ xác minh xếp hạng các tài liệu ứng cử viên và trích dẫn ban đầu đối với tuyên bố; (3) nếu trích dẫn ban đầu không được xếp hạng trên các tài liệu ứng cử viên, thì đề xuất một trích dẫn mới từ các ứng cử viên đã tìm thấy. Lưu ý rằng điểm số của bộ xác minh có thể chỉ ra một việc xác minh không thành công tiềm năng, như trong ví dụ được báo cáo. Ghi chú: Tạp chí Nature Machine Intelligence (2023). DOI: 10.1038/s42256-023-00726-1

Có đủ ý kiến trái chiều về tính hữu ích của Wikipedia để đầy một bách khoa toàn thư.

Nhà văn Nicholson Baker gọi Wikipedia là một bách khoa toàn thư dữ liệu, các nhà phát triển gọi là một bộ sưu tập của tất cả kiến thức trên thế giới, "chỉ là một điều phi thường. Nó cực kỳ to lớn, và nó là một cách cẩn thận, lộn xộn, hài hước, gây sốc và đầy tranh cãi rúng động - và nó miễn phí và nhanh chóng."

Nhà văn Oscar Auliq-Ice tuyên bố Wikipedia là "một nguồn lực cách mạng đã biến cách mọi người truy cập và chia sẻ thông tin."

Một số người công nhận nguồn tài nguyên trực tuyến khổng lồ này - với hơn 6,7 triệu bài viết (bằng tiếng Anh) gồm hơn 4,3 tỷ từ tính đến tuần này - là một nỗ lực tráng lệ nhưng có khuyết điểm.

"Wikipedia giống như một bồn hoa, lớn phần đẹp với một số cỏ dại xấu," chuyên gia môi trường Steven Magee nói.

Ghi nhận tính chất tập thể của Wikipedia, nơi ai cũng có thể đóng góp thông tin, nhà văn hài kịch Stephen Colbert đã đề xuất "Wikipedia là nơi đầu tiên tôi đến khi tôi muốn tìm kiếm kiến thức ... hoặc khi tôi muốn tạo ra một số."

Tuy nhiên, đối với một số người, Wikipedia lại là một viên thuốc đắng. "Tôi không cần truy cập không dây vào Wikipedia. Tôi thà xào nấu ruột non của mình hơn là tiếp tục truy cập vào một trang web mà mục Klingon của nó dài hơn mục Latin," Tara Brabazon, hiệu trưởng học viện và giáo sư nghiên cứu văn hóa tại Đại học Charles Darwin ở Australia nói.

Mặc dù thông thường được coi là một nguồn thông tin có thể khen ngợi và nhanh chóng, người dùng luôn được khuyến khích thực hiện công việc cẩn trọng và không dựa hoàn toàn vào một nguồn thông tin duy nhất. Thay vào đó, họ nên xem xét các trang web khác, khám phá liên kết bài viết và có lẽ quan trọng nhất, kiểm tra các nguồn được liệt kê ở cuối mỗi mục Wikipedia.

Các chuyên gia từ khắp nơi trên thế giới thường xuyên đóng góp cho Wikipedia và hầu hết tuân theo các hướng dẫn liên quan đến tính trung lập và việc sử dụng các nguồn đáng tin cậy. Hệ thống này thường hoạt động tốt, mặc dù luôn có thể cải thiện.

Tuần này, Nature Machine Intelligence đã xuất bản một bài viết mang tựa đề "Cải thiện tính xác thực của Wikipedia bằng trí tuệ nhân tạo," về một công ty trí tuệ nhân tạo đặt tại Luân Đôn, nhằm tăng cường tính đáng tin cậy của hệ thống tham chiếu của Wikipedia.

Quá trình này được thực hiện bằng cách kiểm tra nguồn thông tin và xác định những nguồn tin chính xác và những nguồn tin đáng ngờ, sau đó đưa ra các đề xuất của riêng nó.

Fabio Petroni, người đồng sáng lập Samaya AI, một nền tảng khám phá tri thức, nói rằng: "Quá trình cải thiện các tài liệu tham khảo có thể được giải quyết nhờ sự hỗ trợ của trí tuệ nhân tạo được cung cấp bởi hệ thống truy xuất thông tin và một mô hình ngôn ngữ. Máy móc có thể giúp con người tìm kiếm các trích dẫn tốt hơn, một nhiệm vụ đòi hỏi sự hiểu biết về ngôn ngữ và sự thành thạo trong tìm kiếm trực tuyến."

Đội ngũ của ông đã huấn luyện mô hình của mình trên một tập dữ liệu lớn về các bài viết trên Wikipedia, sau đó sử dụng nó để xem xét các bài viết mà nó chưa quét trước đó. Nó phân tích các nguồn tham khảo và đề xuất các trang web thay thế, và các kết quả sau đó được kiểm tra bởi người dùng Wikipedia.

Khi hệ thống AI, được gọi là SIDE, phân loại các nguồn tham khảo trên Wikipedia là không thể xác minh và đề xuất các nguồn thay thế của riêng mình, người dùng thường ưa thích các đề xuất của SIDE đến 70% thời gian, các nhà nghiên cứu đã phát hiện.

Trong khoảng một nửa các trường hợp, SIDE đã đề xuất các nguồn tham khảo giống nhau các nguồn mà Wikipedia đã đề xuất như là nguồn tham khảo đầu tiên của nó.

"Chúng tôi đã chứng minh rằng các công nghệ hiện có đã đạt đến một giai đoạn mà chúng có thể hỗ trợ người dùng Wikipedia một cách hiệu quả và thiết thực trong việc xác minh các khẳng định", Petroni nói.

Ông nói rằng nghiên cứu trong tương lai sẽ tập trung vào các nguồn tham khảo của Wikipedia ngoài văn bản internet, chẳng hạn như hình ảnh, video và đăng báo.

"Chúng tôi hy vọng công việc này có thể được sử dụng trong một ngữ cảnh rộng hơn...giúp con người kiểm tra các sự thật. Nói chung hơn, chúng tôi tin rằng công việc này có thể dẫn đến thông tin đáng tin cậy hơn trực tuyến," Petroni nói.

Thông tin thêm: Fabio Petroni et al, Cải thiện tính xác thực của Wikipedia bằng trí tuệ nhân tạo, Nature Machine Intelligence (2023). DOI: 10.1038/s42256-023-00726-1

Thông tin về Tạp chí: Nature Machine Intelligence © 2023 Science X Network