Meta lần đầu tiên công bố những viên chip trí tuệ nhân tạo của mình.

Mark Zuckerberg đã thông báo với thế giới vào tháng 10 năm 2021 rằng ông sẽ đổi tên Facebook thành Meta khi công ty đẩy mạnh đến thế giới ảo. Meta đã xây dựng các chip máy tính tùy chỉnh để giúp cho các nhiệm vụ trí tuệ nhân tạo và xử lý video, và lần đầu tiên đã công bố chúng cho công chúng trong tuần này trước một sự kiện trực tuyến vào thứ Năm để thảo luận về các khoản đầu tư cơ sở hạ tầng trí tuệ nhân tạo của họ.

Các nhà đầu tư đã chăm chú theo dõi các khoản đầu tư của Meta vào trí tuệ nhân tạo và phần cứng trung tâm dữ liệu liên quan khi công ty bắt đầu một “năm hiệu quả” bao gồm ít nhất 21.000 việc làm giảm và cắt giảm chi phí lớn.

Mặc dù việc thiết kế và xây dựng chip máy tính của riêng mình là tốn kém, Phó Chủ tịch cơ sở hạ tầng Alexis Bjorlin cho biết Meta tin rằng hiệu suất cải tiến sẽ xứng đáng với đầu tư. Công ty cũng đã đang cải thiện thiết kế trung tâm dữ liệu của mình để tập trung hơn vào các kỹ thuật tiết kiệm năng lượng, chẳng hạn như làm mát bằng chất lỏng, nhằm giảm nhiệt dư thừa.

Một trong các chip máy tính mới, Meta Scalable Video Processor, hoặc MSVP, được sử dụng để xử lý và truyền video đến người dùng trong khi giảm yêu cầu năng lượng. Bjorlin nói rằng "không có gì có sẵn trên thị trường" có thể xử lý và giao 4 tỷ video một ngày một cách hiệu quả như Meta mong muốn.

Bộ xử lý khác là bộ xử lý đầu tiên trong gia đình Meta Training and Inference Accelerator, hoặc MTIA, của các chip cụ thể được thiết kế để giúp đỡ cho các tác vụ cụ thể của trí tuệ nhân tạo. Chip MTIA mới cụ thể xử lý "suy luận," tức là khi một mô hình trí tuệ nhân tạo đã được huấn luyện trước đó đưa ra dự đoán hoặc hành động.

Bjorlin cho biết chip suy luận trí tuệ nhân tạo mới giúp cho một số thuật toán gợi ý của Meta được sử dụng để hiển thị nội dung và quảng cáo trong các bản tin của mọi người. Cô từ chối đáp ứng về người sản xuất chip, nhưng một bài đăng trên blog cho hay bộ xử lý được "sản xuất bằng quy trình 7nm của TSMC," cho thấy ông gigant Chip Đài Loan đang sản xuất công nghệ này.

Cô nói rằng Meta có một "lộ trình đa thế hệ" cho gia đình chip trí tuệ nhân tạo của mình bao gồm các bộ xử lý được sử dụng cho các tác vụ huấn luyện mô hình trí tuệ nhân tạo, nhưng cô từ chối cung cấp chi tiết ngoài chip suy luận mới. Trước đây, Reuters đã đưa tin rằng Meta đã hủy một dự án chip suy luận trí tuệ nhân tạo và bắt đầu dự án khác được dự kiến sẽ ra mắt vào khoảng năm 2025, nhưng Bjorlin từ chối bình luận về báo cáo đó.

Bởi vì Meta không kinh doanh dịch vụ đám mây như các công ty khác bao gồm Google công ty mẹ Alphabet hoặc Microsoft, nên công ty không cảm thấy cưỡng bức phải nói về các dự án chip trung tâm dữ liệu nội bộ của mình trên các phương tiện truyền thông công cộng, cô nói.

"Nếu bạn nhìn vào những gì chúng tôi đang chia sẻ - hai chip đầu tiên mà chúng tôi phát triển - chắc chắn sẽ cung cấp một chút cái nhìn về những gì chúng tôi đang làm nội bộ," Bjorlin cho biết. "Chúng tôi chưa phải quảng cáo điều này, và chúng tôi không cần phải quảng cáo điều này, nhưng bạn biết, thế giới quan tâm."

Phó chủ tịch công nghệ của Meta Aparna Ramani cho biết phần cứng mới của công ty được phát triển để hoạt động hiệu quả với phần mềm PyTorch tự chế của mình, là một trong những công cụ phổ biến nhất được sử dụng bởi các nhà phát triển bên thứ ba để tạo ra các ứng dụng trí tuệ nhân tạo.

Phần cứng mới này sẽ được sử dụng để cung cấp năng lượng cho các tác vụ liên quan đến thế giới ảo như thực tế ảo và thực tế tăng cường, cũng như lĩnh vực trí tuệ nhân tạo đang còn nổi lên, mà đại trà chỉ đề cập đến phần mềm trí tuệ nhân tạo có thể tạo ra văn bản, hình ảnh và video thuyết phục. Ramani cũng cho biết Meta đã phát triển một trợ lý mã khóa được trang bị trí tuệ nhân tạo sinh, giúp cho nhân viên phát triển của công ty dễ dàng tạo và vận hành phần mềm. Trợ lý mới tương tự như công cụ GitHub Copilot của Microsoft được phát hành vào năm 2021 với sự giúp đỡ từ công ty khởi nghiệp AI OpenAI.

Ngoài ra, Meta cho biết hoàn thành giai đoạn hai, hay phần xây dựng cuối cùng, của siêu tính toán của họ được đặt tên là Research SuperCluster, hay RSC, được đưa ra chi tiết của công ty năm ngoái. Meta đã sử dụng siêu tính toán, chứa 16.000 GPU Nvidia A100, để huấn luyện mô hình ngôn ngữ LLaMA của công ty, ngoài những mục đích khác.

Ramani cho biết Meta vẫn tiếp tục hành động theo niềm tin của họ rằng họ nên đóng góp vào các công nghệ mã nguồn mở và nghiên cứu trí tuệ nhân tạo để đưa ngành công nghệ đến mức độ cao mới. Công ty đã tiết lộ rằng mô hình ngôn ngữ LLaMA lớn nhất của họ, LLaMA 65B, chứa 65 tỷ thông số và đã được đào tạo trên 1,4 tỷ mã thông tin, được sử dụng để đào tạo trí tuệ nhân tạo.

Các công ty như OpenAI và Google chưa tiết lộ những thông số tương tự cho các mô hình ngôn ngữ lớn của họ, mặc dù CNBC đã báo cáo rằng tuần trước mô hình PaLM 2 của Google được đào tạo trên 3,6 tỷ mã thông tin và chứa 340 tỷ thông số.

Không giống như các công ty khác, Meta công bố mô hình ngôn ngữ LLaMA của họ để các nhà nghiên cứu có thể học hỏi từ công nghệ. Tuy nhiên, mô hình ngôn ngữ LLaMA sau đó đã bị rõ ràng tiết lộ cho công chúng rộng, dẫn đến nhiều nhà phát triển xã hội tìm cách xây dựng các ứng dụng được lấy ý tưởng từ công nghệ này.

Ramani cho biết Meta đang "tiếp tục suy nghĩ về tất cả các hợp tác mã nguồn mở của chúng tôi, và chắc chắn, tôi muốn lặp lại rằng triết lý của chúng tôi vẫn là khoa học mở và hợp tác vượt qua giới hạn."

Xem thêm: Tín hiệu tích cực từ A.I. đổi mới y tế trên toàn cầu.

Meta lần đầu tiên công bố những viên chip trí tuệ nhân tạo của mình.

Tin AI