Mark Zuckerberg đã thông báo với thế giới vào tháng 10 năm 2021 rằng ông sẽ đổi tên Facebook thành Meta khi công ty đẩy mạnh đến thế giới ảo. Meta đã xây dựng các chip máy tính tùy chỉnh để giúp cho các nhiệm vụ trí tuệ nhân tạo và xử lý video, và lần đầu tiên đã công bố chúng cho công chúng trong tuần này trước một sự kiện trực tuyến vào thứ Năm để thảo luận về các khoản đầu tư cơ sở hạ tầng trí tuệ nhân tạo của họ.

Các nhà đầu tư đã chăm chú theo dõi các khoản đầu tư của Meta vào trí tuệ nhân tạo và phần cứng trung tâm dữ liệu liên quan khi công ty bắt đầu một “năm hiệu quả” bao gồm ít nhất 21.000 việc làm giảm và cắt giảm chi phí lớn.

Mặc dù việc thiết kế và xây dựng chip máy tính của riêng mình là tốn kém, Phó Chủ tịch cơ sở hạ tầng Alexis Bjorlin cho biết Meta tin rằng hiệu suất cải tiến sẽ xứng đáng với đầu tư. Công ty cũng đã đang cải thiện thiết kế trung tâm dữ liệu của mình để tập trung hơn vào các kỹ thuật tiết kiệm năng lượng, chẳng hạn như làm mát bằng chất lỏng, nhằm giảm nhiệt dư thừa.

Một trong các chip máy tính mới, Meta Scalable Video Processor, hoặc MSVP, được sử dụng để xử lý và truyền video đến người dùng trong khi giảm yêu cầu năng lượng. Bjorlin nói rằng "không có gì có sẵn trên thị trường" có thể xử lý và giao 4 tỷ video một ngày một cách hiệu quả như Meta mong muốn.

Bộ xử lý khác là bộ xử lý đầu tiên trong gia đình Meta Training and Inference Accelerator, hoặc MTIA, của các chip cụ thể được thiết kế để giúp đỡ cho các tác vụ cụ thể của trí tuệ nhân tạo. Chip MTIA mới cụ thể xử lý "suy luận," tức là khi một mô hình trí tuệ nhân tạo đã được huấn luyện trước đó đưa ra dự đoán hoặc hành động.

Bjorlin cho biết chip suy luận trí tuệ nhân tạo mới giúp cho một số thuật toán gợi ý của Meta được sử dụng để hiển thị nội dung và quảng cáo trong các bản tin của mọi người. Cô từ chối đáp ứng về người sản xuất chip, nhưng một bài đăng trên blog cho hay bộ xử lý được "sản xuất bằng quy trình 7nm của TSMC," cho thấy ông gigant Chip Đài Loan đang sản xuất công nghệ này.

Cô nói rằng Meta có một "lộ trình đa thế hệ" cho gia đình chip trí tuệ nhân tạo của mình bao gồm các bộ xử lý được sử dụng cho các tác vụ huấn luyện mô hình trí tuệ nhân tạo, nhưng cô từ chối cung cấp chi tiết ngoài chip suy luận mới. Trước đây, Reuters đã đưa tin rằng Meta đã hủy một dự án chip suy luận trí tuệ nhân tạo và bắt đầu dự án khác được dự kiến ​​sẽ ra mắt vào khoảng năm 2025, nhưng Bjorlin từ chối bình luận về báo cáo đó.

Bởi vì Meta không kinh doanh dịch vụ đám mây như các công ty khác bao gồm Google công ty mẹ Alphabet hoặc Microsoft, nên công ty không cảm thấy cưỡng bức phải nói về các dự án chip trung tâm dữ liệu nội bộ của mình trên các phương tiện truyền thông công cộng, cô nói.

"Nếu bạn nhìn vào những gì chúng tôi đang chia sẻ - hai chip đầu tiên mà chúng tôi phát triển - chắc chắn sẽ cung cấp một chút cái nhìn về những gì chúng tôi đang làm nội bộ," Bjorlin cho biết. "Chúng tôi chưa phải quảng cáo điều này, và chúng tôi không cần phải quảng cáo điều này, nhưng bạn biết, thế giới quan tâm."

Phó chủ tịch công nghệ của Meta Aparna Ramani cho biết phần cứng mới của công ty được phát triển để hoạt động hiệu quả với phần mềm PyTorch tự chế của mình, là một trong những công cụ phổ biến nhất được sử dụng bởi các nhà phát triển bên thứ ba để tạo ra các ứng dụng trí tuệ nhân tạo.

Phần cứng mới này sẽ được sử dụng để cung cấp năng lượng cho các tác vụ liên quan đến thế giới ảo như thực tế ảo và thực tế tăng cường, cũng như lĩnh vực trí tuệ nhân tạo đang còn nổi lên, mà đại trà chỉ đề cập đến phần mềm trí tuệ nhân tạo có thể tạo ra văn bản, hình ảnh và video thuyết phục. Ramani cũng cho biết Meta đã phát triển một trợ lý mã khóa được trang bị trí tuệ nhân tạo sinh, giúp cho nhân viên phát triển của công ty dễ dàng tạo và vận hành phần mềm. Trợ lý mới tương tự như công cụ GitHub Copilot của Microsoft được phát hành vào năm 2021 với sự giúp đỡ từ công ty khởi nghiệp AI OpenAI.

Ngoài ra, Meta cho biết hoàn thành giai đoạn hai, hay phần xây dựng cuối cùng, của siêu tính toán của họ được đặt tên là Research SuperCluster, hay RSC, được đưa ra chi tiết của công ty năm ngoái. Meta đã sử dụng siêu tính toán, chứa 16.000 GPU Nvidia A100, để huấn luyện mô hình ngôn ngữ LLaMA của công ty, ngoài những mục đích khác.

Ramani cho biết Meta vẫn tiếp tục hành động theo niềm tin của họ rằng họ nên đóng góp vào các công nghệ mã nguồn mở và nghiên cứu trí tuệ nhân tạo để đưa ngành công nghệ đến mức độ cao mới. Công ty đã tiết lộ rằng mô hình ngôn ngữ LLaMA lớn nhất của họ, LLaMA 65B, chứa 65 tỷ thông số và đã được đào tạo trên 1,4 tỷ mã thông tin, được sử dụng để đào tạo trí tuệ nhân tạo.

Các công ty như OpenAI và Google chưa tiết lộ những thông số tương tự cho các mô hình ngôn ngữ lớn của họ, mặc dù CNBC đã báo cáo rằng tuần trước mô hình PaLM 2 của Google được đào tạo trên 3,6 tỷ mã thông tin và chứa 340 tỷ thông số.

Không giống như các công ty khác, Meta công bố mô hình ngôn ngữ LLaMA của họ để các nhà nghiên cứu có thể học hỏi từ công nghệ. Tuy nhiên, mô hình ngôn ngữ LLaMA sau đó đã bị rõ ràng tiết lộ cho công chúng rộng, dẫn đến nhiều nhà phát triển xã hội tìm cách xây dựng các ứng dụng được lấy ý tưởng từ công nghệ này.

Ramani cho biết Meta đang "tiếp tục suy nghĩ về tất cả các hợp tác mã nguồn mở của chúng tôi, và chắc chắn, tôi muốn lặp lại rằng triết lý của chúng tôi vẫn là khoa học mở và hợp tác vượt qua giới hạn."

Xem thêm: Tín hiệu tích cực từ A.I. đổi mới y tế trên toàn cầu.