Phóng to / Một bức ảnh về vi mạch Microsoft Azure Maia 100 đã được tác giả chỉnh sửa với những chấm màu để trông như AI đang bùng phát từ cấu trúc silic của nó. Vào ngày thứ Tư tại hội nghị Microsoft Ignite, Microsoft thông báo về hai chip tùy chỉnh được thiết kế để tăng tốc công việc AI nội bộ thông qua dịch vụ đám mây Azure của mình: Microsoft Azure Maia 100 AI Accelerator và Microsoft Azure Cobalt 100 CPU.

Microsoft đã thiết kế Maia đặc biệt để chạy các mô hình ngôn ngữ lớn như GPT 3.5 Turbo và GPT-4, là cơ sở của dịch vụ Azure OpenAI và Microsoft Copilot (trước đây là Bing Chat). Maia có 105 tỷ transistor được sản xuất trên quy trình TSMC 5-nm. Trong khi đó, Cobalt là một CPU dựa trên ARM với 128 nhân, được thiết kế để thực hiện các nhiệm vụ tính toán thông thường như cung cấp nguồn cho Microsoft Teams. Microsoft không có kế hoạch để bán bất kỳ chip nào, chỉ sử dụng cho mục đích sử dụng nội bộ.

Như chúng ta đã biết trước đây, Microsoft muốn trở thành "công ty Copilot," và họ sẽ cần rất nhiều sức mạnh tính toán để đạt được mục tiêu đó. Theo Reuters, Microsoft và các công ty công nghệ khác đã gặp khó khăn với chi phí cao khi cung cấp dịch vụ AI có thể tốn gấp 10 lần so với các dịch vụ như công cụ tìm kiếm.

  • Một bức ảnh của vi xử lý Microsoft Azure Maia 100, được cung cấp bởi Microsoft.
  • Một bức ảnh của vi xử lý Microsoft Azure Cobalt 100, được cung cấp bởi Microsoft.

Trong bối cảnh khan hiếm vi xử lý đã làm tăng giá các GPU trí tuệ nhân tạo của Nvidia, một số công ty đã đang thiết kế hoặc xem xét việc thiết kế những chip gia tăng trí tuệ nhân tạo riêng của mình, bao gồm Amazon, OpenAI, IBM và AMD. Microsoft cũng cảm thấy cần phải làm một vi xử lý tùy chỉnh để đẩy dịch vụ của chính mình lên hàng đầu.

Theo thông báo trên blog của công ty, Microsoft viết: "Giống như việc xây dựng một ngôi nhà cho phép bạn kiểm soát mọi lựa chọn thiết kế và chi tiết, Microsoft coi việc thêm vi xử lý gốc như một cách để đảm bảo mọi yếu tố được tùy chỉnh cho các khối lượng công việc đám mây và trí tuệ nhân tạo của Microsoft." Sau đó, họ thêm một cách thơ mộng như một quảng cáo bánh quy: "Các vi xử lý sẽ được đặt gọn trong các bo mạch máy chủ tùy chỉnh, được đặt trong các tủ riêng phù hợp với các trung tâm dữ liệu của Microsoft hiện có. Phần cứng sẽ làm việc cùng với phần mềm - được thiết kế cùng nhau để mở ra các khả năng và cơ hội mới."

Đây không phải là lần đầu tiên Microsoft tham gia vào phát triển chip. Theo The Verge, công ty đã lâu nay đã hợp tác trong việc sản xuất vi xử lý cho các máy chơi trò chơi Xbox và cùng kỹ sư hợp tác trong việc tạo ra các chip cho dòng máy tính bảng Surface của mình.

Không một công ty công nghệ nào là đảo lẻ, và Microsoft cũng không phải là một ngoại lệ. Công ty dự định tiếp tục phụ thuộc vào vi xử lý của bên thứ ba, không chỉ vì sự cần thiết về nguồn cung mà còn để làm hài lòng mạng lưới phức tạp của các mối quan hệ kinh doanh. Microsoft viết: "Microsoft cũng sẽ thêm GPU Tensor Core H200 mới nhất của Nvidia vào hệ thống của mình vào năm tới để hỗ trợ xử lý dữ liệu mô hình lớn mà không làm tăng độ trễ." Điều này được đề cập đến GPU tính toán trí tuệ nhân tạo vừa được Nvidia thông báo gần đây.

Và nó cũng sẽ thêm máy ảo được tăng tốc bằng vi xử lý AMD MI300X vào Azure.

Vậy, hiệu suất của những con chip mới như thế nào? Microsoft chưa công bố các con số đo hiệu suất nhưng công ty này hình như rất hài lòng với tỷ lệ hiệu suất trên mỗi watt của những con chip này, đặc biệt là đối với Cobalt. "Kiến trúc và thực thi được thiết kế với hiệu quả về năng lượng trong tâm trí," Wes McCullough, phó chủ tịch phát triển sản phẩm phần cứng của Microsoft, nói trong một tuyên bố. "Chúng tôi đang sử dụng hiệu quả nhất các bóng bán dẫn trên silic. Nhân lên những lợi ích về hiệu quả trong các máy chủ trên toàn bộ trung tâm dữ liệu, nó cộng lên một con số khá lớn.