Matt O’Brien và Hannah Fingerhutt
Chi phí xây dựng một sản phẩm trí tuệ nhân tạo như ChatGPT có thể khó đo đạc.
Nhưng một điều mà OpenAI thông qua việc hỗ trợ từ Microsoft cần cho công nghệ của mình là lượng nước dồi dào, được lấy từ hệ thống dòng sông Raccoon và Des Moines thuộc trung tâm bang Iowa để làm mát một siêu máy tính mạnh mẽ khi nó giúp cho hệ thống trí tuệ nhân tạo của nó học cách bắt chước viết của con người.
Khi họ đua nhau để tận dụng cơn điên của trí tuệ nhân tạo sáng tạo, các nhà phát triển công nghệ hàng đầu bao gồm Microsoft, OpenAI và Google đã công nhận rằng nhu cầu ngày càng tăng về các công cụ trí tuệ nhân tạo của họ đi đôi với một chi phí đáng kể, từ các vi mạch bán dẫn đắt tiền cho đến việc tiêu thụ nước tăng lên.
Nhưng họ thường giữ bí mật về chi tiết. Ít người tại Iowa biết về hiện trạng của nó như một điểm sinh ra mô hình ngôn ngữ lớn và tiên tiến nhất của OpenAI, GPT-4, trước khi một giám đốc cấp cao của Microsoft tuyên bố trong một bài phát biểu rằng "nó đã được tạo ra bên cạnh cánh đồng ngô phía tây của Des Moines".
Xây dựng một mô hình ngôn ngữ lớn đòi hỏi phân tích mẫu văn bản viết bởi con người trên một kho lớn. Toàn bộ quá trình tính toán đó tiêu tốn rất nhiều điện năng và tạo ra nhiều nhiệt. Để giữ nó mát mẻ trong những ngày nóng, các trung tâm dữ liệu cần bơm nước vào - thường là vào một tháp làm mát bên ngoài những toà nhà kích thước nhà kho của chúng.
Trong báo cáo môi trường mới nhất của mình, Microsoft tiết lộ rằng nhu cầu tiêu thụ nước toàn cầu của họ đã tăng 34% từ năm 2021 đến năm 2022 (gần 1,7 tỷ gallon, tương đương hơn 2.500 hồ bơi Olympic), một sự tăng mạnh so với các năm trước do các nhà nghiên cứu bên ngoài liên kết với nghiên cứu trí tuệ nhân tạo của họ.
"Rất công bằng khi nói rằng phần lớn sự tăng trưởng là do trí tuệ nhân tạo", bao gồm "đầu tư nặng về trí tuệ nhân tạo sáng tạo và mối hợp tác với OpenAI", nhà nghiên cứu Shaolei Ren tại Đại học California Riverside cho biết. Ông đã cố gắng tính toán tác động môi trường của các sản phẩm trí tuệ nhân tạo sáng tạo như ChatGPT.
Trong một bài báo chuẩn bị xuất bản trong năm nay, nhóm nghiên cứu của Ren ước tính rằng ChatGPT sử dụng 500 milliliters nước (gần bằng một chai nước có dung tích 16 ounce) mỗi khi bạn hỏi nó một loạt câu hỏi từ 5 đến 50. Mức độ thay đổi tùy thuộc vào vị trí của các máy chủ và mùa. Ước tính này bao gồm sử dụng nước gián tiếp mà các công ty không đo - ví dụ như làm mát nhà máy điện cung cấp điện cho các trung tâm dữ liệu.
"Hầu như mọi người không nhận ra việc sử dụng tài nguyên nằm sau ChatGPT", Ren nói. "Nếu bạn không nhận ra việc sử dụng tài nguyên, thì chúng ta không thể giúp bảo vệ tài nguyên được."
Google báo cáo tăng 20% trong việc sử dụng nước trong cùng khoảng thời gian, mà Ren cũng phần lớn cho rằng đó là do công việc trí tuệ nhân tạo của họ. Sự tăng của Google không đồng đều - nó đã tăng ổn định ở Oregon nơi việc sử dụng nước của họ thu hút sự chú ý công chúng, trong khi gấp đôi bên ngoài Las Vegas. Iowa cũng rất khát nước, tiêu thụ nước sinh hoạt tại các trung tâm dữ liệu Council Bluffs của Google nhiều hơn bất kỳ nơi nào khác.
Trả lời câu hỏi từ The Associated Press, Microsoft đã cho biết trong một tuyên bố tuần này rằng họ đang đầu tư vào nghiên cứu để đo lường tác động về năng lượng và carbon của trí tuệ nhân tạo "đồng thời làm việc để làm cho các hệ thống lớn hiệu quả hơn, cả về công cuộc đào tạo và ứng dụng".
"Tuyên bố của công ty nói rằng chúng tôi sẽ tiếp tục theo dõi khí thải của mình, đẩy mạnh tiến trình trong khi tăng sử dụng năng lượng sạch để cung cấp cho trung tâm dữ liệu, mua năng lượng tái tạo và các nỗ lực khác để đạt được mục tiêu bền vững của chúng tôi là trở thành tích cực về carbon, tích cực về nước và không chất thải vào năm 2030", tuyên bố của công ty cho biết.
OpenAI cũng nhấn mạnh những ý kiến đó trong tuyên bố riêng của mình vào thứ Sáu, nói rằng họ đang cân nhắc "quan điểm cụ thể" về việc sử dụng sức mạnh tính toán.
"Chúng tôi nhận thức rằng việc đào tạo mô hình lớn có thể tiêu tốn năng lượng và nước" và làm việc để cải thiện hiệu suất, tuyên bố nói.
Microsoft đã thực hiện khoản đầu tư đầu tiên trị giá 1 tỷ USD vào OpenAI đặt tại San Francisco vào năm 2019, hơn hai năm trước khi startup giới thiệu ChatGPT và gây được sự ngưỡng mộ trên toàn thế giới với các tiến bộ của trí tuệ nhân tạo. Theo thỏa thuận, công ty phần mềm lớn sẽ cung cấp sức mạnh tính toán cần thiết để đào tạo các mô hình trí tuệ nhân tạo.
Để thực hiện ít nhất một phần công việc đó, hai công ty đã nhìn đến thành phố West Des Moines, bang Iowa, nơi Microsoft đã tụ tập các trung tâm dữ liệu để cung cấp dịch vụ điện toán đám mây của mình trong hơn một thập kỷ. Trung tâm dữ liệu thứ tư và thứ năm của Microsoft dự kiến sẽ mở cửa ở đó vào cuối năm nay.
"Chúng xây dựng chúng càng nhanh càng tốt", Steve Gaer nói, ông là thị trưởng thành phố khi Microsoft đến đây. Gaer nói rằng công ty đã hâm mộ cam kết của thành phố trong việc xây dựng cơ sở hạ tầng công cộng và góp một số tiền "ấn tượng" thông qua việc đóng thuế để hỗ trợ đầu tư đó.
"Tuy nhiên, biết đâu, họ khá kín kẽ về những gì đang làm ở ngoại ô đó", ông thêm.
Microsoft lần đầu tiên nói rằng họ đang phát triển một trong những siêu máy tính mạnh nhất thế giới cho OpenAI vào năm 2020, từ chối tiết lộ vị trí của nó cho AP vào thời điểm đó nhưng mô tả nó như một "hệ thống duy nhất" với hơn 285.000 nhân nhân tạo bình thường và 10.000 bộ xử lý đồ họa - một loại vi mạch quan trọng đối với công việc trí tuệ nhân tạo.
Các chuyên gia đã nói rằng có ý nghĩa khi "tiền huấn luyện" một mô hình trí tuệ nhân tạo tại một địa điểm duy nhất do lượng dữ liệu lớn cần được truyền giữa các nhân nhân tạo.
Cho đến cuối tháng 5, Tổng giám đốc Microsoft, Brad Smith, mới tiết lộ rằng họ đã xây dựng "trung tâm dữ liệu siêu máy tính trí tuệ nhân tạo tiên tiến" tại Iowa, chỉ để cho phép OpenAI đào tạo thế hệ thứ tư của mô hình GPT, đã trở thành nguồn cung cấp cho phiên bản cao cấp của ChatGPT và một số sản phẩm của Microsoft và đã làm tăng tốc một cuộc tranh luận về việc kiềm chế các rủi ro xã hội của trí tuệ nhân tạo.
"Đó là thiết kế bởi những kỹ sư xuất sắc ở California, nhưng thật sự nó đã được tạo ra ở Iowa", Brad Smith nói.
Một số điểm, West Des Moines là nơi tương đối hiệu quả để đào tạo một hệ thống trí tuệ nhân tạo mạnh mẽ, đặc biệt so với các trung tâm dữ liệu của Microsoft ở Arizona tiêu thụ nước nhiều hơn nhiều để đáp ứng nhu cầu tính toán tương tự.
"Nên nếu bạn đang phát triển mô hình trí tuệ nhân tạo trong Microsoft, bạn nên lên kế hoạch huấn luyện ở Iowa thay vì ở Arizona", Ren nói. "Về mặt đào tạo, không có sự khác biệt. Về mặt tiêu thụ nước hoặc năng lượng, có sự khác biệt lớn".
Trong suốt phần lớn năm, thời tiết ở Iowa đủ mát để Microsoft sử dụng không khí bên ngoài để duy trì hoạt động ổn định của siêu máy tính và xả nhiệt ra khỏi tòa nhà. Chỉ khi nhiệt độ vượt quá 29.3 độ Celsius (khoảng 85 độ Fahrenheit), Microsoft mới sử dụng nước, như công ty đã nêu trong một thông báo công khai.
Điều đó vẫn có thể tiêu tốn rất nhiều nước, đặc biệt là vào mùa hè. Trong tháng 7 năm 2022, tháng trước khi OpenAI tuyên bố đã hoàn thành quá trình huấn luyện GPT-4, Microsoft đã vận chuyển khoảng 11.5 triệu gallon nước vào cụm trung tâm dữ liệu Iowa của mình, theo thông tin từ West Des Moines Water Works. Điều đó tương đương khoảng 6% tổng lượng nước được sử dụng trong quận, nơi cung cấp nước uống cho người dân thành phố.
Năm 2022, một tài liệu từ West Des Moines Water Works cho biết, cơ quan này và chính quyền thành phố "sẽ chỉ xem xét các dự án trung tâm dữ liệu trong tương lai" từ Microsoft nếu những dự án đó có thể "chứng minh và triển khai công nghệ giảm mức sử dụng nước cực đỉnh từ mức hiện tại" nhằm bảo đảm nguồn cung nước cho nhu cầu sinh hoạt của cư dân và nhu cầu kinh doanh khác.
Microsoft cho biết ngày thứ Năm rằng họ đang làm việc trực tiếp với West Des Moines Water Works để giải quyết phản hồi của họ. Trong một tuyên bố bằng văn bản, West Des Moines Water Works cho biết công ty đã là một đối tác tốt và đã cùng với các quan chức địa phương để giảm lượng nước tiêu tốn trong khi vẫn đáp ứng nhu cầu của mình.
O'Brien đưa tin từ Providence, Rhode Island.
The Associated Press và OpenAI có một thỏa thuận cấp phép cho phép sử dụng một phần trong kho văn bản của AP để huấn luyện mô hình ngôn ngữ lớn của công ty công nghệ này. AP nhận một khoản phí không được tiết lộ cho việc sử dụng nội dung của mình.