DES MOINES, Iowa — Việc đầu tư xây dựng một sản phẩm trí tuệ nhân tạo như ChatGPT có thể khó khăn trong việc đo lường.

Tuy nhiên, OpenAI được hậu thuẫn bởi Microsoft đã cần một yếu tố để triển khai công nghệ của mình, đó là nước, được kéo từ vùng thuộc lưu vực Raccoon và sông Des Moines ở trung tâm tiểu bang Iowa để làm mát một siêu máy tính cực mạnh trong quá trình giảng dạy hệ thống trí tuệ nhân tạo của mình cách để mô phỏng được việc viết của con người.

Trong cuộc đua để khai thác "cơn sốt" công nghệ AI sinh sản, các nhà phát triển công nghệ hàng đầu bao gồm Microsoft, OpenAI và Google đã thừa nhận rằng nhu cầu ngày càng tăng về công cụ AI của họ đồng nghĩa với việc tăng chi phí đáng kể, từ việc sử dụng bộ vi xử lý đắt tiền đến việc tiêu thụ nước tăng lên.

Nhưng họ thường giữ bí mật về các chi tiết. Ít người biết tại Iowa rằng đó là nơi sinh sản của mô hình ngôn ngữ lớn nhất, GPT-4, của OpenAI trước khi một nhà điều hành cao cấp của Microsoft nói trong một bài phát biểu rằng "nó được tạo ra hoàn toàn gần cây ngô phía Tây Des Moines".

Xây dựng một mô hình ngôn ngữ lớn yêu cầu phân tích các mẫu trong một kho dữ liệu lớn bao gồm các đoạn văn viết của con người. Tất cả những tính toán đó tiêu tốn một lượng điện lớn và tạo ra nhiều nhiệt. Để giữ nó mát mẻ trong những ngày nóng, các trung tâm dữ liệu cần bơm nước vào - thường là vào một tháp làm mát bên ngoài các tòa nhà kho dữ liệu cỡ nhà kho.

Trong báo cáo môi trường mới nhất, Microsoft tiết lộ rằng lượng nước tiêu thụ trên toàn cầu của họ tăng 34% từ 2021 đến 2022 (gần 1,7 tỷ gallon, tương đương hơn 2.500 hồ bơi Olympic), một mức tăng đột biến so với các năm trước được các nhà nghiên cứu bên ngoài liên kết với nghiên cứu AI của Microsoft.

"Có thể nói đa số sự tăng trưởng đến từ AI," bao gồm "việc đầu tư mạnh mẽ vào AI sinh sản và cộng tác với OpenAI," Shaolei Ren, một nhà nghiên cứu tại Đại học California, Riverside, người đã cố gắng tính toán tác động môi trường của các sản phẩm AI của như ChatGPT nói.

Trong một bài báo sẽ được công bố vào cuối năm nay, nhóm nghiên cứu của Ren ước tính rằng ChatGPT tiêu thụ khoảng 500 ml nước (gần bằng một chai nước 16 ounce) mỗi lần bạn đặt câu hỏi hoặc chuỗi các câu hỏi từ 5 đến 50. Mức độ này thay đổi tùy thuộc vào vị trí của các máy chủ và mùa trong năm. Ước tính này bao gồm việc sử dụng nước gián tiếp mà các công ty không đo được - như là sử dụng nước để làm mát các nhà máy điện cung cấp năng lượng cho các trung tâm dữ liệu.

"Hầu hết mọi người không biết về việc sử dụng nguồn tài nguyên dưới cơ ChatGPT," Shaolei Ren nói. "Nếu bạn không nhận biết được việc sử dụng nguồn tài nguyên, thì không có cách nào chúng tôi có thể giúp bảo vệ tài nguyên."

Google đưa ra một báo cáo về việc sử dụng nước tăng 20% trong cùng kỳ, mà Ren cũng chủ yếu cho rằng là do công việc AI của họ. Mức độ tăng của Google không đồng đều - nó ổn định ở Oregon nơi việc tiêu thụ nước đã thu hút sự chú ý công chúng, trong khi tăng gấp đôi ở ngoại ô Las Vegas. Nó cũng tăng cao ở Iowa, kéo nhiều nước khoáng để phục vụ trung tâm dữ liệu Council Bluffs hơn bất kỳ địa điểm nào khác.

Trong phản hồi câu hỏi từ The Associated Press, Microsoft cho biết trong một tuyên bố tuần này rằng họ đang đầu tư vào nghiên cứu để đo lường hệ thống trí tuệ nhân tạo tiêu thụ năng lượng và gây ô nhiễm carbon "và đồng thời nghiên cứu cách làm cho các hệ thống lớn hiệu quả hơn, cả trong quá trình huấn luyện lẫn ứng dụng."

"Tuyến bố của công ty nói rằng chúng tôi sẽ tiếp tục theo dõi khí thải của mình, tăng cường tiến độ trong việc sử dụng năng lượng sạch để cung cấp năng lượng cho các trung tâm dữ liệu, mua năng lượng tái tạo và các nỗ lực khác để đạt được mục tiêu bền vững của chúng tôi là tiêu thụ carbon âm, nước dương và không sản phẩm thải vào năm 2030", tuyến bố của công ty nói.

OpenAI cũng đồng ý với những bình luận đó trong tuyên bố riêng của mình vào thứ Sáu, nói rằng họ đang cân nhắc kỹ lưỡng về việc sử dụng sức mạnh tính toán.

"Chúng tôi hiểu rằng việc huấn luyện các mô hình lớn có thể tiêu tốn nhiều năng lượng và nước" và đang cố gắng cải thiện hiệu suất, tuyên bố đó nói.

Microsoft đã thực hiện đầu tư đầu tiên 1 tỷ USD vào OpenAI có trụ sở tại San Francisco vào năm 2019, hơn hai năm trước khi công ty mới giới thiệu ChatGPT và gây sự quan tâm trên toàn thế giới về tiến bộ trí tuệ nhân tạo. Như một phần của thỏa thuận, ông lớn phần mềm sẽ cung cấp sức mạnh tính toán cần thiết để huấn luyện các mô hình trí tuệ nhân tạo.

Để thực hiện ít nhất một phần công việc đó, hai công ty đã nhìn đến West Des Moines, Iowa, một thành phố với 68.000 dân nơi Microsoft đã tích lũy các trung tâm dữ liệu để cung cấp dịch vụ cloud computing trong hơn một thập kỷ. Trung tâm dữ liệu thứ tư và thứ năm của họ sẽ được mở ở đó vào cuối năm nay.

"Chúng đang xây dựng chúng càng nhanh càng tốt", Steve Gaer, người đã từng là thị trưởng thành phố khi Microsoft đến đây, nói. Gaer cho biết công ty đã được thu hút bởi cam kết của thành phố trong việc xây dựng cơ sở hạ tầng công cộng và đã đóng góp một số tiền "ấn tượng" thông qua việc nộp thuế để hỗ trợ đầu tư đó.

"Nhưng phải nói là họ khá kín tiếng về những gì họ đang làm ở đó", ông thêm.

Microsoft đầu tiên cho biết rằng họ đang phát triển một trong những siêu máy tính mạnh nhất thế giới cho OpenAI vào năm 2020, từ chối tiết lộ vị trí ban đầu đến AP trong thời điểm đó nhưng mô tả nó như một "hệ thống duy nhất" với hơn 285.000 nhân tử thông thường và 10.000 bộ xử lý đồ họa - loại vi mạch trở nên quan trọng đối với công việc trí tuệ nhân tạo.

Các chuyên gia đã nói rằng việc "tiền huấn luyện" một mô hình trí tuệ nhân tạo tại một địa điểm duy nhất có thể hợp lý do lượng dữ liệu lớn cần được chuyển đổi giữa nhân tử tính toán.

Đến cuối tháng 5, Tổng giám đốc Microsoft - Brad Smith đã tiết lộ rằng họ đã xây dựng "trung tâm dữ liệu siêu máy tính AI tiên tiến" ở Iowa chỉ để giúp OpenAI huấn luyện mô hình thế hệ thứ tư của mình, GPT-4. Mô hình hiện tại là nguồn cung cấp cho các phiên bản cao cấp của ChatGPT và một số sản phẩm của Microsoft và đã tăng tốc cuộc tranh luận về việc kiểm soát các rủi ro xã hội của Trí tuệ Nhân tạo.

"Đó là do những kỹ sư phi thường ở California tạo ra, nhưng nó thực sự được tạo ra ở Iowa", Smith nói.

Một cách nào đó, West Des Moines là một nơi có hiệu quả tương đối cho việc đào tạo một hệ thống trí tuệ nhân tạo mạnh mẽ, đặc biệt là so với các trung tâm dữ liệu của Microsoft ở Arizona tiêu thụ nhiều nước hơn cho cùng nhu cầu tính toán.

Nếu bạn đang phát triển các mô hình trí tuệ nhân tạo trong Microsoft, thì bạn nên lên lịch đào tạo của mình tại Iowa thay vì tại Arizona," Ren nói. "Về mặt đào tạo, không có sự khác biệt. Về mặt tiêu thụ nước hoặc tiêu thụ năng lượng, có một sự khác biệt lớn."

Trong hầu hết thời gian, thời tiết ở Iowa đủ mát để Microsoft sử dụng không khí bên ngoài để giữ cho siêu máy tính hoạt động đúng cách và xả nhiệt ra khỏi tòa nhà. Chỉ khi nhiệt độ vượt quá 29.3 độ Celsius (khoảng 85 độ Fahrenheit), công ty mới sử dụng nước, theo thông tin công khai của công ty.

Điều này vẫn có thể tốn rất nhiều nước, đặc biệt là vào mùa hè. Vào tháng 7 năm 2022, tháng trước khi OpenAI tuyên bố đã hoàn thành quá trình đào tạo GPT-4, Microsoft đã bơm khoảng 11.5 triệu gallon nước vào cụm trung tâm dữ liệu Iowa của họ, theo thông tin từ West Des Moines Water Works. Điều đó tương đương với khoảng 6% tổng lượng nước được sử dụng trong khu vực này, nơi cung cấp nước uống cho cư dân thành phố.

Năm 2022, một tài liệu từ West Des Moines Water Works cho biết họ và chính quyền thành phố chỉ sẽ xem xét các dự án trung tâm dữ liệu trong tương lai từ Microsoft nếu những dự án đó có thể "chứng minh và áp dụng công nghệ để giảm mức tiêu thụ nước cao đi đáng kể" nhằm bảo vệ nguồn cung nước cho nhu cầu sinh hoạt và thương mại khác.

Microsoft cho biết vào ngày thứ Năm rằng họ đang làm việc trực tiếp với West Des Moines Water Works để giải quyết phản hồi. Trong một tuyên bố bằng văn bản, West Des Moines Water Works cho biết công ty đã là một đối tác tốt và đã cùng với các quan chức địa phương để giảm vết chân nước của mình trong khi vẫn đáp ứng nhu cầu của mình.

O’Brien báo cáo từ Providence, Rhode Island.

Associted Press và OpenAI có một thỏa thuận cấp phép cho phép phần trong kho lưu trữ văn bản của AP được sử dụng để đào tạo mô hình ngôn ngữ lớn của công ty công nghệ. AP nhận được một khoản phí không tiết lộ cho việc sử dụng nội dung của mình.