Để tạo ra các hình ảnh song song kèm theo bài luận của Allen Murabayashi, chúng tôi đã yêu cầu sáu nhiếp ảnh gia giành giải thưởng nhiếp ảnh Audubon năm 2023 miêu tả những bức ảnh của họ trong vài câu cho người không thể nhìn thấy hình ảnh. Với sự cho phép của họ, chúng tôi đã cung cấp các mô tả này vào một chương trình tạo hình ảnh trí tuệ nhân tạo phổ biến. Kết quả, được hiển thị cùng với bản gốc, dựa trên một lời gợi ý duy nhất. - Biên tập viên

Năm 2012, cảnh một con hổ Bengal nguy cấp bị mắc kẹt trên một chiếc thuyền cứu sinh đã thu hút sự chú ý của người xem. Bộ phim Chuyện Cuộc Sống của đạo diễn Ang Lee rõ ràng là tiểu thuyết, nhưng nhiều người xem không hiểu rằng phần lớn những cảnh hổ đều được tạo bởi máy tính. Trăm ngàn nghệ sĩ đã làm việc trong nhiều năm để tạo ra các hiệu ứng hình ảnh tiên tiến.

Mười năm sau, những bức ảnh đẹp lung linh của một con báo tuyết trên núi Everest đã trở thành hiện tượng trên mạng. Khi các phương tiện truyền thông đưa tin mà không suy nghĩ kỹ càng, những chuyên gia của Alpine Mag đã tiết lộ một số bức ảnh như là sự kết hợp - những bức tranh tỉ mỉ từ các bức ảnh có sẵn thay vì những khoảnh khắc thực sự.

Các bức ảnh đã được sắp đặt, kết hợp và sử dụng kỹ thuật số đỉnh cao không mới lạ đối với nhiếp ảnh, đặc biệt là nếu nó liên quan đến động vật hoang dã. Tuy nhiên, những ảo ảnh này vẫn đòi hỏi lao động và chuyên môn của con người để tạo ra được sự thuyết phục. Trong năm qua, công nghệ trí tuệ nhân tạo "toàn diện" đã giảm đáng kể sự cần thiết cho sự nỗ lực đó. Là một doanh nhân công nghệ trong ngành nhiếp ảnh và cựu giám khảo giải thưởng nhiếp ảnh Audubon, tôi đã bị sốc bởi sự biến đổi nhanh chóng.

Bất cứ điều gì bạn có thể giải thích bằng lời nói, các chương trình có sẵn công khai đều có thể biến nó thành hình ảnh, dù là một hình ảnh thực tế hay một tác phẩm nghệ thuật khác lai. Chỉ cần nhập một lời gợi ý nào đó, dù có bị lệch hoặc xa vời đến đâu - "báo tuyết trên Everest" hoặc thậm chí là "chim Gõ kiến chân trắng tại trung tâm Thành phố" - và các phần mềm như DALL-E 2, Stable Diffusion và Midjourney sẽ nhanh chóng tạo ra một hình ảnh tổng hợp theo phong cách hoặc chi tiết mà bạn chỉ định. Video cũng không xa.

Những hệ thống này vẫn có giới hạn về độ giống nhằm mô phỏng, thường tạo ra những hiệu ứng kỳ dị và kỳ quặc. Để tạo hình ảnh từ từng từ, các mô hình trí tuệ nhân tạo phân tích và học từ hàng triệu hoặc tỷ lệ hình ảnh có chú thích cụ thể. Một số người sử dụng cơ sở dữ liệu nguồn mở hoặc ảnh được lấy trộm từ internet, trong khi những người khác không minh bạch về nguồn gốc tài liệu. Dù thế nào, khi các dữ liệu đào tạo này cạn dần hoặc không được đa dạng hóa đầy đủ - như có vẻ đã xảy ra đối với nhiều loài chim - kết quả sẽ khác nhau. Trong các thử nghiệm của mình, Midjourney gặp khó khăn trong việc tạo ra mỏ cong tinh tế của chim ƯI, một loài chim mật bị đe dọa ở Hawai'i. Mỗi tháng, tuy nhiên, các mô hình trí tuệ nhân tạo toàn diện đang cải thiện khả năng tạo hình ảnh và nghệ thuật, cũng như viết bài, viết nhạc, đưa ra công thức nấu ăn và mã nguồn máy tính. Những bước nhảy đầy táo bạo này đang buộc nhiều ngành công nghiệp phải đối mặt với những khủng hoảng tồn tại.

Trong nhiếp ảnh, các sự chuyển động công nghệ đó đã to lớn với quá khứ. Ví dụ, vào đầu những năm 2000, những người yêu thích động vật hoang dã với máy ảnh DSLR đã bắt đầu bán các bức ảnh chất lượng cao với một vài xu, lật đổ sự nghiệp của các nhiếp ảnh gia chuyên nghiệp. Ngày nay khả năng phát sinh ảnh có chất lượng cao bằng trí tuệ nhân tạo đang đe dọa rộng rãi hơn đến nghề nghiệp này. Người giành giải thưởng lớn của giải thưởng nhiếp ảnh Audubon năm ngoái, Jack Zhi, đã nghiên cứu hành vi của các con diều mồi trong ba năm trước khi chụp được bức ảnh hoàn hảo về một người cha dạy cho một con bịt mắt săn mồi. Bây giờ với trí tuệ nhân tạo được đào tạo, một phần dựa trên hình ảnh từ các nhiếp ảnh gia như Zhi có thể tạo ra các khung cảnh về những hành vi khó bắt được - và một người đang cuộn lên trên điện thoại có thể không phân biệt được sự khác biệt. Ngay cả trong giải thưởng nhiếp ảnh cũng đã có các ban giám khảo bị "đánh lừa" bởi những hình ảnh được tạo bởi trí tuệ nhân tạo, và cơ chế xét duyệt hiện tại có thể không đủ để phát hiện những nỗ lực tốt nhất.

Không chỉ là các nhà nhiếp ảnh gia mà các nhà bảo tồn cũng phải đối mặt với những phát triển này. Trong một thời gian dài, nhiếp ảnh đã được sử dụng để tạo ra lòng kính phục về thế giới tự nhiên và để củng cố những lập luận để bảo vệ các loài đang suy giảm, đối phó với sự suy thoái môi trường sống và tăng cường niềm tin của công chúng vào thực tế về biến đổi khí hậu.

Tuy nhiên, trong thời đại "tin giả", trí tuệ nhân tạo (AI) có thể tạo ra những nghi ngờ và lan truyền tin tức sai lệch nhằm thay đổi niềm tin và hành vi của chúng ta. Ngược lại, những động lực này cũng có thể làm cho nhiếp ảnh có thực sự khó tin - đó là những bức ảnh đẹp nhưng thật. Văn hóa Meme bị kích thích bởi trí tuệ nhân tạo có thể biến các vấn đề phức tạp thành những trò đùa. Khuynh hướng của trí tuệ nhân tạo để "ảo tưởng", hoặc tự tin trình bày một câu trả lời sai, càng làm trầm trọng vấn đề này.

Khi sử dụng với ý đồ tốt, trí tuệ nhân tạo cũng có thể giúp bảo tồn động vật hoang dã. Trong thập kỷ vừa qua, các nhà khoa học đã tận dụng sự tiến bộ trong trí tuệ nhân tạo để bảo vệ động vật hoang dã tốt hơn. Các chương trình học máy tự động đã lọc qua các hình ảnh máy ảnh, máy bay không người lái và vệ tinh, cũng như các bản ghi âm để giám sát các loài chim trên khắp thế giới, đặc biệt là ở các khu vực xa xôi ít người đến thăm. Các mô hình dự đoán dựa trên dữ liệu như vậy đang giúp đẩy lùi các mối đe dọa như săn bắn trộm cắp. Tương tự, trí tuệ nhân tạo được tạo ra để hỗ trợ các chủ đề bảo tồn bằng cách khơi gợi sự sáng tạo. Từng hình ảnh đặc biệt có sức mạnh thu hút cảm xúc của con người đối với các vấn đề một cách mà từng từ hoặc dữ liệu đơn lẻ không thể làm được; khả năng này được phân phối bình đẳng khi công cụ trí tuệ nhân tạo có sẵn, mở rộng sự sáng tạo của con người.

Nhìn chung, AI đang phát triển với tốc độ vượt xa các khung giá pháp lý, đạo đức và công nghệ có thể hạn chế việc sử dụng và bảo vệ xã hội khỏi những tổn thương. Chúng ta không muốn có một hệ thống phụ thuộc vào các chuyên gia để phát hiện những ảo giác, hoặc điều gì là thật, điều gì là giả, cũng như không muốn phải sửa chữa một công nghệ bị hư hại sau khi gây ra thiệt hại. Các nhà nghiên cứu, nhà lập chính sách, luật sư và người tiêu dùng cần nghiêm túc và nhanh chóng cân nhắc các hậu quả tiêu cực khi các công cụ này ngày càng phát triển.

Nhưng đừng lo lắng! Trí tuệ nhân tạo sẽ không thay thế nhiếp ảnh. Như tôi khó lòng tưởng tượng các gia đình không chụp ảnh kỷ niệm kỳ nghỉ để thay thế bằng một bức tranh, tôi hoài nghi rằng trí tuệ nhân tạo sẽ chấm dứt sự cố gắng của chúng ta để ghi lại những khoảnh khắc động vật hoang dã hàng ngày. Hình ảnh ghi lại sự trải nghiệm của chúng ta; trí tuệ nhân tạo ghi lại sự tưởng tượng của chúng ta.

Trải qua nhiều kinh nghiệm cá nhân, tôi luôn cảm thấy rằng chúng ta không thể dự đoán được cách công nghệ phát triển hoặc cách xã hội theo đuổi nó. Dù cho trí tuệ nhân tạo có thể mang lại sự biến đổi gì, tôi không nghĩ rằng nó sẽ biến nỗ lực, chuyên môn và kinh nghiệm con người thành những dấu hiệu cũ kỹ. Niềm vui của việc quan sát chim và sự nỗ lực để đi vào vùng núi để ghi lại những bức ảnh tuyệt vời nhắc nhở chúng ta về sự đẹp và sự cần thiết của thiên nhiên. Việc bảo vệ thế giới của chúng ta tùy thuộc vào con người, không phải trí tuệ nhân tạo.