“Bằng cách tăng cường trí tuệ nhân loại, trí tuệ nhân tạo (AI) có thể góp phần tạo ra một cuộc Phục Hưng mới, có thể là một giai đoạn mới của Thời kỳ Khai sáng," Yann LeCun, một trong những người cha đẻ của trí tuệ nhân tạo hiện đại, cho biết trong những ngày đầu năm nay. AI đã có thể làm cho một số quy trình khoa học hiện tại trở nên nhanh chóng và hiệu quả hơn, nhưng liệu AI có thể làm thêm nhiều việc nữa, bằng cách biến đổi cách khoa học được thực hiện?
Những biến đổi như vậy đã từng xảy ra. Với sự xuất hiện của phương pháp khoa học vào thế kỷ 17, các nhà nghiên cứu đã bắt đầu tin tưởng vào quan sát thực nghiệm và các lý thuyết được rút ra từ chúng, hơn là tri thức cổ xưa. Quá trình này được hỗ trợ quan trọng bởi sự ra đời của các tạp chí khoa học, cho phép các nhà nghiên cứu chia sẻ những kết quả của họ, không chỉ để tuyên bố ưu tiên mà còn để khuyến khích người khác tái tạo và phát triển dựa trên kết quả của họ. Tạp chí đã tạo ra một cộng đồng khoa học quốc tế xung quanh một nguồn tri thức chung, gây ra một sự bùng nổ khám phá được gọi ngày nay là cuộc cách mạng khoa học.
Một sự biến đổi tiếp theo đã bắt đầu vào cuối thế kỷ 19, với việc thành lập các phòng thí nghiệm nghiên cứu - những nhà máy sáng tạo nơi ý tưởng, con người và vật liệu có thể được kết hợp theo quy mô công nghiệp. Điều này dẫn đến một sự trào phúng khác nữa của sự sáng tạo, từ hóa chất và bội số dẫn, đến dược phẩm. Những thay đổi này không chỉ tăng năng suất khoa học mà còn biến đổi chính khoa học, mở ra các lĩnh vực nghiên cứu và khám phá mới. Làm sao AI có thể làm một điều tương tự, không chỉ tạo ra kết quả mới mà còn tạo ra các cách mới để tạo ra kết quả mới?
Chúng tôi đang sạc pin
Một cách tiếp cận triển vọng là "khám phá dựa trên văn bản" (LBD) mà, như tên gọi của nó, nhắm mục tiêu tạo ra những khám phá mới bằng cách phân tích văn bản khoa học. Hệ thống LBD đầu tiên, được xây dựng bởi Don Swanson tại Đại học Chicago vào những năm 1980, tìm kiếm các mối quan hệ mới trong MEDLINE, một cơ sở dữ liệu về các bài viết từ các tạp chí y học. Trong một thành công sớm, nó kết hợp hai quan sát riêng biệt - bệnh Raynaud, một rối loạn tuần hoàn, có liên quan đến độ nhớt của máu, và dầu cá làm giảm độ nhớt của máu - và gợi ý rằng dầu cá có thể là một liệu pháp hữu ích. Giả thiết này sau đó được xác minh thực nghiệm.Vào thời điểm đó, phương pháp này không thành công trong việc lan rộng ra ngoài cộng đồng AI. Tuy nhiên, ngày nay, các hệ thống AI đã trở nên thông minh hơn rất nhiều trong việc xử lý ngôn ngữ tự nhiên và có một nguồn tri thức khoa học lớn hơn để nghiền ngẫm. Sự quan tâm đến các phương pháp LBD đang tăng lên ở các lĩnh vực khác, đáng chú ý là khoa học vật liệu.
Ví dụ, vào năm 2019, một nhóm nghiên cứu do Vahe Tshitoyan dẫn đầu, khi đó làm việc tại Lawrence Berkeley National Laboratory, Mỹ, sử dụng một kỹ thuật AI gọi là học không giám sát để phân tích tóm tắt của các bài viết về khoa học vật liệu và trích xuất thông tin về các tính chất của các vật liệu khác nhau thành các biểu diễn toán học được gọi là "nhúng từ". Những khái niệm này đặt vào một không gian đa chiều nơi các khái niệm tương tự được nhóm lại với nhau. Hệ thống từ đó có một "trực giác hóa học" để, ví dụ, gợi ý các vật liệu có các tính chất tương tự với vật liệu khác. Sau đó, hệ thống AI được yêu cầu gợi ý các vật liệu có thể có tính chất termoelectric (khả năng chuyển đổi một chênh lệch nhiệt độ thành điện áp và ngược lại), mặc dù chúng không được xác định như vậy trong văn bản. Mười vật liệu tiềm năng nhất đã được chọn, và thử nghiệm thực nghiệm đã phát hiện rằng tất cả mười vật liệu này đều thể hiện các tính chất termoelectric đặc biệt mạnh mẽ.
Các nhà nghiên cứu sau đó huấn luyện lại hệ thống của họ bằng cách loại bỏ các bài báo từ những năm gần đây hơn và yêu cầu nó dự đoán những chất liệu termoelectric mới sẽ được khám phá trong những năm sau đó. Hệ thống này có khả năng dự đoán các khám phá như vậy chính xác gấp tám lần so với kỳ vọng từ sự may rủi. Nó cũng có thể dự đoán chính xác các khám phá sử dụng các thuật ngữ khác, như "quang điện". Các nhà nghiên cứu kết luận rằng "các phương pháp suy luận dựa trên ngôn ngữ như vậy có thể trở thành một lĩnh vực nghiên cứu hoàn toàn mới giữa xử lý ngôn ngữ tự nhiên và khoa học".
Một bài báo của Jamshid Sourati và James Evans, cả hai là nhà xã hội học tại Đại học Chicago, được xuất bản vào năm nay trong tạp chí Nature Human Behaviour, mở rộng phương pháp này theo một cách mới. Nó bắt đầu bằng quan sát rằng các hệ thống LBD thường tập trung vào các khái niệm trong các bài báo và bỏ qua các tác giả của chúng. Vì vậy, họ đã huấn luyện một hệ thống LBD để xem xét cả hai yếu tố này. Hệ thống kết quả thu được là gấp hai lần hiệu quả hơn trong việc dự báo các khám phá mới trong khoa học vật liệu so với hệ thống được xây dựng bởi nhóm của Tiến sĩ Tshitoyan và cũng có thể dự đoán các nhà khám phá thực tế với độ chính xác hơn 40%. Nhưng nhà nghiên cứu còn đi một bước xa hơn. Thay vì theo đuổi đám đông và dự đoán nơi mà các nhà nghiên cứu sẽ tạo ra những khám phá mới, họ yêu cầu mô hình của họ tránh xa đám đông và xác định những giả thuyết "ngoài hành tinh" có tính khoa học và có thể xảy ra, nhưng không gian thường, trong tương lai gần. Hệ thống có thể, như các nhà nghiên cứu lập luận, không chỉ tăng tốc các khám phá trong tương lai gần, mà còn khám phá những "điểm mù" nơi những khám phá mới đang chờ đợi.
Ngoài việc đề xuất các giả thuyết mới để điều tra, các hệ thống LBD lấy tác giả vào xét cũng có thể đề xuất các đối tác tiềm năng mà có thể không biết nhau. Phương pháp này có thể rất hiệu quả khi xác định các nhà khoa học làm việc trong các lĩnh vực khác nhau, kết nối các lĩnh vực nghiên cứu bổ sung. Sự hợp tác nghiên cứu liên ngành sẽ trở nên "thông dụng hơn là điều hiếm hoi" khi được trung gian bởi AI, theo Yolanda Gil, một nhà khoa học máy tính tại Đại học Southern California. Và khi các hệ thống LBD được mở rộng để có thể xử lý các bảng biểu, biểu đồ và dữ liệu như chuỗi gene và code lập trình, chúng sẽ trở nên thông minh hơn. Trong tương lai, các nhà nghiên cứu có thể tin tưởng vào những hệ thống như vậy để giám sát lượng lớn các bài báo khoa học mới, nhấn mạnh các kết quả liên quan, đề xuất giả thuyết mới cho nghiên cứu - và thậm chí liên kết chúng với các đối tác nghiên cứu tiềm năng, như một dịch vụ trò chuyện khoa học. Công cụ AI có thể mở rộng và biến đổi cơ sở hạ tầng xuất bản khoa học hiện tại, đã tồn tại trong hàng thế kỷ.
Chúng tôi đầy năng lượng
Nếu LBD hứa hẹn tăng cường tạp chí với AI, gọi là "robot nhà khoa học" hoặc "phòng thí nghiệm tự lái", hứa hẹn sẽ thực hiện điều tương tự cho phòng thí nghiệm. Những máy này vượt xa hình thức tự động hóa phòng thí nghiệm hiện có, chẳng hạn như nền tảng sàng lọc thuốc. Thay vào đó, chúng được cung cấp kiến thức nền về một lĩnh vực cụ thể của nghiên cứu, dưới dạng dữ liệu, bài báo nghiên cứu và bằng sáng chế. Sau đó, chúng sử dụng AI để xây dựng giả thuyết, tiến hành thí nghiệm bằng robot, đánh giá kết quả, sửa đổi giả thuyết và lặp lại quy trình. Adam, một máy xây dựng tại Đại học Aberystwyth ở Wales năm 2009, đã thực hiện các thí nghiệm về mối quan hệ giữa gene và enzyme trong quá trình trao đổi chất của men men và là máy đầu tiên khám phá kiến thức khoa học mới một cách tự động.Người kế nhiệm Adam, có tên gọi là Eve, thực hiện các thí nghiệm về phát hiện thuốc và có phần mềm tinh vi hơn. Khi lập kế hoạch và phân tích các thí nghiệm, nó sử dụng học máy để tạo ra "quan hệ hoạt động cấu trúc định lượng" (QSARs), các mô hình toán học liên quan đến cấu trúc hóa học và hiệu ứng sinh học. Eve đã khám phá ra, ví dụ, rằng triclosan, một hợp chất kháng khuẩn được sử dụng trong kem đánh răng, có thể ức chế cơ chế quan trọng trong ký sinh trùng gây sốt rét.
Ross King, một nhà nghiên cứu trí tuệ nhân tạo tại Đại học Cambridge đã tạo ra Adam, đã vẽ một sự tương tự giữa các nhà khoa học robot trong tương lai với các hệ thống trí tuệ nhân tạo được xây dựng để chơi cờ vua và cờ Gô. Viễn cảnh về việc máy tính đánh bại những người chơi con người giỏi nhất một thời gian trước đó dường như còn cách đói vài thập kỷ, nhưng công nghệ cải thiện nhanh hơn so với dự đoán. Hơn nữa, các hệ thống trí tuệ nhân tạo đã phát triển các chiến lược cho những trò chơi đó mà người chơi con người chưa từng xem xét đến. Điều tương tự có thể xảy ra với nhà khoa học robot khi chúng trở nên mạnh mẽ hơn. "Nếu trí tuệ nhân tạo có thể khám phá toàn bộ không gian giả thuyết và thậm chí mở rộng không gian đó, thì có thể cho thấy con người chỉ mới khám phá các khu vực nhỏ của không gian giả thuyết, có thể là do định kiến khoa học của riêng họ," Tiến sĩ King nói.
Nhà khoa học robot cũng có thể biến đổi khoa học theo một cách khác: giúp khắc phục một số vấn đề ảnh hưởng đến hoạt động khoa học. Một trong số đó là ý kiến rằng khoa học đang trở nên ít hiệu quả theo nhiều đánh giá khác nhau và việc đẩy mạnh biên giới tri thức trở nên khó khăn và tốn kém hơn. Có một số lý thuyết cho vì sao điều này có thể xảy ra: những khám phá dễ dàng nhất có thể đã được thực hiện trước đó, ví dụ, và ngay bây giờ cần nhiều đào tạo hơn cho các nhà khoa học để đạt đến biên giới. Các hệ thống được truyền động bằng trí tuệ nhân tạo có thể giúp đỡ bằng cách thực hiện công việc thí nghiệm nhanh hơn, rẻ hơn và chính xác hơn so với con người. Khác với con người, robot có thể làm việc suốt ngày đêm. Và giống như máy tính và robot đã cho phép các dự án quy mô lớn trong thiên văn học (như khảo sát bầu trời rộng lớn hoặc tìm kiếm tự động các hành tinh ngoài hệ mặt trời), nhà khoa học robot có thể giải quyết những vấn đề lớn trong sinh học hệ thống, ví dụ, một cách không thể khác vì quy mô của nó. "Chúng ta không cần khoa học hoàn toàn mới để làm điều đó, chúng ta chỉ cần phải làm nhiều khoa học hơn," Tiến sĩ King nói.
Hình ảnh: Shira Inbar
Tự động hóa cũng có thể giúp giải quyết một vấn đề khác: khủng hoảng về khả tái sản xuất. Lý thuyết, khi các nhà khoa học công bố kết quả nghiên cứu của mình, người khác có thể tái tạo và xác nhận công việc của họ. Nhưng việc tái tạo không có nhiều uy tín, làm cho nó trở nên hiếm. Khi nó xảy ra, rất nhiều cố gắng thất bại, cho thấy rằng công việc ban đầu không hợp lệ, hoặc thậm chí là gian lận. Các nhà khoa học không có động lực để lặp lại công việc của người khác và họ đang bị áp lực để công bố kết quả mới, không phải xác nhận kết quả đã có từ trước. Một lần nữa, các nhà khoa học robot có thể giúp đỡ trong một số lĩnh vực nghiên cứu, chẳng hạn như sinh học phân tử. Một nghiên cứu được xuất bản vào năm 2022 bởi Katherine Roper, thuộc Đại học Manchester, đã phân tích hơn 12.000 bài viết về ung thư vú và chọn ra 74 kết quả sinh học để xác minh bằng cách sử dụng robot Eve, mà đã tái tạo thành công 43 kết quả. Các nhà nghiên cứu kết luận rằng tự động hóa "có tiềm năng để giảm thiểu khủng hoảng về khả tái sản xuất" và "tránh các rào cản xã hội và sự không có động lực nghề nghiệp để tái tạo". Máy không quan trọng việc công bố kết quả kiểm chứng của kết quả trước đó. Ngay cả khi không giống như các nhà khoa học, chúng không xấu hổ khi công bố kết quả tiêu cực, ví dụ như khi một phân tử cụ thể không tương tác với một mục tiêu cụ thể nào đó. Công bố kết quả tiêu cực sẽ giảm công sức lãng phí bằng cách cho các nhà nghiên cứu trong tương lai biết không nên làm gì. Và nhà khoa học robot ghi chép đáng tin cậy mọi thứ về công việc của họ một cách chi tiết, điều này (về lý thuyết) tạo điều kiện thuận lợi cho việc phân tích kết quả của họ sau này. "Những đổi mới trong trí tuệ nhân tạo có thể cải thiện hoạt động khoa học trong tất cả những lĩnh vực đó," Tiến sĩ Gil nói.
Cơ chế hoạt động tự động?
Khó khăn vẫn còn nhiều. Ngoài việc cần phần cứng và phần mềm tốt hơn, và sự tích hợp chặt chẽ giữa hai, còn cần một sự tương tích lớn hơn giữa các hệ thống tự động hóa phòng thí nghiệm và các tiêu chuẩn chung để cho phép các thuật toán trí tuệ nhân tạo trao đổi và hiểu thông tin ngữ nghĩa.Sự giới thiệu các mẫu microplates tiêu chuẩn, chứa hàng trăm ống nghiệm nhỏ giúp xử lý mẫu thí nghiệm theo đợt, đã làm tăng năng suất nhiều trăm lần đối với một số loại phân tích. Bây giờ cần có điều tương tự xảy ra với dữ liệu - rất nhiều dữ liệu từ các mảng microplate trong phòng thí nghiệm sinh học cuối cùng lại được đưa vào bảng tính hoặc bảng trong các bài báo, ví dụ, nơi mà nó không thể đọc được bằng máy móc.
Một rào cản khác là sự thiếu quen thuộc với các công cụ dựa trên trí tuệ nhân tạo (AI) giữa các nhà khoa học. Và một số nhà nghiên cứu, giống như phần lớn người lao động, lo lắng rằng tự động hóa đe dọa công việc của họ. Nhưng những điều này đang thay đổi, như tới từ Tiến sĩ Gil. Bà đã khảo sát thái độ của nhà khoa học đối với AI vào năm 2014 và phát hiện rằng trong phần lớn lĩnh vực, "sự quan tâm đối với AI có vẻ tương đối hạn chế". Hầu hết các nỗ lực để tích hợp AI vào nghiên cứu khoa học đến từ các nhà nghiên cứu AI, thường gặp sự đa nghi hoặc sự thù địch. Nhưng tác động của AI hiện đang "lan rộng và sâu sắc", theo Tiến sĩ Gil. Theo bà, nhiều nhà khoa học hiện nay đang "tìm kiếm cộng tác với AI một cách chủ động". Sự nhận thức về tiềm năng của AI đang ngày càng tăng, đặc biệt trong lĩnh vực vật liệu học và phát hiện thuốc, nơi các nhà chuyên môn đang xây dựng hệ thống AI riêng của họ. "Nếu chúng ta có thể làm cho máy móc trở thành ngang bằng với con người trong lĩnh vực khoa học, thì đó sẽ là một sự đột phá to lớn, vì bạn có thể tạo nhiều cái như vậy," Tiến sĩ King cho biết.
Các tạp chí khoa học đã thay đổi cách nhà khoa học khám phá thông tin và xây dựng trên công việc của nhau. Các phòng thí nghiệm nghiên cứu đã mở rộng và công nghiệp hóa thí nghiệm. Bằng cách mở rộng và kết hợp hai sự chuyển đổi trước đó này, AI thật sự có thể thay đổi cách khoa học được tiến hành. ■