Các nhà nghiên cứu trước đây của Meta, người đã phát triển mô hình ngôn ngữ trí tuệ nhân tạo (AI) cho sinh học, đã thu được 40 triệu đô la để xây dựng các mô hình LLM sinh học mới có thể giúp phát triển từ tế bào có thể lập trình chống ung thư đến các hệ vi sinh vật có thể làm sạch chất thải độc hại.

GettyNhững nhà nghiên cứu trước đây của Meta, người đã phát triển mô hình ngôn ngữ trí tuệ nhân tạo (AI) cho sinh học, đã ra mắt một công ty khởi nghiệp mới và thu được ít nhất 40 triệu đô la, Forbes đã được biết.

EvolutionaryScale do Alexander Rives lãnh đạo, người đã điều hành đội làm việc về gấp khối protein của Meta AI cho đến khi tập đoàn công nghệ đóng cửa dự án vào tháng 4. Nhóm nhân viên sáng lập gồm tám người đều đến từ cùng một đơn vị, nơi họ tạo ra một mô hình dựa trên transformer theo phong cách của GPT-4 của OpenAI hoặc Bard của Google, nhưng được huấn luyện trên dữ liệu về phân tử protein để dự đoán cấu trúc của các protein chưa biết. Họ đã sử dụng nó để tạo ra một cơ sở dữ liệu hiện có 700 triệu cấu trúc 3D có thể có - những mảnh ghép quan trọng để phát triển các loại thuốc có thể chữa bệnh, vi sinh vật có thể làm sạch ô nhiễm hoặc cách thay thế khác để sản xuất hóa chất công nghiệp.

Đến tháng 6, công ty khởi nghiệp đã tiếp cận các nhà đầu tư rủi ro để tiến hành tài trợ gốc nhằm thúc đẩy nỗ lực nghiên cứu của mình bằng cách mở rộng kích thước mô hình trí tuệ nhân tạo (AI) lên đáng kể, theo một tài liệu trình bày mà Forbes thu thập được. Lux Capital dẫn đầu vòng tài trợ khoảng 40 triệu đô la, theo tư duy của bốn người có kiến thức về thỏa thuận. Hai nguồn tin cho biết vốn này định giá EvolutionaryScale ở mức 200 triệu đô la và nhà đầu tư trí tuệ nhân tạo nổi tiếng Nat Friedman và Daniel Gross đã tham gia trong đợt tài trợ này.

Rives từ chối bình luận, trong khi Lux, Friedman và Gross không đồng ý bình luận theo yêu cầu.

Protein là các phân tử lớn được tạo thành từ chuỗi gấp của axit amin và là các khối xây dựng của vi khuẩn, vi sinh vật và tế bào người. Chức năng cụ thể của chúng thường được quyết định bởi hình dạng của chúng, và hình dạng đó có thể thay đổi khi tương tác với các chất hoá học hoặc protein khác trong cơ thể. Do đó, các phần cụ thể của một protein thường là mục tiêu của các loại thuốc để điều trị bệnh. Tuy nhiên, việc dự đoán hình dạng của một protein là phức tạp, bởi vì nó được quy định bởi sự tương tác phức tạp giữa hàng ngàn nguyên tử bên trong. (Ví dụ, tóc xoăn là do tương tác của các nguyên tử lưu huỳnh có trong một axit amin cụ thể.) Những dự đoán như vậy rất quan trọng để cho phép các nhà khoa học tìm hiểu chức năng của protein để thiết kế một loại thuốc sẽ kết hợp chính xác với cấu trúc ba chiều của nó. Khả năng xác định cấu trúc của nhiều protein như vậy, do đó, giúp các nhà khoa học thu hẹp phạm vi lựa chọn và tập trung nguồn lực vào những protein đáng được quan tâm.

Công ty con của Google, DeepMind, đã tạo ra sự chú ý lớn nhất trong lĩnh vực này vào năm 2020 khi công bố miễn phí AlphaFold, hệ thống trí tuệ nhân tạo của họ để dự đoán cấu trúc protein. Người đoạt giải Nobel Venki Ramakrishnan đã ca ngợi công việc của DeepMind là một "tiến bộ đáng kinh ngạc" và "sẽ thay đổi cơ bản nghiên cứu sinh học" trong một bài đăng trên blog công ty được xuất bản vào năm 2020. Thậm chí việc có thể dự đoán cấu trúc của 200 triệu protein cũng mang lại một thách thức lớn cho các nhà khoa học trong việc xác định cách thuốc tác động vào những phân tử này. Nghiên cứu đó sau đó được xuất bản trên tạp chí Nature và đã giúp CEO DeepMind Demis Hassabis và nhà nghiên cứu chính John Jumper nhận Giải Breakthrough trị giá 3 triệu đô la.

Tháng 11 năm ngoái, nhóm do Rives dẫn đầu đã nhấn mạnh mô hình của mình trong một bài báo được công bố trên tạp chí "Science" (có thể đọc tại đây) rằng nó có thể dự đoán nhanh gấp 60 lần so với AlphaFold, mặc dù trung bình các dự đoán này không chính xác hơn. Đến nay, Trí tuệ Nhân tạo (AI) chủ yếu đã cung cấp những cải tiến vượt trội chỉnh sửa nhỏ trong hiệu năng phát triển thuốc. Thời điểm eureka cho Trí tuệ nhân tạo tạo ra văn bản - khi năng lực kỹ thuật tăng đột ngột và mạnh mẽ đến mức kích hoạt một sự bùng nổ thương mại - chưa xảy ra trong lĩnh vực sinh học, và một số công ty dược truyền thống không tin rằng điều đó bao giờ sẽ xảy ra.

Vào tháng 4, trong bối cảnh cuộc đua thương mại hóa Trí tuệ nhân tạo tạo dựng dữ liệu nhờ vào ChatGPT đã sôi động, nhóm của Rives đã rời khỏi Meta. Trong khi công ty công nghệ lớn này đã thành lập phòng nghiên cứu Trí tuệ nhân tạo để tiến hành một loạt nghiên cứu đa dạng, tập trung của họ đã hẹp lại khi một số dự án cho thấy khả năng thương mại; tương tự, OpenAI đã giải tán nhóm robot của mình vào năm 2021. Financial Times, nguồn truyền tin đầu tiên thông báo về sự tiêu diệt đội ngũ protein này, miêu tả nó là một phần của việc cắt giảm nhân sự và thay đổi chiến lược tại công ty mẹ để tập trung vào nỗ lực thương mại, ví dụ như loạt chatbot trí tuệ nhân tạo. Trí tuệ nhân tạo trong lĩnh vực sinh học không có triển vọng kinh doanh lợi nhuận lớn trong thời gian ngắn. Các công ty thương mại như Schrodinger, hiện đang giao dịch công khai với mức vốn hóa thị trường dưới 3 tỷ đô la, đang bán các sản phẩm dựa trên các phương pháp quy mô hình học phân tử cũ.

EvolutionaryScale là công ty mới nhất được gọi vốn để nghiên cứu trí tuệ nhân tạo dựa trên transformer với giá trị lớn. Trong số các công ty phát triển mô hình "kỳ lân" có Inflection AI, đã gọi vốn 1,3 tỷ đô la vào tháng 6; Cohere, đã công bố 270 triệu đô la vào tháng 5; và Adept, đã hoàn tất đầu tư 350 triệu đô la vào tháng 3. Tuần này, Hugging Face, một nhà cung cấp cơ sở hạ tầng trí tuệ nhân tạo được nhắc đến nhiều, đã thông báo về việc góp vốn 235 triệu đô la với giá trị 4,5 tỷ đô la (Forbes đã là nguồn tin đầu tiên đưa tin vào tháng trước rằng công ty này đang gọi vốn). Nhiều thỏa thuận này đều đặt cược vào việc doanh thu vụt lên sẽ tăng dần. Stability AI, đã gọi vốn 100 triệu đô la với giá trị 1 tỷ đô la vào năm ngoái, đang gặp khó khăn trong việc tạo ra doanh thu, cùng với những thách thức khác, như Forbes đã đưa tin trong một bài điều tra vào tháng 6.

Cải tiến kỹ thuật tiếp theo trong trí tuệ nhân tạo gắn với việc gập protein cũng đòi hỏi đầu tư đáng kể. DeepMind đã thành lập một chi nhánh mới phát hiện thuốc chống bệnh tại Isomorphic Labs vào tháng 12 năm 2022, trong khi các đối thủ Insitro và Recursion đã từng gây quỹ hơn 1 tỷ đô la từ các nhà đầu tư tư nhân và công chúng (trong tài liệu giới thiệu, EvolutionaryScale miêu tả các công ty này là "đối tác tiềm năng" mà nó có thể giúp đỡ thông qua các mô hình của mình). Ngay cả với sự đầu tư đó, trung bình thời gian để một loại thuốc được FDA chấp thuận từ việc phát hiện là khoảng 7-10 năm.

Nhóm của Rives dường như nhận ra tầm quan trọng của dự án có tính đột phá. Theo tài liệu giới thiệu, EvolutionaryScale dự kiến sẽ chi tiêu 38 triệu đô la trong năm đầu tiên, trong đó 16 triệu đô la sẽ được dành cho công nghệ tính toán. Các chi phí tăng lên từ đó, lên đến 161 triệu đô la vào năm thứ hai và 278 triệu đô la vào năm thứ ba (lần lượt là 100 triệu và 200 triệu đô la được chi tiêu cho công nghệ tính toán). Nhưng trong suốt tài liệu giới thiệu, công ty tỏ ra nhấn mạnh rằng cần mất mười năm để các mô hình trí tuệ nhân tạo liên quan đến sinh học có thể giúp thiết kế sản phẩm và liệu pháp.

Điều này có nghĩa, nếu giả thuyết của họ đúng ở điểm mạch lạc nhất. Ngân sách tính toán tiềm tàng (và cái tên của công ty) đều cho thấy sự đánh cược lớn của EvolutionaryScale: mở rộng mô hình trí tuệ nhân tạo - cung cấp nhiều dữ liệu hơn và tăng kích thước của nó - sẽ tạo ra một "tiến bộ năng lực trong trí tuệ nhân tạo về sinh học", như tài liệu giới thiệu đã mô tả, so sánh tình trạng hiện tại với công nghệ xử lý ngôn ngữ tự nhiên năm 2018. "Chúng tôi hiện không nhìn thấy bất kỳ nỗ lực đáng tin cậy nào tập trung vào giả thuyết về mở rộng trong sinh học", tài liệu cho biết.

EvolutionaryScale đang nhắm tới xây dựng một mô hình mới mỗi năm, theo tài liệu giới thiệu. Đến năm thứ ba, khát vọng của họ là mở rộng không chỉ việc dự đoán cấu trúc protein mà còn tích hợp dữ liệu sinh học khác từ chuỗi DNA, biểu hiện gen và trạng thái di truyền. Tầm nhìn lâu dài của họ bao gồm việc bán một mô hình trí tuệ nhân tạo đa dụng cho sinh học không chỉ giới hạn trong một trường hợp sử dụng cụ thể. Mô hình này, lý thuyết cho biết, có thể được sử dụng cho y học - như phát triển "tế bào có thể lập trình tìm kiếm và tiêu diệt ung thư hoặc các bệnh khác" - nhưng cũng có thể áp dụng cho các ứng dụng công nghệ sinh học khác như thiết kế "máy phân tử" để làm sạch chất thải độc hại hoặc hấp thụ carbon (nhưng đây cũng là một thị trường đầy thách thức: ý tưởng này giống với luận điểm của Ginkgo Bioworks, một công ty khởi nghiệp đang giao dịch công khai 84% dưới giá cổ phiếu IPO của mình).

Để đạt được điều đó, EvolutionaryScale phải chứng minh ưu thế của mình so với AlphaFold, vẫn là "tay khủng long 800 pound" trong ngành này. Các công ty khác đang nổi lên để đạt được các mục tiêu tương tự, bao gồm Inceptive, đang cố gắng áp dụng các mô hình ngôn ngữ lớn để thiết kế liệu pháp thuốc dựa trên RNA. Công ty khởi nghiệp này được đồng sáng lập bởi Jakob Uszkoreit, một trong những tác giả chủ yếu trong bài báo nghiên cứu đột phá đã phát minh ra bộ biến đổi, bước đột phá kỹ thuật đằng sau cuộc đua tài trợ trí tuệ nhân tạo sáng tạo ngày nay. Một nhà đầu tư sinh học, người đã nói chuyện với Forbes với danh nghĩa Giới thiệu, đã phỏng đoán rằng các phiên bản tương lai của các mô hình ngôn ngữ lớn tổng quát hơn, như loạt máy GPT của OpenAI, có thể trở nên đủ tài năng để được áp dụng vào sinh học.

Các cuộc chiến cạnh tranh như vậy có thể không phải là mối quan tâm toàn thời gian của Rives, người được miêu tả trong tài liệu giới thiệu là "CEO lâm thời". Theo tài liệu giới thiệu, ông đã nhận đề nghị gia nhập mạng lưới giảng dạy tại MIT và Viện Broad của Harvard vào năm tới và xây dựng một "phòng thí nghiệm thiết kế sinh học".

Đóng góp thông tin: Alex Konrad.