Người sáng lập Sequoia, Don Valentine, thường hỏi các nhà sáng lập hai câu hỏi: "tại sao bây giờ?" và "vậy thì sao?" Ẩn sau những câu hỏi này là sự kết hợp của sự tò mò và sự nghiêm túc, nó hỏi rằng điều gì đã thay đổi trong thế giới (tại sao bây giờ?) và điều này sẽ mang ý nghĩa gì (vậy thì sao?).
Trí tuệ nhân tạo đang có một lợi thế vượt trội "tại sao bây giờ?" với sự phát triển của các mô hình ngôn ngữ lớn (LLMs) được huấn luyện với kiến trúc Transformer. Transformer rất phù hợp với GPU, giúp việc tập hợp lượng lớn dữ liệu và tính toán để huấn luyện các mô hình trí tuệ nhân tạo với hàng tỷ và hàng ngàn tỷ tham số trở nên khả thi.
Chúng ta cũng có một lợi thế đáng chú ý "vậy thì sao?" Các công nghệ này đã tạo ra giao diện người dùng mới hoàn toàn cho máy tính: ngôn ngữ con người. Giống như giao diện người dùng đồ họa đã làm cho máy tính cá nhân trở nên tiếp cận được với hàng triệu khách hàng trong những năm 1980, giao diện ngôn ngữ tự nhiên mới cũng đã làm cho trí tuệ nhân tạo trở nên tiếp cận được với hàng trăm triệu người dùng trên toàn thế giới trong năm vừa qua.
Trí tuệ nhân tạo đã trải qua nhiều chu kỳ lên xuống. Khi trí tuệ nhân tạo đạt đến đỉnh cao như hiện nay, thuật ngữ này được sử dụng phổ biến không chỉ để chỉ công nghệ dự đoán tiên tiến mà còn để chỉ bất kỳ phần mềm "thông minh" nào. Tuy nhiên, trong các giai đoạn AI Winters trước đây, các nhà nghiên cứu đã trở về với các thuật ngữ an toàn hơn như học máy.
John McCarthy đặt thuật ngữ Trí tuệ nhân tạo vào những năm 1950 để phân biệt nghiên cứu của mình với kỹ thuật điều khiển của đối thủ cũ một thời, Norbert Wiener. Tuy nhiên, chính McCarthy sau này đã không hài lòng với thuật ngữ này và than phiền rằng "Ngay khi nó hoạt động, không ai còn gọi nó là Trí tuệ nhân tạo nữa." McCarthy gọi xu hướng của mọi người chuyển tên các công nghệ Trí tuệ nhân tạo cũ thành mô tả chức năng hơn khi những vấn đề đó đã được giải quyết đầy đủ là "hiệu ứng Trí tuệ nhân tạo" và nó vẫn tác động đến chúng ta cho đến ngày hôm nay. Lịch sử của Trí tuệ nhân tạo tràn ngập những thành tựu đã đủ đáng để không còn được coi là đủ thông minh để được gọi là Trí tuệ nhân tạo như mục tiêu trong tương lai.
Nhắc lại nhanh về thị giác máy tính, điều là nền tảng cho những tiến bộ hiện tại trong tạo hình ảnh. Trong một thời gian dài, phát hiện đối tượng trong ảnh hoặc video được coi là công nghệ Trí tuệ nhân tạo tiên tiến, nhưng giờ đây nó chỉ là một trong nhiều công nghệ cho phép bạn gọi dịch vụ xe tự lái từ hãng Waymo ở San Francisco. Chúng ta không còn gọi nó là Trí tuệ nhân tạo nữa. Sớm thôi, chúng ta sẽ chỉ gọi nó là một chiếc xe. Tương tự như vậy, việc phát hiện đối tượng trên ImageNet là một đột phá lớn trong học sâu vào năm 2012 và giờ đây đã có trên mọi điện thoại thông minh. Không còn được gọi là Trí tuệ nhân tạo.
Về mặt ngôn ngữ tự nhiên, có một lịch sử dài trước khi ChatGPT, Claude và Bard xuất hiện. Tôi nhớ từng sử dụng Dragon Speech-To-Text vào khoảng năm 2002 để gõ email khi tay tôi bị gãy. Những gì trước kia được gọi là trí tuệ nhân tạo giờ đây chỉ còn là "dùng để ghi âm" và có trên mọi điện thoại và máy tính. Dịch thuật ngôn ngữ và phân tích cảm xúc, trước đây là các công nghệ quan trọng nhất của NLP, giờ đây chỉ còn là những yếu tố cơ bản. Không phải là Trí tuệ nhân tạo nữa.
Dễ dàng quên đi những gì chúng ta xem là việc đương nhiên trên đám mây đã xuất phát từ những lĩnh vực Trí tuệ nhân tạo trước đây như các hệ thống gợi ý (Netflix và Amazon) và tối ưu hóa đường đi (Google Maps và UPS). Điều này càng trở thành một điều thường ngày, khả năng cao chúng ta sẽ không gọi nó là Trí tuệ nhân tạo.
Điều gì được coi là Trí tuệ nhân tạo và điều gì không được làm điều quan trọng đối với các nhà sáng lập vì trong thời gian dài, luôn tốt hơn là đặt mục tiêu thấp và vượt qua mong đợi. Theo như Gartner đã mô tả trong nhiều chu kỳ lừng danh của sự thổi phồng công nghệ, sự hưng phấn hoang dại luôn kết thúc bằng sự thất vọng- sự suy thoái.
Các nhà sáng lập có lợi ích ngắn hạn từ việc tiếp thị ồn ào này, nhưng với một chi phí. Arthur C. Clark đã viết: "Bất kỳ công nghệ tiên tiến đủ mạnh đều không thể phân biệt với ma thuật." Nhưng ông là một nhà văn khoa học viễn tưởng. Những người thực hành Học máy là các nhà khoa học và kỹ sư và trong cái nhìn đầu tiên, nỗ lực của họ luôn luôn có vẻ như ma thuật- cho đến một ngày nào đó khi nó không còn như vậy nữa.
Mô hình Trí tuệ nhân tạo hiện tại tương tự như việc săn lùng một cây cà rốt treo trên gậy trong khi chạy trên chiếc máy chạy bộ. Đối với các nhà sáng lập hiện tại, tôi nghĩ đến lúc phá vỡ chu trình này bằng cách hiểu rõ những gì đang diễn ra thực sự.
Có một lý do ngôn ngữ học mà chúng ta tiếp tục mắc những lỗi giống nhau. Nếu chúng ta sử dụng Từ điển Anh Oxford để phân rã thuật ngữ "Trí tuệ nhân tạo" theo cách đệ quy, chúng ta sẽ tìm thấy:
- Tạo hóa: được tạo ra hoặc sản xuất bởi con người thay vì xảy ra tự nhiên, đặc biệt là một bản sao của một cái gì đó tự nhiên.
- Trí tuệ: khả năng nhận thức và áp dụng kiến thức và kỹ năng.
- Kiến thức: các sự thật, thông tin và kỹ năng mà một người có được thông qua kinh nghiệm hoặc giáo dục; hiểu biết lý thuyết hoặc thực hành về một chủ đề.
- Kỹ năng: khả năng làm một điều gì đó tốt.
Mỗi nhánh của định nghĩa đệ quy này đều dựa trên "con người" hoặc "một người." Vì vậy, theo định nghĩa, chúng ta nghĩ về trí tuệ nhân tạo giống như con người. Hãy nghĩ về cuộc thử Turing. Nhưng ngay khi một khả năng nằm một cách rõ ràng trong lĩnh vực của máy móc, chúng ta mất đi điểm tham chiếu là con người và chúng ta ngừng nghĩ về nó là trí tuệ nhân tạo.
Một phần của điều này là đặc biệt của con người. Trong nhiều thế kỷ qua, chúng ta đã tôn cao những khía cạnh của trí tuệ có vẻ đặc biệt của con người như ngôn ngữ, trí tưởng tượng, sáng tạo và logic. Chúng ta dành những từ ngữ nhất định cho chính mình. Con người suy nghĩ và lý luận, máy tính tính toán. Con người tạo nghệ thuật, máy tính tạo ra nó. Con người bơi lội, thuyền và tàu ngầm không thể. Nhưng ngay "máy tính" một khi đã là một tên công việc thế kỷ 17 cho một con người tính toán, và chúng ta tuyển dụng nhiều phòng đầy con người trước khi chúng ta hình thành máy tính cơ khí và điện tử.
Hiệu ứng trí tuệ nhân tạo thực sự là một phần của một hiện tượng con người lớn hơn chúng ta gọi là "nguyên tắc biên giới". Bởi vì chúng ta gán cho con người biên giới vượt qua sự thống trị công nghệ của chúng ta, biên giới đó sẽ luôn không được xác định rõ ràng. Trí tuệ không phải là một thứ chúng ta có thể nắm bắt, mà là một đường chân trời ngày càng tới gần mà chúng ta biến nó thành các công cụ hữu ích. Công nghệ là điều trí thông minh giả chế được tạo ra qua hàng ngàn năm hợp tác và cạnh tranh giữa con người.
Trở lại năm 2018, tôi đã được truyền cảm hứng từ bài viết của Giáo sư Berkeley Statistics và Computer Science Michael Jordan. "Dù chúng ta hiểu 'trí tuệ' trong thời gian sớm hay không," ông viết, "chúng ta đúng là đang đối mặt với một thách thức lớn khi kết hợp máy tính và con người một cách nhằm nâng cao cuộc sống con người. Mặc dù thách thức này được một số người coi là phụ thuộc vào việc tạo ra 'trí tuệ nhân tạo', nhưng nó cũng có thể được nhìn nhận một cách rõ ràng hơn - nhưng không kém sùng kính - là việc tạo ra một nhánh mới của kỹ thuật."
Điều này đã đưa tôi viết một bài viết tự mình đặt câu hỏi về ý nghĩa của việc gọi nỗ lực này là trí tuệ nhân tạo chút nào. Năm năm sau đó, liệu chúng ta có gần hơn với tầm nhìn của Jordan về một cơ sở hạ tầng thực tế cho việc gia tăng con người? Tôi tin là có, nhưng chúng ta cần một từ ngữ chính xác hơn để khai thác cơ hội tính toán trước mắt.
Hiệu quả đáng kinh ngạc của mô hình ngôn ngữ lớn để tạo ra ngôn ngữ phù hợp và đáng tin cậy đã làm ngạc nhiên hầu hết mọi người. Khả năng của mô hình khuếch tán để tạo ra hình ảnh chi tiết và có tính thẩm mỹ từ mô tả văn bản cũng vượt qua những giả định thông thường. Và còn nhiều điều thú vị khác đang chờ đợi chúng ta, bao gồm cải tiến tiếp theo về ngôn ngữ và hình ảnh, sự tổng quát hóa cho video, và sự đổi mới trong công nghệ robot, xe tự hành, sinh học, hóa học và y học.
Tất cả những tiến bộ này đều được hưởng lợi từ cơ sở hạ tầng cho tính toán phân tán mà những công ty công nghệ quy mô cực đại đã xây dựng trên đám mây. Chúng cũng được hưởng lợi từ quy mô dữ liệu lớn đã tích luỹ trên internet, đặc biệt nhờ sự phổ biến của các thiết bị di động dễ sử dụng với camera, cảm biến và tính dễ dàng nhập liệu.
Nhưng gọi tất cả những điều này là trí tuệ nhân tạo gây nhầm lẫn cho công chúng và các nhà sáng lập về những gì thực sự cần được xây dựng và cách để kết hợp chúng một cách an toàn và đạo đức để khuyến khích cả thử nghiệm và hành vi có trách nhiệm.
Với tất cả cơ sở hạ tầng tuyệt vời này, trí tuệ nhân tạo như một dự án khoa học sẽ tiếp tục tiến bộ trên biên giới của sự hiểu biết. Nó cũng sẽ tiếp tục đóng góp các ứng dụng hữu ích, nhưng nếu chúng ta gọi tất cả chúng là trí tuệ nhân tạo, thuật ngữ này sẽ nhanh chóng mất đi ý nghĩa và sự mới lạ của nó.
Các chuyên gia ước tính rằng ngay cả với việc truy xuất thông tin, mô hình ngôn ngữ lớn có độ chính xác ~90% trong mọi thời gian. Vẫn còn nhiều nghiên cứu và mở rộng để đạt đến 99%. Tuy nhiên, một khi chúng đạt đến con số 99% đó, chúng sẽ không còn là trí tuệ nhân tạo nữa, chúng sẽ là "giao diện ngôn ngữ" hoặc đơn giản là LLMs. Bạn sẽ có thể viết mã ngay lập tức, giao tiếp với mọi người bằng các ngôn ngữ khác nhau, học hoặc dạy bất cứ điều gì mà chúng ta quan tâm, và nhiều hơn nữa. Tác động sẽ là thực tế. Nhưng chúng ta sẽ không gọi nó là trí tuệ nhân tạo. Những khả năng mới này sẽ trở thành vô hình với chúng ta, là các phần bổ sung của tâm trí mở rộng của chúng ta cùng với các công cụ tìm kiếm và điện thoại thông minh của chúng ta.
Đây chính là nguyên tắc biên giới đang hoạt động. Trí tuệ nhân tạo đang phát triển nhanh đến mức sắp trở thành công nghệ thông thường và một biên giới mới sẽ là trí tuệ nhân tạo. Việc nâng cấp lên công nghệ nên được coi là một dấu hiệu danh dự cho một ý tưởng trước đó từng nằm trên bờ cắt của khả thi. Hiện tượng nguyên tắc biên giới có nghĩa là trí tuệ nhân tạo sẽ mãi mãi ám chỉ những phương pháp hoài nghi, trong khi công nghệ sẽ ám chỉ những gì có thể được đưa vào hoạt động ngay hôm nay. Chúng tôi tin rằng chúng ta cần cả hai.
Tại Sequoia, chúng tôi đã cố gắng trở nên cụ thể hơn trong cách nói về trí tuệ nhân tạo (AI) nội bộ và với các nhà sáng lập. Chúng tôi tập trung vào các công nghệ cụ thể có thể được áp dụng vào công việc, chẳng hạn như transformers cho các mô hình ngôn ngữ lớn hoặc diffusion cho việc tạo hình ảnh mới. Điều này làm cho khả năng của chúng tôi để đánh giá một dự án trở nên rõ ràng, cụ thể và thực tế hơn nhiều.
Hành trình khởi nghiệp bắt đầu bằng ngôn ngữ. Chỉ thông qua ngôn ngữ, các công ty mới có thể thể hiện sự độc nhất về sản phẩm của họ và lợi ích của nó đối với khách hàng từ khi sản phẩm chưa hoàn thiện. Sự cụ thể trong ngôn ngữ là chìa khóa để tạo ra danh mục sản phẩm, thiết kế công ty và giữ vị thế dẫn đầu trên thị trường - những thành phần tạo nên sự tồn tại lâu dài của các công ty.
Độ chính xác này càng quan trọng hơn khi các nhà sáng lập lướt sóng những đợt tăng trưởng của trí tuệ nhân tạo để giữ vững vị trí tại tuyến đầu. Những nhà sáng lập có thể định nghĩa ngôn ngữ như công nghệ hàng ngày sẽ có lợi thế riêng.