Một vài giờ sau khi công bố lớn trong buổi sáng hôm nay, Humane đã mở cửa đón tiếp một số phóng viên. Văn phòng tọa lạc tại một tòa nhà không đặc biệt ở khu SoMa của San Francisco, là nơi làm việc của các nhóm thiết kế phần cứng của startup.
Bên cạnh là một văn phòng khác dành cho các kỹ sư sản phẩm của Humane, trong khi nhóm kỹ sư điện tử hoạt động tại một không gian thứ ba ngay đối diện đường phố. Công ty cũng có một văn phòng tại New York, tuy nhiên, hầu hết nhân viên trong số 250 người làm việc tại đây, ở San Francisco.
Hiện nay, một phần không gian của văn phòng được dùng để trưng bày các trạm demo (với chính sách cấm quay phim nghiêm ngặt), nơi có trưng bày các phiên bản Ai Pin khác nhau, trong tình trạng khỏa thân từ ngoại vi. Trước khi tham gia vào đó, tuy nhiên, các đồng sáng lập của Humane đứng trước một nhóm ghế, hai bên một màn hình phẳng cho thấy tầm nhìn của công ty.
CEO Bethany Bongiorno tường thuật một lịch sử ngắn của công ty, bắt đầu từ khoảng cách cách cô gặp gỡ đồng sáng lập và chủ tịch Imran Chaudhri vào ngày đầu tiên làm việc tại Apple. Toàn bộ lịch sử của công ty liên quan trở lại công ty cũ của họ. Họ đã thu phục CTO Patrick Gates, cùng với khoảng 90 cựu nhân viên khác của Apple, theo báo cáo.
Ảnh: Brian Heater
Chủ yếu, Chaudhri tạo dựng câu chuyện của công ty như là một chuỗi S - chu kỳ 15 năm về công nghệ tạo nền tảng và dần nhường chỗ cho cái mới. "Kỷ nguyên trước đã giảm tốc", ông nói với phòng, nói rằng điện thoại thông minh "đã 16 tuổi" — mặc dù điều này có vẻ như là một lời châm biếm ám chỉ đến nhà tuyển dụng cũ, với chiếc iPhone đầu tiên của họ xuất hiện vào năm 2007.
Ông tạo dựng sản phẩm đầu tiên của Humane như là một "cách mới để tư duy, một cơ hội mới." Đây là nỗ lực để "hiện thực hóa trí tuệ nhân tạo." Buổi thuyết trình trực tiếp có vẻ giản dị hơn so với những video trước đó muốn cho bạn tin. Thật sự, các tuyên bố vẫn hoành tráng và toàn diện, liên kết thiết bị mặc áo cài áo là bước tiến tiếp theo trong hành trình tính toán từ những máy tính cỡ phòng đến nay, nhưng cuộc trò chuyện trở nên thực tế hơn khi thiết bị được trưng bày trước mặt chúng tôi.
Thiết bị có kích thước như một cuốn sách diêm, trang bị bộ xử lý Snapdragon và bộ nhớ trong 32GB. Máy ảnh có cảm biến 12 megapixel được thiết kế cho điện thoại thông minh nhưng tích hợp vào mô-đun riêng của Humane. Có cảm biến gia tốc và cảm biến con quay hồi chuyển, cùng cảm biến chiều sâu và thời gian bay. Giống như các sản phẩm của Apple, sản phẩm được thiết kế tại California và chủ yếu gia công sản xuất tại châu Á.
Phần lớn bề ngoài của thiết bị được chiếm bởi một bảng cảm ứng chứa phần lớn các thành phần trên bảng và một pin có thể dùng được trong 4 hoặc 5 giờ. Phía trên đó, một thanh camera chứa các cảm biến trên, cùng với hệ thống chiếu laser — điều thú vị nhất trong toàn bộ sự kiện. Thanh camera được nghiêng về phía dưới. Humane cho biết họ đã thử nghiệm chân gắn trên nhiều hình thể khác nhau và đã chọn một thiết kế phù hợp với người dùng có vòng 1 lớn hơn.
Công ty cũng cho biết đã thử nghiệm hệ thống chiếu laser với một loạt các loại da khác nhau, đảm bảo rằng nó sẽ hiển thị rõ. Mặc dù gây ấn tượng về mặt hình ảnh, nhưng hình chiếu được coi là một tính năng phụ của cái chính là sản phẩm hoạt động bằng giọng nói.
Nếu, tuy nhiên, bạn đang ở trong một môi trường quá ồn ào hoặc quá yên tĩnh để phù hợp với loa nhỏ hướng lên trên đầu thiết bị, hãy chạm vào bề mặt cảm ứng và máy ảnh sẽ bắt đầu tìm kiếm một bàn tay. Ngay khi phát hiện thấy, nó sẽ bắt đầu chiếu ảnh.
Tác giả hình ảnh: Brian Heater
Chaudhri đã thể hiện tính năng này trong một buổi nói chuyện TED vào tháng 5. Một cuộc gọi mô phỏng đến từ Bongiorno sau khoảng một hoặc hai phút, và được chiếu lên lòng bàn tay của anh ấy dưới dạng văn bản. Từ đây, anh ấy có thể chạm vào lòng bàn tay để chấp nhận hoặc từ chối cuộc gọi, và hệ thống sẽ nhận diện các chuyển động và hoạt động tương ứng.
Nhưng hệ thống laser có thể hiển thị nhiều hơn thế. Nó có thể hiển thị văn bản từ tin nhắn, mà bạn có thể cuộn qua bằng cách kẹp tay cùng cử chỉ vuốt trên cùng một tay. Chúng cũng có thể hiển thị xem trước sơ bộ của các hình ảnh bạn chụp, mặc dù tia laser màu xanh không thể làm nổi bật những chi tiết phức tạp tinh tế của một bức ảnh.
"Ổ cắm AI" có một chút trọng lượng, tuy nhiên điều này được cân bằng một phần bằng "bộ tăng cường pin" đi kèm trong hộp, giúp gia tăng tuổi thọ pin lên khoảng chín giờ. Sản phẩm còn đi kèm một hộp dạng trứng thêm một lần sạc đầy cho sản phẩm. Bạn có thể gắn một trong hai Ổ cắm, bộ tăng cường pin hoặc cả hai vào, và chúng sẽ tự động cài vào vị trí. Việc sạc pin được thực hiện thông qua một dãy chân cắm ở phía sau thiết bị. Trong hộp còn có một chiếc tấm sạc dành cho việc sử dụng tại nhà.
Bongiorno xác nhận những thông tin đầu tiên về một lô hàng ban đầu gồm 100.000 đơn vị. "Tôi nghĩ như mọi công ty startup thiết bị cứng khác, chúng tôi muốn đảm bảo kế hoạch dự phòng cho tất cả các tình huống," cô nói. "Đối với chúng tôi ở giai đoạn đầu, điều quan trọng là xem điều gì là bảo thủ, đúng và có trách nhiệm, liên quan đến nhu cầu và cho phép chúng tôi có lựa chọn nếu nhu cầu của chúng tôi vượt quá 100.000.""
Cô bổ sung rằng, tính đến ngày hôm qua, hơn 110.000 người đã đăng ký vào danh sách chờ - mặc dù con số này chỉ cho thấy sự tò mò hơn là kế hoạch mua hàng thực tế, do không yêu cầu đặt cọc. Danh sách này cũng toàn cầu, trong khi sản phẩm chỉ được đặt hàng trước ở Mỹ, nơi nó sẽ được bán ra vào "đầu năm sau." Nhóm đăng ký chờ ban đầu sẽ được "ưu tiên mua hàng".
Tác giả hình ảnh: Brian Heater
Trái tim của thiết bị là trí tuệ nhân tạo. Đây là một trong những sản phẩm phần cứng đầu tiên lướt trên làn sóng hưng phấn hiện tại về trí tuệ nhân tạo tạo ra từ đầu, tuy nhiên nó chắc chắn sẽ không phải là cuối cùng. Tên Sam Altman đã liên quan chặt chẽ đến startup kể từ ngày công bố. Tôi hỏi Sam Altman và OpenAI đã liên quan đến quá trình tạo ra sản phẩm như thế nào.
"Sam dẫn dắt vòng gọi vốn Series A của chúng tôi vào năm 2020. Imran rõ ràng rằng Sam là mục tiêu của vòng gọi vốn Series A và thực sự muốn anh ấy tham gia," Bongiorno nói. "Tôi nghĩ có sự tôn trọng và sự phấn khích đáng kinh ngạc về những gì chúng tôi và Sam đều tin rằng là tương lai, về máy tính. Anh ấy đã là một người ủng hộ và người giúp đỡ đáng kinh ngạc của chúng tôi, và luôn sẵn lòng giúp đỡ khi chúng tôi cần lời khuyên và hướng dẫn. Chúng tôi đã làm việc với đội ngũ kỹ thuật OpenAI. Đội ngũ kỹ sư của chúng tôi đã cùng nhau hợp tác và làm việc thân thiết."
Theo Chaudhri, GPT là một trong nhiều mô hình ngôn ngữ đa nhiệm được hệ thống sử dụng. Ông cũng xác nhận rằng GPT-4 sẽ là một trong số các phiên bản mà hệ thống sử dụng. Tuy nhiên, cuối cùng, các hệ thống trí tuệ nhân tạo cụ thể được tận dụng cho mỗi nhiệm vụ cụ thể có phần mờ mịt theo thiết kế.
Chúng được truy cập một cách cụ thể, dựa trên quyết định của pin về hành động thích hợp trong từng trường hợp.
Điều này cũng áp dụng cho các truy vấn trên web. Hệ thống tìm kiếm trên nhiều công cụ và nguồn tài nguyên khác nhau như Wikipedia. Một số sẽ là đối tác chính thức, nhưng cũng có những đối tác không chính thức. Cho đến nay, số đối tác thực sự vẫn còn hạn chế. Có OpenAI và Microsoft, cũng như Tidal, là ứng dụng nhạc mặc định của hệ thống. Một ví dụ được đưa ra trong một trong các phiên trình diễn của chúng tôi là "phát nhạc sản xuất bởi Prince", thay vì cách rõ ràng hơn là "phát Prince."
"Một phần của trí tuệ nhân tạo của chúng tôi là sở hữu. Chúng tôi xây dựng các trí tuệ nhân tạo riêng của mình, sau đó sử dụng GPT và các mô hình từ OpenAI", Bongiorno nói. "Chúng tôi có thể thêm vào các mô hình ngôn ngữ học và nhiều dịch vụ khác từ các công ty khác, và mục tiêu của chúng tôi là trở thành nền tảng cho mọi người và cho phép truy cập đến nhiều trải nghiệm và dịch vụ trí tuệ nhân tạo khác nhau, vì vậy mô hình kinh doanh được cấu thành một cách cho phép chúng tôi làm điều đó. Và tôi nghĩ chúng tôi sẽ nghĩ về các mô hình doanh thu khác mà chúng tôi cũng có thể thêm vào và các nguồn thu nhập khác trên nền tảng này."
Tín đồ hình ảnh: Brian Heater
Mục tiêu là tạo trải nghiệm mượt mà, cả về những gì đang diễn ra ở phía sau với ngôn ngữ học và tìm kiếm trên web cùng các cập nhật. Hệ thống được thiết kế để liên tục cập nhật và thêm tính năng mới trong nền. Nó cũng sử dụng bối cảnh bổ sung, bao gồm các câu hỏi được đặt gần đây và vị trí, sử dụng GPS trên bảng điều khiển.
Hình ảnh cũng là một yếu tố quan trọng. Camera trên bảng điều khiển có góc rộng siêu rộng với góc nhìn 120 độ. Không có chế độ tự động lấy nét - thay vào đó, nó là một tiêu cự cố định. Trong ánh sáng tại văn phòng SF, ít nhất là nhìn ảnh rất ổn. Có một lượng lớn nhiếp ảnh tính toán xảy ra ở ngoài thiết bị, bao gồm việc xem xét xem ghim có đúng mức khi chụp ảnh và xác định hướng ảnh cuối cùng.
Mọi thứ vẫn còn rất sớm ở đây, nhưng rõ ràng đã có rất nhiều tâm huyết (và tiền bạc) đổ vào sản phẩm này. Câu hỏi lớn nhất có lẽ là nhu cầu. Liệu Humane thực sự đã tìm ra một ứng dụng hủy diệt? Đối với nhà sản xuất đồng hồ thông minh, sức khỏe luôn là câu trả lời từ lâu. Nhưng việc theo dõi sức khỏe chỉ đóng vai trò quan trọng hạn chế ở đây.
Sản phẩm thực tế không tiếp xúc trực tiếp với da người sử dụng, vì vậy các chỉ số sức khỏe mà nó có thể thu thập là hạn chế, có thể chỉ là một bước đếm số bước đi - tuy nhiên tính năng này cũng không được hỗ trợ vào lúc này. Tính năng liên quan đến sức khỏe lớn nhất ở thời điểm hiện tại là đếm calo, cụ thể là cho bạn biết có bao nhiêu calo và các thông tin dinh dưỡng khác trong món thức ăn bạn cầm trước camera, sử dụng một nền tảng nhận dạng thực phẩm bên thứ ba không được tiết lộ tên.
Tín đồ hình ảnh: Brian Heater
Giá cả chắc chắn sẽ là một rào cản đối với thiết bị chưa được kiểm chứng - 699 đô la về cơ bản không có gì so với tiêu chuẩn điện thoại thông minh, nhưng lại đòi hỏi nhiều đối với một sản phẩm thế hệ đầu và hình thức mới. Thêm 24 đô la mỗi tháng cũng không giúp, tuy nhiên Bongiorno cũng nói thêm: "Bạn sẽ có một số điện thoại; bạn sẽ có cuộc trò chuyện, tin nhắn và dữ liệu không giới hạn; bạn sẽ có càng nhiều truy vấn trí tuệ nhân tạo như bạn muốn, cùng với tất cả các dịch vụ trí tuệ nhân tạo của chúng tôi. Hôm nay, chúng tôi nhìn thấy có bao nhiêu sự hào hứng với ChatGPT, nơi mọi người đang trả phí để truy cập vào đó."
Tuy nhiên, nếu bạn không trả tiền tháng đó, sản phẩm thực sự chỉ là một vật trang trí không có tác dụng cho đến khi bạn bắt đầu đăng ký.
Trước khi kết thúc phiên của chúng tôi, tôi hỏi Chaudhri làm sao công ty lại chọn cái ghim này, đặc biệt là khi các thiết bị được đeo trên đầu đã từ lâu được xem là mặc định.
Chắc chắn rằng nhà tuyển dụng cũ của ông, Apple, đang đặt cược vào khuôn mặt với Vision Pro sắp tới.
"Ông ta nói: "Tính toán ngữ cảnh luôn được cho là một thứ mà bạn phải đeo trên mặt. Chỉ có nhiều vấn đề liên quan đến điều đó. Nhiều người đeo kính để nhìn rõ hoặc bảo vệ mắt mình. Đó là một quyết định rất cá nhân - hình dạng của khung kính, trọng lượng của khung kính. Tất cả điều đó tạo nên một cái gì đó duy nhất, chính như bạn. Nếu nhìn vào sức mạnh của ngữ cảnh, và đó là rào cản để đạt được tính toán ngữ cảnh, phải có một con đường khác. Vì vậy, chúng tôi bắt đầu tìm hiểu xem cái gì cho phép chúng tôi cá nhân hóa hơn nữa? Chúng tôi nghĩ ra rằng tất cả chúng ta đều mặc quần áo, vậy làm sao để chúng ta trang trí một thiết bị mà nó cung cấp thông tin ngữ cảnh trên quần áo của chúng ta?