Nếu bạn đã từng trò chuyện với những người tại Tangram Vision, có khả năng bạn đã nắm bắt nhiều hơn về tình trạng của sự nhận biết cho ngành robot. Nhóm của startup đóng cư trú tại Boulder, Colorado có hơn 60 năm kinh nghiệm kết hợp về nhận biết và cảm biến.
Thành lập vào năm 2020, Tangram đã phát triển một bộ công cụ để giúp các nhà robot học giải quyết các vấn đề về nhận biết như hiệu chuẩn cảm biến đa chế độ, kết hợp cảm biến và thời gian hoạt động của cảm biến. Và bây giờ, công ty đang bước vào lĩnh vực cảm biến nhìn 3D cho robot với chiếc cảm biến độ sâu mang tên HiFi có sức mạnh của trí tuệ nhân tạo.
HiFi đã ra mắt trên Kickstarter với người ủng hộ sớm có thể nhận một chiếc HiFi với giá $349, giảm 36% so với giá bán lẻ $549. Tangram đã vượt qua mục tiêu thu $25,000 chỉ sau bốn giờ kể từ khi khởi động; đến lúc báo chí viết, chiến dịch đã thu được hơn $40,000. Tangram dự kiến sẽ gửi các đơn vị HiFi đầu tiên vào tháng 4 năm 2024.
Đội ngũ Tangram Vision xuất phát từ Occipital, công ty tính toán không gian đã ra mắt cảm biến 3D Structure Sensor thông qua một chiến dịch thu $1.3 triệu trên Kickstarter vào năm 2013.
"Công cụ dành cho robot và trí tuệ nhân tạo đã phát triển rất nhanh trong vài năm qua, nhưng cảm biến không bắt kịp," Brandon Minor, CEO của Tangram Vision nói. "Sau khi nói chuyện với hàng trăm kỹ sư robot học và trí tuệ nhân tạo, chúng tôi biết họ muốn dành ít thời gian hơn để vật lộn với cảm biến và hơn thời gian để xây dựng sản phẩm thú vị. HiFi giúp thêm dữ liệu 3D được gia tăng bằng trí tuệ nhân tạo vào robot và nhiều hơn thế nữa."
Một cảm biến 3D HiFi được gắn lên cánh tay cobot từ Universal Robots. Nguồn: Tangram Vision
Các khả năng của HiFi
HiFi sử dụng các máy ảnh ams Mira220. Nó kết hợp cặp stereo IR chụp toàn cảnh góc nhìn 136° với độ phân giải 2-megapixel và một máy ảnh RGB góc nhìn 136° cũng với độ phân giải 2-megapixel và hai máy chiếu hoạt động đồng thời. Baseline 65mm cho phạm vi đo từ 0.3m đến 5m với tốc độ từ 30-60 khung hình mỗi giây. Nhờ độ phủ góc nhìn của nó, Tangram cho biết các nhà robot học có thể thay thế hai cảm biến đo độ sâu bằng một chiếc HiFi duy nhất trong nhiều ứng dụng.
HiFi bao gồm một loạt phần mềm, trình điều khiển và công cụ trên bo mạch cho các nhà robot học
Ví dụ, nó được thiết kế để hoạt động tự nhiên với ROS 2. Nó đi kèm với 8 TOPS của sức mạnh xử lý học máy cho phép kết hợp AI và dữ liệu 3D trên cảm biến. Nó cũng có 8GB bộ nhớ onboard giúp cho việc chạy mạng nơ-ron trên HiFi được hàng Tangram mô tả.
Nó có một bộ xử lý chi tiết trên con chip Jacinto của Texas Instruments (TI). Tangram cho biết bộ xử lý Jacinto cho phép HiFi tương thích với Thư viện Học sâu của TI đi kèm với các mô hình sẵn sàng triển khai cho việc phân đoạn cảnh, ước lượng tư thế, nhận dạng đối tượng, theo dõi đối tượng và nhiều hơn nữa. HiFi cũng được trang bị các công cụ phần mềm cảm biến của Tangram như tự hiệu chuẩn, đồng bộ thời gian và quản lý thời gian hoạt động.
Các ứng dụng robot
Tangram cho biết vốn dĩ họ không có ý định phát triển cảm biến 3D. Tuy nhiên, họ nói rằng họ đã bị ép buộc làm điều đó sau khi nhiều khách hàng robot của họ tỏ ra thất vọng với tình trạng cảm biến 3D.
"Bây giờ, các kỹ sư robot phải lựa chọn giữa chất lượng dữ liệu 3D, khả năng trí tuệ nhân tạo hoặc độ tin cậy. Nhưng thực sự, họ muốn cả ba thứ," Minor nói.
Trong một bài chứng chỉ cho chiến dịch HiFi, Nathan Brooks, giám đốc công nghệ của PickNik, dường như đã đồng ý. Ông nói công ty của mình đã "nói chuyện với Tangram trong nhiều năm và chia sẻ một số khó khăn của chúng tôi trong triển khai các ứng dụng robot trong thế giới thực và môi trường không cấu trúc."
Rodnitzky nói rằng robot di động lịch sử là điểm mạnh của Tangram. Nhưng ông nói HiFi sẽ cho phép công ty làm việc với các loại robot và ứng dụng khác nhau.
"Ứng dụng hạt nhặt từ trước tới nay không phù hợp với chúng tôi, nhưng bây giờ thì lại phù hợp," ông nói. "Điều này có thể cho phép chúng tôi thử nghiệm cả trong tự động hóa công nghiệp, nơi Zivid, IDS và Cognex đã làm chủ với các cảm biến đắt tiền hơn.
Cơ hội thị trường
Để hiểu cơ hội mà Tangram định tưởng cho HiFi, chỉ cần nhìn vào sự biến động của thị trường cảm biến độ sâu trong những năm gần đây. Kinect từng là một lựa chọn đáng tin cậy, nhưng nó đã tàn lụi khi Apple mua lại PrimeSense với giá 360 triệu đô la vào năm 2013. Google đã đóng dự án Tango vào cuối năm 2017 sau ba năm triển vọng. Và Intel gần như đóng cửa phân phối RealSense trước khi quyết định tiếp tục giới thiệu các cảm biến độ sâu mới.
Tangram không có quy mô như các công ty đã được đề cập ở trên. Nhưng Minor không nghĩ rằng đó là vấn đề.
"Tôi không biết liệu mọi người có tin tưởng những người chơi lớn hơn đó không. Có rủi ro ở đây, đồng thời," ông nói. "Chúng tôi không phải nuôi sống nhiều miệng ăn, và điều này có thể thay đổi cuộc chơi cho ngành công nghiệp và công ty của chúng tôi."
Minor cũng nói rằng việc bán HiFi là cơ hội để Tangram giới thiệu dịch vụ hiệu chuẩn và mô hình doanh thu định kỳ của mình cho các công ty chưa từng nghe đến.
"Chúng tôi đã ra mắt Tangram để giảm rào cản vào lĩnh vực thị giác máy tính," Minor nói.
Đó là lý do tại sao chúng tôi bắt đầu từ việc hiệu chuẩn - một nhiệm vụ không thể và rất khó khăn. HiFi là một mảnh ghép khác của bức tranh đó. Hãy để chúng tôi xây dựng một cảm biến đáp ứng tiêu chuẩn chất lượng dữ liệu chiều sâu và đi kèm với khả năng xử lý trí tuệ nhân tạo tuyệt vời để thực hiện các quy trình phức tạp. Và các nhà robot học có thể tập trung vào các ứng dụng và những điều họ thực hiện tốt.