Kính mắt thông minh của Envision giúp người mù đọc tài liệu

Envision, một trong những nhà phát triển hàng đầu của kính mắt thông minh giúp người mù đọc và xác định đối tượng, đã tích hợp trợ lý giọng nói đột phá vào kính của họ, được trang bị trí tuệ nhân tạo tiên tiến nhất từ trước đến nay.Đã tích hợp vào sản phẩm của Microsoft công ty công nghệ hàng đầu thế giới.

Từ khi ra mắt vào năm 2020, Envision có trụ sở tại Hà Lan và sử dụng eyewear Google Glass để chụp các văn bản trong tài liệu hoặc trên bao bì để tạo ra đầu ra trình đọc văn bản thành giọng nói cho người đeo ngoài các tính năng khác.

Plugin mới nhất này cho ChatGPT 4.0 bằng cách sử dụng API được thông báo sớm hơn trong tháng này, đưa công nghệ hỗ trợ người khuyết tật về thị giác đến mức độ chưa từng thấy trước đó bằng cách cho phép các khía cạnh của giải thích tài liệu tương tự như những gì có thể đạt được bởi người có tầm nhìn hoàn toàn.

Trong quá khứ, những người sử dụng muốn trích xuất thông tin văn bản quan trọng như số dư trong hóa đơn tiện ích hoặc hướng dẫn nấu ăn trên bao bì thực phẩm đã phải sử dụng kiếnh của họ để quét và đọc tất cả các văn bản có sẵn. Điều này đồng nghĩa với việc lãng phí thời gian để lọc thông tin dư thừa cho đến khi thông tin quan trọng được thông báo.

Người sử dụng bây giờ có thể đơn giản là chụp ảnh văn bản thông qua camera của kính và sau đó sử dụng giọng nói của họ để hỏi ChatGPT về tài liệu.

Việc này có thể đặt câu hỏi từ "Số dư trong hoá đơn này là bao nhiêu?" đến "Có các tùy chọn chay cho người ăn chay trong thực đơn này?".Chỉ trong nháy mắt, Ask Envision sẽ cung cấp các câu trả lời chi tiết và chính xác cho người đeo kính thông qua đầu ra giọng nói.

Với khả năng hiểu ngôn ngữ tự nhiên đến mức yêu cầu, nếu được yêu cầu, ChatGPT vô cùng nhanh chóng cũng có thể sáng tác một bản rap theo phong cách của Eminem, hoặc bất kỳ nghệ sĩ nào được chọn, bằng cách sử dụng các từ trong danh mục thực đơn của nhà hàng hoặc tờ quảng cáo của công ty!

Ứng dụng Ask Envision cũng đơn giản hóa giao diện người dùng mặc dù triển khai công nghệ cực kỳ phức tạp. Người dùng chỉ cần đặt câu hỏi hoặc duy trì một cuộc trò chuyện cơ bản.

Theo Mahadevan, CEO của Envision, bước tiến mới này là để kính trở nên dễ tương tác với người dùng như nó sẽ được nếu có một người nhìn đồng hành để trả lời câu hỏi ngồi cạnh bạn: "Mục tiêu cuối cùng là muốn nhìn thấy các kính mắt dễ dàng tương tác với người dùng hơn, như là nếu có một người nhìn đồng hành để trả lời câu hỏi của họ.

Các khả năng của ChatGPT là vô tận, từ nhận diện bản ghi âm và định vị hướng dẫn đến đối tượng khác nhau.

Trong tương lai, trọng tâm sẽ được đặt vào khả năng để tận dụng sức mạnh của ChatGPT để nhận dạng hình ảnh, đồ vật và cảnh quan trực tiếp - chứ không chỉ là thông tin đơn thuần.

Những khó khăn hiện nay của người khuyết tật về thị giác có thể trở thành sự tiện lợi và tương tác mà những năm gần đây không ai có thể nghĩ đến.