Công ty tỷ USD làm thiết bị AI cho người mù

Ngày đăng: 19/07/2019 - 1251 lượt đọc

Với công nghệ học máy và hình thức sử dụng đơn giản, OrCam giúp người khiếm thị điều khiển thế giới thông qua thiết bị nhỏ gắn vào mắt kính. Stephen Hamilton là cựu binh không quân Mỹ, đã trải qua 7 ca ghép giác mạc và 18 cuộc phẫu thuật không thành công trước khi chấp nhận là mình đang dần mất đi khả năng nhìn thấy mọi vật. Khi bị mù, ông buộc phải từ bỏ công việc của một kỹ sư mạng và kiến trúc sư.

Nhưng hy vọng chưa hoàn toàn dập tắt với Hamilton. Ông đã tham gia một chương trình tập huấn kéo dài vài tháng được tạo ra để giúp những người mắt kém hoặc không nhìn thấy có thể điều khiển thế giới thông qua một thiết bị nhỏ được gắn trên kính có tên OrCam MyEye. Khi dùng ngón tay chạm vào một đoạn trang sách, tờ báo hoặc thực đơn trong nhà hàng, công nghệ sẽ giúp thiết bị phân tích ngôn ngữ và đọc to cho ông biết thông qua một chiếc loa nhỏ.

Mặc dù Hamilton gần như đã bị mù, ông muốn sử dụng MyEye vốn được thiết kế cho người có thị lực kém. Lần đầu tiên trở về phòng mình từ trung tâm thử nghiệm, cựu binh dừng trước cửa và chỉ vào tấm bảng, lập tức thiết bị nói với ông là “Stephen Hamilton”. “Tôi bắt đầu khóc vì nhận ra mình có thể độc lập trong một số tình huống của cuộc sống”. Trước đó, Hamilton về được căn phòng của mình dựa vào sự tính toán thời gian di chuyển.

Giờ thiết bị đã trở thành vật bất ly thân với người đàn ông này. Tháng 11 năm ngoái, khi công ty từ Israel ra mắt phiên bản không dây mới gọi là MyEye 2.0, Hamilton là một trong những người nâng cấp ngay tháng đầu tiên.

Người dùng chỉ cần chỉ tay thì thiết bị sẽ đọc thông tin trước mắt cho họ. Ảnh: OrCam.

Người dùng chỉ cần chỉ tay thì thiết bị sẽ đọc thông tin trước mắt cho họ. Ảnh: OrCam.

OrCam đã thay đổi cuộc đời của cựu binh Hamilton. Dự án hình thành năm 2010 bởi nhà khoa học máy tính Amnon Shashua và doanh nhân Ziv Aviram, được định giá đến 1 tỷ USD. Tất cả đến từ nền tảng thông minh và trực quan qua những cú chỉ tay của người dùng. Những gì họ cần làm chỉ là đưa ngón tay ra, camera sẽ nhận diện, chụp ảnh các dòng chữ và bắt đầu đọc ra. “Chúng tôi tin rằng chỉ vào thứ gì đó là hành động tự nhiên nhất của một con người. Hãy thử nhìn vào những đứa trẻ, bạn sẽ thấy chúng chỉ tay vào một vật và hỏi đó là gì”, CEO Ziv Aviram giải thích.

Sử dụng hình thức chỉ tay làm nền, MyEye có thể đọc chữ trong mọi tình huống, cho người dùng biết khi trang giấy bị cầm ngược hoặc chưa đủ ánh sáng để nhận diện chữ. Ngoài ra thiết bị này còn có thể ghi nhớ và nhận dạng 100 gương mặt, nhận ra hàng triệu sản phẩm, lưu trữ 150 thông tin khác như thẻ tín dụng hay đồ tạp hóa. Việc nhận diện màu sắc cũng được đánh giá cao khi có thể giúp người dùng chọn quần áo vào buổi sáng.

MyEye xác định những gì cần đọc ra dựa vào chỉ tay của người dùng. Tuy nhiên điều này lại rất khó cho những người hoàn toàn mất khả năng nhìn, dù Hamilton nói ông có thể sử dụng nó sau vài tuần làm quen. Thiết bị cũng có chế độ tự động nhận diện khuôn mặt và thông báo cho người dùng nếu có ai đó đang ở trước mặt họ và chỉ cần bỏ tay ra khi muốn thiết bị ngừng đọc.

“Tôi tưởng tượng bị mù giống với khuyết tật nhưng giờ thì không còn như vậy nữa. Tôi cảm thấy tự do, điều chưa từng nghĩ sẽ có thể xảy đến với mình”, Hamilton nói.

OrCam mất 5 năm để phát triển và ra mắt MyEye vào 2015. Aviram cho biết trong quá trình triển khai, anh và đội ngũ của mình đã nói chuyện với hàng trăm người dùng tiềm năng, trong đó 90% nói rằng họ muốn có khả năng đọc. Điều này khiến Aviram bất ngờ và để hiểu về nhu cầu ấy, CEO đã thử ngăn mình không đọc trong một ngày. “Sau một giờ tôi nhận ra tầm quan trọng của nó. Chỉ cần năm phút là bạn có thể biết thế giới này có bao nhiêu là thứ được hình thứ từ ngôn ngữ viết”, anh chia sẻ.

Một số tính năng khác cũng đến từ việc nghiên cứu người dùng, trong đó có nhận diện màu sắc. Một người nói rằng anh ấy không thể nhìn thấy vợ mình trong khoảng cách một mét, thế là Aviram thêm vào tính năng nhận diện khuôn mặt. Các tính năng sẵn có trong các sản phẩm khác nhưng chúng có xu hướng chỉ có một chức năng. Hamilton liệt kê một số thiết bị khác mà ông từng được thử là đọc văn bản, đọc mã vạch và nhận diện khuôn mặt, nhưng cũng thừa nhận không phải cái nào cũng cho kết quả tốt nhất, đặc biệt trong đọc mã vạch.

Toàn bộ MyEye 2.0 có kích thước bằng một ngón tay và chỉ nặng hơn 200 gram. Thiết bị sử dụng thuật toán học sâu dựa vào quá trình trải nghiệm với hàng triệu bức ảnh của các câu chữ và sản phẩm. Aviram cho biết điều này tương tự quá trình của một đứa trẻ khi học một thứ gì mới mẻ.

“Thông qua tiếp xúc với một lượng lớn dữ liệu và thuật toán phức tạp, bạn có thể dạy thiết bị nhận diện những sản phẩm, gương mặt và ngôn ngữ khác nhau. Tất cả quá trình được thực hiện trong thời gian thực và không cần qua online, một phần quan trọng trong bảo vệ quyền riêng tư của người dùng”.

Thiết bị được gắn vào mắt kính của người dùng. Ảnh: OrCam.

Thiết bị được gắn vào mắt kính của người dùng. Ảnh: OrCam.

Theo công ty này, thiết bị đã trao cho Hamilton và hàng chục nghìn người khác một hình thức độc lập mới trong cuộc sống. “Đến nhà sách, ngồi xuống và thưởng thức tác phẩm là một thú vui. Không ai biết tôi bị mù ngoại trừ chiếc gậy phải mang theo bên mình. Khi nhận ra thì họ sẽ sốc bởi tôi đang đọc sách hay xem thực đơn nhà hàng như bao người bình thường khác”, Hamilton hào hứng nói.

Khách hàng tiềm năng của OrCam không chỉ là những người có vấn đề về mắt mà còn có thể là những đối tượng mắc chứng khó đọc hoặc những người bình thường lười đọc nhanh. Đại diện công ty cho biết đến nay họ đã bán hàng chục nghìn thiết bị tới 23 quốc gia với 18 ngôn ngữ.

MyEye cần vài giờ để quen dần với người dùng và mất vài tuần để có thể sử dụng được, đặc biệt là định hướng đầu để thiết bị có thể dễ dàng đọc cho người dùng. Lời phàn nàn lớn nhất của Hamilton là thiết bị chỉ giữ nguồn khoảng nhiều nhất là hai tiếng và cần 40 phút để sạc. Vì thế mà ông phải luôn mang cục sạc bên mình, mọi lúc mọi nơi.

Hamilton hy vọng một ngày không xa sẽ không cần phải đeo kính và bằng cách nào đó mà MyEye có thể gắn phía sau tai giúp ông thuận tiện hơn khi sử dụng.

Nguồn: Trương Sanh (theo Fast CoDesign)

Phạm Mai