Tập đoàn Toshiba đã phát triển một AI với tính năng nhận dạng 3D có khả năng đo khoảng cách với độ chính xác của máy ảnh âm thanh nổi, bằng cách sử dụng hình ảnh được chụp bằng máy ảnh thương mại và phân tích độ mờ hình ảnh do ống kính máy ảnh gây ra bằng cách sử dụng học sâu. Công nghệ này sẽ loại bỏ việc sử dụng camera âm thanh nổi, cuối cùng làm giảm chi phí và không gian. Toshiba sẽ trình bày thành tựu này tại hội nghị quốc tế về thị giác máy tính (ICCV2019) sẽ được tổ chức tại Hàn Quốc vào ngày 30 tháng 10 năm 2019, từ 10 giờ sáng.
Cảm biến hình ảnh ngày càng trở nên quan trọng và các ứng dụng như rô bốt di chuyển vật thể, phương tiện không người lái tự hành, máy bay không người lái điều khiển từ xa kiểm tra cơ sở hạ tầng, v.v., không chỉ yêu cầu hình ảnh của đối tượng, chúng cần một thiết bị nhỏ để phân tích dữ liệu 3D bao gồm hình dạng và khoảng cách. Do đó, các nghiên cứu đã được tăng cường để phát triển công nghệ đo lường với camera một mắt (chúng dễ thu nhỏ) bằng cách sử dụng học sâu để học tốt hơn về hình dạng, nền và các dữ liệu phong cảnh khác của đối tượng được chụp ảnh.
Phương pháp này có một nhược điểm; Độ chính xác của khoảng cách được ước tính với sự trợ giúp của máy ảnh một mắt tùy thuộc vào dữ liệu phong cảnh đã học, điều này gây ra giảm độ chính xác do ảnh chụp ở các phong cảnh khác nhau. Để khắc phục điều này, Toshiba đã phát triển tính năng chụp ảnh khẩu độ có bộ lọc màu, trong đó hai bộ lọc màu được gắn vào ống kính và màu sắc và kích thước của ảnh mờ được phân tích theo khoảng cách từ chủ thể. Mặc dù điều này giải quyết được vấn đề phụ thuộc dữ liệu, nhưng việc sửa đổi các ống kính hiện có sẽ tốn kém thời gian và tiền bạc.
Toshiba đã khắc phục vấn đề này bằng cách phát triển AI với công nghệ nhận dạng 3D sử dụng học sâu để phân tích cách hình ảnh bị mờ theo vị trí của nó trên ống kính, nhằm đạt được phép đo khoảng cách với độ chính xác cao như hệ thống camera âm thanh nổi., với một máy ảnh một mắt bình thường nhưng không cần bất kỳ dữ liệu phong cảnh nào. Cho đến nay, về mặt lý thuyết, người ta coi là không thể đo khoảng cách dựa trên hình dạng của vết mờ, điều này giống nhau đối với các vật thể có cả khoảng cách và xa khi chúng cách đều tiêu điểm. Tuy nhiên, kết quả phân tích đã chỉ ra sự khác biệt đáng kể giữa hình dạng mờ của các vật thể ở gần và ở xa, ngay cả khi chúng cách đều tiêu điểm. Với điều đó, Toshiba đã phân tích thành công dữ liệu mờ từ các hình ảnh đã chụp bằng mô-đun học sâu được đào tạo với mô hình mạng nơ-ron sâu.
Khi ánh sáng đi qua thấu kính, hình dạng của vết mờ được tạo ra thay đổi tùy thuộc vào bước sóng của ánh sáng và vị trí của nó trong thấu kính. Trong mạng đã phát triển, vị trí và màu sắc được xử lý riêng biệt để cảm nhận đúng những thay đổi trong hình dạng mờ và sau đó, sau khi chuyển qua cơ chế chú ý có trọng số, sẽ kiểm soát vị trí trên gradient độ sáng cần lấy nét để đo chính xác khoảng cách. Thông qua việc học, mạng sau đó được cập nhật để giảm sai số giữa khoảng cách đo được và khoảng cách thực tế. Sử dụng mô-đun AI này, Toshiba đã xác nhận rằng một hình ảnh được chụp bằng máy ảnh thương mại có cùng độ chính xác đo khoảng cách được bảo đảm với máy ảnh âm thanh nổi. Thông tin thêm có thể được tìm thấy trên trang chính thức này của Toshiba.
Toshiba sẽ khẳng định tính linh hoạt của hệ thống với các máy ảnh và ống kính có sẵn trên thị trường, đồng thời tăng tốc độ xử lý hình ảnh, hướng tới việc triển khai công khai vào năm tài chính 2020.