Thị giác máy tính (Computer Vision/Machine Vision) là một trong những ứng dụng thú vị nhất của trí tuệ nhân tạo. Các thuật toán có thể hiểu hình ảnh, video chuyển động là nền tảng công nghệ quan trọng đằng sau nhiều đổi mới, từ các hệ thống tự động hóa, phương tiện tự lái đến máy móc công nghiệp thông minh và thậm chí cả bộ lọc trên điện thoại của bạn để làm cho hình ảnh bạn tải lên Instagram trông đẹp hơn.
Cùng với khả năng xử lý ngôn ngữ (xử lý ngôn ngữ tự nhiên, hoặc “NLP”), nó là nền tảng cho nỗ lực của chúng ta để tạo ra những cỗ máy có khả năng hiểu và học về thế giới xung quanh giống như ta. Nói chung, nó liên quan đến các ứng dụng được hỗ trợ bởi học sâu - mạng thần kinh được đào tạo trên hàng nghìn, hàng triệu hoặc hàng tỷ hình ảnh cho đến khi chúng trở thành chuyên gia phân loại những gì chúng có thể "nhìn thấy".
Giá trị của thị trường trong công nghệ thị giác máy tính được dự đoán sẽ đạt 48 tỷ đô la vào cuối năm 2022 và có thể là nguồn lực cho sự đổi mới và đột phá liên tục trong suốt cả năm. Vì vậy, chúng ta hãy xem xét một số xu hướng chính mà chúng ta sẽ theo dõi liên quan đến công nghệ hấp dẫn này:
- Thị giác máy tính tập trung vào dữ liệu
Trí tuệ nhân tạo lấy dữ liệu làm trung tâm dựa trên ý tưởng rằng cần tập trung vào việc tối ưu hóa chất lượng dữ liệu được sử dụng để đào tạo các thuật toán cũng như việc phát triển các mô hình và thuật toán. Được ủng hộ bởi Andrew Ng - nhà tiên phong nổi tiếng về học sâu - mô hình mới nổi này có liên quan đến các lĩnh vực AI nhưng đặc biệt là trong lĩnh vực thị giác máy tính. Một số mô hình nhận dạng hình ảnh dựa trên nền tảng học tập sâu đầu tiên được phát triển bởi Tiến sĩ Ng tại Google, với mục đích đào tạo máy tính nhận dạng hình ảnh của mèo và chúng đặc biệt phụ thuộc vào chất lượng dữ liệu mà chúng được cung cấp, thay vì chỉ số lượng. Việc tập trung vào việc cải thiện lặp đi lặp lại chất lượng của việc ghi nhãn - sử dụng các kỹ thuật tự động trích xuất và gắn nhãn dữ liệu - sẽ cho phép áp dụng công nghệ thị giác máy tính cho các vấn đề mà ở đó dữ liệu có sẵn ít hơn, có khả năng giảm chi phí (về tiền bạc cũng như tài nguyên máy tính ) và mở ra nhiều trường hợp sử dụng tiềm năng mới.
- Thị giác máy tính với sức khỏe và an toàn
Một trường hợp sử dụng quan trọng đối với thị giác máy tính là phát hiện nguy hiểm và đưa ra cảnh báo khi có sự cố. Các phương pháp đã được phát triển để cho phép máy tính phát hiện hành vi không an toàn trên công trường - chẳng hạn như công nhân không đội mũ cứng hoặc dây an toàn, cũng như giám sát môi trường nơi có máy móc hạng nặng như xe nâng đang hoạt động gần với con người, cho phép chúng tự động tắt nếu ai đó bước vào con đường của chúng. Với 2,7 triệu người bị thương do tai nạn tại nơi làm việc mỗi năm, theo Cục Thống kê Lao động Hoa Kỳ, đây là lĩnh vực mà các doanh nghiệp đang ngày càng đầu tư nhiều hơn để giảm chi phí nhân lực và tài chính do giám sát không chặt chẽ hoặc thiếu chú ý.
Tất nhiên, ngăn ngừa sự lây lan bệnh tật do vi rút gây ra cũng là một trường hợp sử dụng quan trọng ngày nay, công nghệ thị giác máy tính đang ngày càng được triển khai để giám sát việc tuân thủ các yêu cầu về giãn cách xã hội, cũng như các nhiệm vụ đeo khẩu trang.. Các thuật toán thị giác máy tính cũng đã được phát triển trong đại dịch hiện nay để hỗ trợ chẩn đoán nhiễm trùng do chụp X-quang phổi bằng cách tìm kiếm bằng chứng về nhiễm trùng và tổn thương hình ảnh phổi.
Thị giác máy tính trong bán lẻ
Mua sắm và bán lẻ là những khía cạnh khác của cuộc sống mà chúng ta chắc chắn nhận thấy sự phổ biến ngày càng tăng của công nghệ thị giác máy tính trong năm 2022. Amazon đã đi tiên phong trong khái niệm cửa hàng không cần thu ngân với các cửa hàng tạp hóa Go, được trang bị camera giúp nhận biết khách hàng đang sử dụng mặt hàng nào lấy từ các kệ. Nhiều chi nhánh hơn sẽ mở trong suốt năm 2022 và các nhà bán lẻ khác sẽ nhảy vào cuộc đua, bao gồm Tesco , công ty sẽ mở siêu thị miễn phí thanh toán đầu tiên ở Vương quốc Anh.
Ngoài việc giúp con người giảm bớt trách nhiệm quét mua hàng, thị giác máy tính còn có một số ứng dụng khác trong bán lẻ, bao gồm quản lý hàng tồn kho, nơi máy ảnh được sử dụng để kiểm tra lượng hàng trên kệ và trong kho và tự động đặt hàng bổ sung khi cần thiết. Nó cũng được sử dụng để theo dõi và hiểu các mô hình di chuyển của khách hàng xung quanh các cửa hàng nhằm tối ưu hóa việc định vị hàng hóa và tất nhiên, trong các hệ thống an ninh để ngăn chặn những kẻ phá hoại cửa hàng. Một trường hợp sử dụng ngày càng phổ biến khác liên quan đến việc cho phép khách hàng lấy thông tin về sản phẩm bằng cách quét mã vạch bằng điện thoại di động của họ.
Trong bán lẻ thời trang, một ứng dụng đặc biệt thú vị của thị giác máy tính là “ phòng thử đồ ảo"cho phép người mua hàng hầu như thử các món đồ mà không cần chạm vào chúng - máy ảnh trong gương chỉ cần chồng hình ảnh của quần áo lên hình phản chiếu của gương và thậm chí có thể xác định sản phẩm mà khách hàng đang thử và đề xuất các phụ kiện phù hợp đi kèm.
- Thị giác máy tính trong ô tô tự động và được kết nối
Thị giác máy tính là một yếu tố không thể thiếu trong các hệ thống kết nối trên ô tô hiện đại. Mặc dù suy nghĩ đầu tiên của chúng tôi có thể là về những chiếc xe tự hành sắp ra mắt, nhưng nó có một số công dụng khác trong loạt ô tô “được kết nối” hiện có trên đường và đậu trong nhà để xe. Các hệ thống đã được phát triển sử dụng camera để theo dõi các biểu hiện trên khuôn mặt để tìm kiếm các dấu hiệu cảnh báo rằng chúng ta có thể đang mệt mỏi và có nguy cơ ngủ gật khi lái xe. Vì đây được cho là một yếu tố gây ra tới 25% các vụ tai nạn đường bộ nghiêm trọng và chết người, rõ ràng là các biện pháp như thế này có thể dễ dàng cứu sống. Công nghệ này đã được sử dụng trong các phương tiện thương mại như xe tải chở hàng, và vào năm 2022, chúng ta có thể thấy nó bắt đầu phát triển thành ô tô cá nhân. Các ứng dụng khác được đề xuất cho tầm nhìn máy tính trong ô tô có thể biến nó từ bảng vẽ thành hiện thực bao gồm giám sát xem có thắt dây an toàn hay không và thậm chí hành khách có để lại chìa khóa và điện thoại khi rời taxi và xe đi chung xe hay không.
Tất nhiên, thị giác máy tính cũng sẽ đóng một vai trò quan trọng trong việc tự lái xe - suy nghĩ hiện tại cho rằng nó sẽ là yếu tố quan trọng nhất của điều hướng tự hành. Năm nay, Tesla đã công bố rằng những chiếc xe của họ sẽ chủ yếu dựa vào thị giác máy tính chứ không phải là lidar và radar, những thứ sử dụng tia laze và sóng vô tuyến, tương ứng để xây dựng một mô hình về môi trường của xe hơi.
- Thị giác máy tính trong tính toán biên
Tính toán biên mô tả các hệ thống mà tính toán được thực hiện càng gần nguồn dữ liệu càng tốt. Đó là một thuật ngữ được sử dụng trái ngược với mô hình của điện toán đám mây, nơi dữ liệu được thu thập thông qua các cảm biến và gửi đến các máy chủ tập trung để lưu trữ và xử lý. Trong lĩnh vực thị giác máy tính, đó là một khái niệm ngày càng hữu ích, vì các hệ thống thị giác máy tính thường thực hiện các công việc cần hành động ngay lập tức (hãy nghĩ đến các trường hợp sử dụng được đề cập trong bài viết này dưới mục tiêu an toàn và lái xe tự động), và đơn giản là không gian, thời gian để dữ liệu được gửi lên đám mây!
Cũng như sự gia tăng tốc độ có thể đạt được, tính toán biên liên quan đến thị giác máy tính có ý nghĩa quan trọng đối với bảo mật - một yếu tố quan trọng cần xem xét khi các doanh nghiệp và cá nhân phải đối mặt với sự giám sát và quy định chặt chẽ hơn về cách dữ liệu video được thu thập và sử dụng. Với các thiết bị tiên tiến như camera an ninh được trang bị tầm nhìn máy tính, dữ liệu có thể được phân tích nhanh chóng và bị loại bỏ nếu không có lý do gì để lưu giữ, chẳng hạn như nếu không phát hiện ra hoạt động đáng ngờ nào.
Nguồn bài viết: https://www.forbes.com/sites/bernardmarr/2022/03/04/the-5-biggest-computer-vision-trends-in-2022/?sh=5740010f19b3