01.07.2022 13:19

Новости

Администратор

Автор:

Администратор

Компьютерное зрение имеет первостепенное значение для бизнеса

Компании в самых разных отраслях внедряют искусственный интеллект на основе изображений и видео для улучшения и оптимизации ключевых бизнес-процессов и продуктов.


Автор: Мария Королев, автор CIO

 

За последние несколько лет приложения компьютерного зрения стали повсеместными. От телефонов, которые распознают лица своих пользователей, до автомобилей, которые управляют самостоятельно, и спутников, отслеживающих движение судов, ценность компьютерного зрения никогда не была очевидной.

 

Но нехватка оборудования и перебои в работе после пандемии ставят под сомнение способность компаний реализовать обещания компьютерного зрения, даже несмотря на то, что сама пандемия ускорила возможности его использования.


Ниже приведен обзор того, как компании в различных отраслях внедряют компьютерное зрение для улучшения и оптимизации ключевых бизнес-процессов, от розничной торговли до диагностики в здравоохранении.

 

Что такое компьютерное зрение?

 

Компьютерное зрение – это область искусственного интеллекта, ориентированная на обработку изображений и видео для извлечения значимой информации. Примеры компьютерного зрения в действии включают оптическое распознавание символов, изображений, образов, лиц, а также обнаружение и классификацию объектов.

 

Отрасли, в которых широко используется компьютерное зрение, включают производство, здравоохранение, автомобилестроение, сельское хозяйство, а также логистику и цепочки поставок. На предприятиях основными факторами, способствующими внедрению компьютерного зрения, являются автоматизация, совершенствование процессов и производительность, а также соблюдение нормативных требований и безопасность.

 

«Рынок растет так быстро, что за ним трудно уследить», - говорит аналитик IDC Мэтт Аркаро, добавляя, что пандемия ускорила внедрение компьютерного зрения, например, для мониторинга занятости, обеспечения социального дистанцирования или отслеживания количества людей, пользующихся общественным транспортом.

 

«Установка во множестве мест камер видеонаблюдения – это элегантное обновление, включающее компьютерное зрение», - говорит Аркаро. «И во многих случаях, благодаря правительственным распоряжениям или организационным решениям, инвестиционные доллары были там».

 

По данным IDC, общий мировой рынок технологий компьютерного зрения вырастет до 2,1 миллиарда долларов в этом году с 760 миллионов долларов в 2020 году, при совокупном годовом темпе роста в 57%, ожидаемом до 2025 года, до общей рыночной стоимости в 7,2 миллиарда долларов.


Большая часть этого рынка в настоящее время находится в стадии разработки, но IDC ожидает, что к 2025 году из расходов на развертывание общедоступных облачных вычислений 48% будет приходиться на компьютерное зрение.

 

Масштабирование и ускорение розничного выполнения и доставки

 

Во время пандемии в индустрии розничной торговли произошли серьезные потрясения: покупатели все больше совершают покупки онлайн и все чаще переключаются на доставку на дом.

 

Walmart, например, сообщила, что число покупателей, которым доставляют покупки, увеличилось в шесть раз по сравнению с тем, что было до пандемии. Чтобы справиться с этой задачей, многонациональная сеть гипермаркетов в прошлом году увеличила пропускную способность на 20% и планирует увеличить ее еще на 35% в этом году.

 

Чтобы это произошло, Walmart инвестирует в несколько категорий технологий, оснащенных компьютерным зрением, включая беспилотные летательные аппараты и автономные транспортные средства. В июле прошлого года компания объявила о планах внедрения роботов Symbotic в 25 из 42 своих региональных распределительных центров. Роботы используют компьютерное зрение, помимо других технологий искусственного интеллекта, для перемещения грузов по складам.

 

Тем временем американская сеть супермаркетов Kroger инвестирует в микро-фулфилмент центры – небольшие, полностью автоматизированные распределительные склады, расположенные недалеко от мест проживания покупателей. По данным компании, цель состоит в том, чтобы доставлять продукты клиентам всего за 30 минут. С лета прошлого года Kroger открыла объекты во Флориде, Алабаме, Техасе, Калифорнии, Огайо и Джорджии и планирует открыть еще 17 объектов, включая узловые и периферийные, в течение следующих 24 месяцев.

 

По данным компании, на узловой площадке более 1000 ботов «носятся по гигантским 3D-сеткам, управляемым запатентованными системами управления воздушным движением». Вместо перемещения целых поддонов с продуктами, как это происходит в региональном распределительном центре, здесь роботы доставляют отдельные товары. Компьютерное зрение используется для сортировки и упаковки предметов таким образом, чтобы, например, тяжелые предметы находились внизу, а сумки имели равномерный вес.

 

По словам соучредителя Ори Авраама, розничная компания Fabric, специализирующаяся на микро-фулфилмент центрах для розничных продавцов, которые не могут построить свои собственные, широко использует автоматизацию в своих помещениях. «Мы используем компьютерное зрение в качестве ключевой возможности нашего роботизированного решения», - говорит он. «Например, точная навигация роботов по полу основана на визуальном анализе напольных наклеек. Этот процесс происходит в режиме реального времени как часть навигации робота».

 

По его словам, роботы-сборщики также используют компьютерное зрение. «Для этого мы используем алгоритм сегментации и классификации, позволяющий нам выбирать и размещать товары. Обе эти возможности имеют решающее значение для нашей способности успешно управлять нашими центрами микро-фулфилмента».


В прошлом месяце Fabric открыла новый центр в Далласе, добавив к своим существующим в Нью-Йорке, Вашингтоне и Тель-Авиве. Компания сотрудничает с Walmart, Instacart и FreshDirect и планирует удвоить свою сеть микро-фулфилмент центров к концу года.

 

Оптимизация и совершенствование производственных процессов

 

Производство – еще одна отрасль, где происходит революция благодаря компьютерному зрению, которое широко используется на производственных линиях для проверки продукции, автоматизации процессов и оптимизации производительности.

 

Майк Гриффин, главный специалист по данным в Insight, технологической консалтинговой компании из Темпе, штат Аризона, работал с несколькими клиентами-производителями над проектами компьютерного зрения. Одно партнерство включало разработку системы, в которой портативное устройство можно было бы использовать для фотографирования корзины с продуктами и автоматического подсчета количества продуктов в корзине.

 

«Клиент хотел иметь возможность нанимать людей с ограниченными возможностями для подсчета», - говорит Гриффин. «Это звучит как простая система для разработки, но проблема заключается в том, что приложение компьютерного зрения должно делать больше, чем просто интерпретировать то, что оно может видеть, но оно также должно прерывать то, что оно не может видеть».

 

Продукты могут быть сложены друг на друга, скрывая от глаз те, что находятся внизу. Таким образом, система компьютерного зрения должна была взять двумерное изображение и преобразовать его в трехмерную модель. «Нам нужно было быть как минимум на 80% точными в нашем инвентаре, включая коробки, завернутые в прозрачный пластик с большим количеством бликов на них», - говорит Гриффин.

 

Чтобы обучить систему, сотрудники ходили с мобильными телефонами и снимали видео. Затем стажер вручную пометил 500 изображений, взятых из этих видеороликов, содержащих 30 000 коробок. Требовалось так мало изображений, потому что компьютерное зрение – относительно развитая область искусственного интеллекта со множеством предварительно обученных моделей. Например, для создания новой модели для пользовательского набора данных, например блоков, используется трансферное обучение.

 

«Мы берем модель, которая была обучена на миллионах изображений кошек, собак, автомобилей и тому подобного», - говорит Гриффин. «Итак, большая часть тяжелой работы уже проделана. А затем мы можем добавить наши 500 изображений коробок или 1000 изображений шин к этой модели и переобучить ее с помощью этого дополнительного набора изображений».

 

Трансферное обучение позволяет быстрее обучать модели с меньшими наборами данных. «Вы также можете создавать синтетические данные», - добавляет Гриффин. «Например, строительная компания хотела определить опасности, а у них было всего несколько сотен обучающих изображений. Мы создали дополнительные изображения, поместив эти оранжевые конусы опасности, скажем, на поле или на стоянке, чтобы дополнить их набор изображений и повысить эффективность обучения».

 

Еще одним инновационным применением обработки изображений в производстве является преобразование данных тестирования в изображения, а затем использование машинного обучения на сгенерированных изображениях.

 

«Ошибки в тестировании могут быть рядом друг с другом, но не очевидно, что они связаны друг с другом, пока вы не переведете эти данные в изображения», - говорит Гриффин. «Они находятся рядом друг с другом в тестовом пространстве, в отличие от того, чтобы быть рядом друг с другом в физическом пространстве».

 

Улучшение медицинской диагностики

 

В здравоохранении компьютерное зрение широко используется в диагностике, например, при интерпретации изображений и видео с использованием искусственного интеллекта. По словам аналитика Gartner Туонга Нгуена, оно также используется для контроля за безопасностью пациентов и для улучшения медицинских операций.

 

«Потенциал компьютерного зрения огромен», - говорит он. «По сути, это помогает машинам понять мир. Приложений бесконечное множество – на самом деле, все, что вам нужно увидеть. Весь мир».

 

Согласно четвертому ежегодному опросу Optum по искусственному интеллекту в здравоохранении, опубликованному в конце 2021 года, 98% организаций здравоохранения либо уже имеют стратегию ИИ, либо планируют ее реализовать, а 99% руководителей здравоохранения считают, что искусственному интеллекту можно доверять для использования в здравоохранении.

 

Интерпретация медицинских изображений была одной из трех основных областей, упомянутых респондентами опроса, где ИИ может быть использован для улучшения результатов лечения пациентов. Две другие области, виртуальная помощь пациентам и медицинская диагностика, также созрели для компьютерного зрения.

 

Возьмем, к примеру, идиопатический легочный фиброз, смертельно опасное заболевание легких, от которого страдают сотни тысяч людей по всему миру. У этой болезни нет известной причины или лечения, и его очень трудно диагностировать. Только в США от нее ежегодно умирает около 40 000 человек.

 

По данным PwC, для постановки диагноза идиопатического легочного фиброза обычно требуется более двух лет; к тому времени средняя продолжительность жизни тех, кому наконец поставили диагноз, составляет всего от трех до пяти лет.

 

The Open Source Imaging Consortium Data Repository, поддерживаемое PwC и Microsoft, создает платформу для обмена анонимными данными изображений, чтобы помочь в диагностике заболевания. К концу этого года организация ожидает, что в ее базе данных будет 15 000 сканирований.

 

С помощью искусственного интеллекта и машинного обучения врачи могут диагностировать заболевание быстрее и точнее, что дает им больше времени для лечения пациентов.

И в будущем та же платформа может быть использована и для лечения других редких заболеваний.

 

Другие отрасли, которые изменило компьютерное зрение

 

В автомобильном секторе компьютерное зрение используется для оказания помощи водителям и контроля за водителями, чтобы убедиться, что они обращают внимание на дорогу. По словам Аракаро из IDC, это также ключ к созданию беспилотных автомобилей, основного двигателя роста использования компьютерного зрения в автомобильной промышленности.

 

Но есть еще один ключевой рынок для автономного вождения и компьютерного зрения в целом, говорит Аркаро: сельское хозяйство. Он отмечает, что компьютерное зрение в сельском хозяйстве используется для сортировки продуктов, мониторинга здоровья растений и животных, а также для мониторинга и управления сельскохозяйственными активами.

 

В области кибербезопасности аналитику изображений можно использовать для считывания подписей или обнаружения фишинговых веб-сайтов, которые спроектированы так, чтобы выглядеть похожими на реальные веб-сайты, но достаточно отличаются, чтобы их можно было обнаружить.

 

В индустрии гостеприимства компьютерное зрение помогает отслеживать, куда отправляются гости на борту круизных лайнеров, чтобы улучшить их впечатления.

 

В сфере финансовых услуг обработка изображений позволяет извлекать данные из документов для повышения эффективности бизнес-процессов.

 

«Компьютерное зрение охватывает практически все отрасли», - говорит Динеш Батра, вице-президент Capgemini Invent по данным и искусственному интеллекту. «В последние годы это был чрезвычайно успешный инструмент для предприятий, и его популярность будет только расти».

 

Явно светлое будущее

 

И все же, несмотря на обилие уже существующих вариантов использования, у компьютерного зрения есть значительные возможности для роста.
«Это еще только начало», - говорит Нгуен из Gartner. «Я ожидаю, что в этом пространстве появится больше поставщиков, занимающихся различными элементами цепочки создания стоимости. Впереди еще много возможностей, поскольку технология становится все лучше, доступнее и доступнее. Мы начнем видеть, как его используют везде и всюду».

 

Однако не все так гладко. По данным Gartner, препятствия для внедрения включают нехватку оборудования и отсутствие возможностей обработки. В некоторых приложениях все еще существуют проблемы с точностью. Системы компьютерного зрения также должны быть интегрированы в производственные линии, а также в серверные системы, что может быть непростой задачей.

 

Таким образом, в то время как COVID-19 увеличил спрос и потенциал компьютерного зрения в бизнесе, сопутствующая нехватка оборудования и сбои в работе, вызванные пандемией, до сих пор мешали многим предприятиям извлечь выгоду из перспектив этой технологии.

 

Но по мере того, как в будущем эти проблемы уменьшатся, компании, несомненно, будут готовы внимательно изучить технологию.

 

Ссылка на источник


0


Нет комментариев. Ваш будет первым!
Загрузка...