Global link

Как искусственный интеллект обучается правильно идентифицировать изображения

Как искусственный интеллект обучается правильно идентифицировать изображения

В настоящее время, несмотря на стремительный прогресс, достигнутый в сфере искусственного интеллекта, системы машинного зрения значительно уступают своим биологическим аналогам. Это касается не только быстроты обработки информации, но и надежности распознания.

Например, в 2015 году компании Google пришлось извиняться за свой сервис распознания объектов по картинкам и фото — тогда новое приложение для фотографий обозначило двух изображенных на картинке чернокожих людей как «горилл». Вот что писали об этом известные медиа СМИ:

- Фотосервис от компании Google, запущенный в мае 2015 года, автоматически сортирует снимки и добавляет к ним тэги, используя программное обеспечение на базе искусственного интеллекта.

- «Google Photos, вы облажались. Моя подруга не горилла», — написал Джеки Алсине (Jacky Alcine) после того, как сервис добавил к его фото тэг «гориллы». С Алсине связался сотрудник Google Йонатан Зангер (Yonatan Zunger). Он ответил в Twitter, что благодарен за то, что Алсине помог Google исправить проблему. Зангер отметил, что ошибки в распознавании изображений могут быть вызваны темными лицами и «разницей в контрастной обработке, необходимой для разных оттенков кожи и освещения».

- «У нас были проблемы с людьми (всех рас), которых система отмечала как собак, по тем же причинам», — объяснял Зангер в интервью The Guardian. «Мы также работаем над такими исправлениями в долгосрочной перспективе, как лингвистика (слова, которые следует осторожно добавлять к фотографиям людей), и само распознавание изображений (например, над лучшим распознаванием темных лиц). Много чего сделано, но и многое еще предстоит сделать, мы работаем над этим», отметил представитель Google.

Как же так произошло? Дело в том, что искусственный интеллект на основе нейросетей не всемогущ, и программные и аппаратные возможности не позволяют ему, со 100% вероятностью распознавать тот или иной объект или лицо в условиях с недостаточным уровнем освещения. Когда как, головной мозг человека способен распознавать объекты вне зависимости от условий освещения и того, какую его часть видно в данный момент. А иногда и просто основываться на контексте общего плана и обстановки. Так, например, приложение Teasier от Корпорации Триол способно узнать Вас в условиях с низкой освещенностью благодаря алгоритмам на основе нейросетей. Данное приложение разработано для защиты информации хранящейся на персональном компьютере и обеспечивает вход в учетную запись одним взглядом в камеру устройства. Чтобы Teasier быстрее Вас узнавал, есть возможность добавлять Ваши изображения с разными ракурсами, уровнем освещения, с жестами или прическами.

Большинство современных приложений распознавания лица основываются на разработке ученых из Калифорнийского университета в Лос-Анджелесе и Стэнфордского университета. Их система, которая может видеть окружающий мир благодаря идентификации объектов, основываясь только на некоторых их частях, что раньше было не доступно ни одному искусственному интеллекту.

Чтобы настроить процесс обучения по новому способу, который состоит из трех последовательных этапов, необходимо сделать следующее:

 После того, как систему просят найти какой-то объект, она разбивает изображение на более мелкие части. Далее каждая часть в отдельности анализируется, затем идентифицируются ее связи с другими объектами общей картины. После этого искусственный интеллект вновь «смотрит» на картину целиком и выявляет какие части картины имеют отношение к исходному объекту, а какие нет. Дальше искусственный интеллект тренируется на многочисленных фото и видео, взятых из сети.

Таким образом, то, что подразумевается под искусственным интеллектом, должно иметь возможность обучаться всему так же, как человек, т.е., условно говоря, программа должна уметь «учиться обучению» и принимать решения, не основанные на изначальном программном коде. Тем самым, искусственный интеллект должен сам создавать новый программный код для своих компонентов под каждую ситуацию, исходя из всего предыдущего опыта.

Корпорация Триол разработчик программного продукта Teasier – Вашего персонального помощника. Используйте возможности искусственного интеллекта для защиты Вашей информации.