Технология распознавания лиц – болезнь или панацея?

Безопасность или угроза свободе: зачем обществу распознавание лиц

В мае городской совет Сан-Франциско запретил полиции и другим местным органам власти использовать технологию распознавания лиц. Власть приняла позицию правозащитников: технология может использоваться не только для поимки преступников, но и как инструмент тотальной слежки за гражданами.

Действительно ли система распознавания лиц представляет угрозу гражданским свободам? И станет ли этот запрет прецедентом для мировой общественности?

Спустя несколько дней после решения совета Сан-Франциско, 18 мая, в The New York Times вышел материал про то, как по всей Америке технология распознавания лиц помогает отправлять преступников за решетку.

В частности, подозреваемого в сексуальном нападении на 15-летнего подростка в Пенсильвании не могли вычислить около трех лет. Несмотря на то, что перед преступлением он сам отправил пострадавшему свое фото — пусть и нечеткое. Журналист сделал вывод, что без системы распознавания лиц у полиции не было шанса поймать преступника.

Что произошло в Сан-Франциско

США исторически позиционируют себя как оплот демократии, где сильно развиты гражданские права и свободы. Любое их притеснение остро воспринимается общественностью и правозащитниками.

Всего в США установлено порядка 50 млн камер видеонаблюдения. Это в 4 раза меньше, чем в Китае, и почти в 12 раз больше, чем в Великобритании. С помощью видеонаблюдения в США в 2010-2016 годах было арестовано более 2 800 преступников, а в 2018 полицейские продвинулись в раскрытии более 8 000 дел.

На данный момент в США нет федерального закона, регламентирующего применение технологии распознавания лиц. Правила обработки биометрических данных законодательно закреплены только в некоторых штатах. Например, в штате Иллинойс закон BIPA (Biometric Information Privacy Act) обязывает организации, которые собирают биометрические данные, информировать об этом граждан и в письменной форме объяснять, зачем это делается.

Калифорния стоит особняком в вопросе защиты биометрических данных. В 2018 году был принят закон CCPA (California Сonsumer Privacy Act). Согласно ему, с конца 2020 года все фотографии человека будут приравнены к биометрическим данным, то есть их будет запрещено использовать и обрабатывать без персонального согласия владельца. В первую очередь закон CCPA в нынешней редакции касается бизнеса, собирающего биометрические данные человека. Но закон еще может быть доработан и по отношению к госструктурам.

В начале 2019 года суд Калифорнии постановил, что полицейские не имеют права заставлять людей разблокировать телефон с помощью отпечатка пальца или функции распознавания лица. До этого полицейские имели на это формальные права.

Поэтому недавнее решение совета Сан-Франциско запретить использовать технологию распознавания лиц полицейским выглядит последовательным.

Парадокс происходящего заключается в том, что Сан-Франциско — колыбель мирового технологического прогресса, место, где технологии впервые появляются на свет, а затем находят применение во всем мире. И здесь же они сталкиваются с первыми запретами на использование.

Нужно ли обществу распознавание лиц

Сама технология face recognition способна приносить явную и ощутимую пользу: в начале года московские полицейские поймали похитителя картины из Третьяковки, в метро Шэньчжэня теперь можно оплатить проезд «лицом», а бизнес во всем мире научился предотвращать кражи и узнавать клиентов еще при входе в магазин.

Тем не менее, система распознавания лиц порождает конфликт двух общественных интересов.

Чувство безопасности. Система дает уверенность, что потенциальный преступник не уйдет от правосудия: его поиск становится эффективнее за счет распознавания лиц. Кроме того, информационные технологии позволяют в реальном времени фиксировать сам факт преступления — полиция Китая, например, умеет определять драку по характерным взмахам рук и ног;

Право на конфиденциальность и личное пространство. Для системы наблюдения изначально нет различий между преступником и законопослушным гражданином: за всеми наблюдают одинаково. Здесь простая аналогия: некоторых водителей удивляет и даже оскорбляет, когда их останавливают для проверки документов, — на их взгляд, останавливать должны «только нарушителей». Однако система не может выявить преступника без одинаковых условий для всех объектов. Предугадывать преступления до их совершения умели только в «Особом мнении» Филипа К. Дика.

Никто не против, чтобы видеонаблюдение велось в аэропортах или на социально значимых объектах — вся мировая общественность выступает за безопасность и борьбу с терроризмом.

Наиболее прогрессивные государства регламентируют работу систем распознавания лиц, не ущемляя прав граждан. Например, в Евросоюзе с 2018 года действует закон GDPR, защищающий все биометрические данные человека (в том числе фотографии) от использования и обработки в любых целях, за исключением оказания медицинской помощи или угрозы национальной безопасности.

Но система распознавания лиц в руках некоторых государств вызывает опасения. Всем знаком пример социального рейтинга в Китае. Со стороны (тем, кто никогда там не жил) кажется, что в Китае наступила эра киберпанка — человеческая культура демонстрирует упадок на фоне растущего технологического контроля со стороны властей.

Отчасти тому есть неоднозначные подтверждения. В начале мая была обнаружена открытая база данных жителей двух районов Пекина — она была собрана с помощью системы распознавания лиц. Однако удивительно в этой истории другое: база не была никак защищена. Китай тратит большие деньги на повсеместное внедрение системы распознавания лиц. Но есть ощущение, что эти деньги тратятся больше на устрашение, а не на контроль.

Что будет дальше

Запрет в Сан-Франциско может стать прецедентом для всей Америки. С марта 2019 в Сенате разрабатывается законопроект, который должен сформировать единые правила работы с биометрикой для бизнеса: фотографии будут приравнены к конфиденциальным данным, а их обработка будет запрещена без согласия человека. Законопроект уже поддержали несколько сенаторов и Microsoft.

В рынок технологий распознавания лиц вкладываются большие деньги. У частных и государственных инвесторов есть свой интерес. В 2017 году весь рынок распознавания лиц оценивался в $2,9 млрд, а к 2022 году он будет стоить уже более $9,6 млрд. В мае китайский разработчик системы распознавания лиц Face++ (компания Megvii — разработчик технологий ИИ) привлек $750 млн в преддверии IPO. Запреты и существенные ограничения могут негативно сказаться на бизнесе и технологическом развитии в целом.

Не стоит забывать, что инструментов слежки за гражданами у государств всегда хватало и без распознавания лиц. Отследить перемещения человека можно по банковской карте или сим-карте. Нельзя купить билет на поезд или самолет без паспорта. Более того, во многих крупнейших аэропортах мира перед вылетом нужно сдавать отпечатки пальцев — например, в Лос-Анджелесе, Лондоне, Мумбаи, Шэньчжэне.

Технологии могут использоваться и восприниматься по-разному. История показывает, что прогресс можно замедлить, но нельзя остановить. Технологии не стоит запрещать, однако можно и нужно регулировать прикладные аспекты их использования.

Почему не стоит бояться технологии распознавания лиц

Антон Рудов, генеральный директор и основатель компании Orbl, развенчивает мифы в отношении технологии распознавания лиц и рассказывает о её значении в жизни общества.

Сегодня технология распознавания лиц — одно из самых перспективных и в то же время противоречивых направлений. Пожалуй, она вызывает не меньше страхов, чем искусственный интеллект (стоит поблагодарить массовую культуру).

Что рождает опасения и есть ли под ними какие-то объективные основания? Давайте разберём все мифы в отношении технологии по порядку.

Одна из самых распространённых фобий сейчас — оказаться под наблюдением «Большого Брата» и повторить жизнь из антиутопических романов, таких как «Дающий» или «1984». Страх перед возникновением технологического тоталитаризма толкает обывателей на общественный протест и способствует росту судебных дел. Так, например, Роскомсвобода требует ввести мораторий на камеры с функцией распознавания лиц, ссылаясь на неприкосновенность частной жизни.

В действительности камеры видеонаблюдения, установленные на улицах, в парках и других общественных местах, не способны прицельно следить за всеми перемещениями каждого отдельного члена общества.

Система безлика: она равнодушно «перебирает» лица, фиксируясь лишь на тех, что находятся в базе данных правоохранительных органов. Сотрудники полиции не отсматривают в режиме реального времени все записи — это невозможно. Они обращаются к записям камер только в том случае, если система дала сигнал: обнаружено сходство между лицом, случайно попавшим на камеру, и индивидом из базы данных.

Риски неправомерного использования технологии всегда существуют, но их стоит соотносить с общественной пользой. Сейчас камеры с технологией распознавания лиц позволяют расследовать преступления по горячим следам. Например, около 60% хищений раскрывается в течение первых трёх суток (причём 90% из них — в первый же день).

Вспомним дело о краже картины Куинджи из Третьяковской галереи. Задержание злоумышленника было стремительным, а уже на следующий день картину вернули в музей. В прошлом году руководство МВД РФ сообщило, что тестирование технологии в Москве позволило снизить число разбоев на 38,4%, а грабежей — на 36%.

Ещё один распространённый страх — камеры видеонаблюдения могут привести к повышению процента задержаний без оснований или по ошибке. Логика тех, кто опасается сбоев работы системы, строится примерно так: «бездушная машина» не может дать стопроцентной уверенности, что подозреваемый действительно является лицом, находящимся в базе розыска.

В действительности ни одна система распознавания лиц не может гарантировать 100% эффективности. Существует ничтожный шанс на ошибку, но ведь и человек, опознающий преступника, может ошибаться. Процент неверных результатов сейчас очень низок.

В 2018 году в Москве была представлена система, которая при тестировании показала потрясающий результат — распознавание близнецов за одну секунду. Таким образом, даже если в объектив попадёт лицо близнеца, как две капли воды похожего на самого подозреваемого, технология идентифицирует его как отдельную личность.

По данным Национального института стандартов и технологий США (NIST) за последние 4 года качество распознавания лиц по базе портретных фото улучшилось в 20 раз, при этом процент сбоев снизился с 4% до 0,2%.

Здесь нужно также отметить, что эффективность работы технологии постоянно увеличивается с повышением количества и разнообразия лиц, попавших в зону действия камер. В основе инновации лежит нейронная сеть и искусственный интеллект. Здесь можно провести аналогию с мозгом человека – чем больше он получает полезной информации, тем более опытным и мобильным становится.

Данный параметр – одна из причин, по которой Китай является лидером в распространении и развитии технологии распознавания лиц. КНР самая густонаселенная страна (численность больше 1 миллиарда), она обладает крупнейшей в мире базой данных фотографий для документов. Сбоев здесь практически не случается.

Также нужно отметить, что современные разработки обеспечивают такую точность распознавания личности, что банки всерьез задумываются о возможности использования технологии для доступа к ряду финансовых услуг, таких как открытие счета.

Еще одним распространенным заблуждением является мысль о том, что основными сферами применения технологии распознавания лиц останутся безопасность и системы обеспечения физического доступа. Конечно же, проще всего использовать разработку в том, что требует лишь определения личности и не предполагает какой-либо логики. Однако уже сейчас ученые и разработчики задумываются о распространении алгоритмов во всех сферах деятельности человека, даже в медицине.

Например, специалисты сообщают, что биометрическое распознавание лиц позволит диагностировать заболевания, которые проявляются в изменении мимики. Это, к примеру, даст возможность выявлять болезнь Альцгеймера на ранней стадии, либо обнаруживать генетические заболевания, такие как синдром Ди Джорджа с вероятностью успеха 96,6%.

Неожиданное решение выдало Яндекс.Такси: компания решила использовать систему для мониторинга усталости водителей. Специальная камера отследит мимику таксиста и снизит количество выдаваемых заявок в зависимости от его состояния.

Еще один перспективный сценарий развития распознавания лиц разворачивается в области маркетинга. Уже сейчас многие ритейлеры используют инновацию для решения своих задач. Тестирование умных камер в сети магазинов показало X5 Retail Group, что технология в десятки раз ускоряет контроль планограмм, сокращает на 10% количество людей, уходящих из магазина без покупок, и на 20% — потери магазинов. Также убытки снижаются за счет возможности предотвращения краж: в компании FaceFirst вычислили, что системы распознавания лиц правильно идентифицируют потенциальных воров в 60% случаев.

Ну и, конечно же, технология со временем позволит каждому оплачивать покупки, просто посмотрев в объектив камеры. Подобный опыт уже имеется в ряде стран. Первыми новшество начали применять китайцы, уже сейчас в стране можно “по лицу” приобрести билет в метро, оплатить заказ в ресторане и покупки в ряде магазинов. Великобритания тоже экспериментирует: здесь распознавание лиц проходит тестовое внедрение для оплаты товаров в супермаркетах. Даже в ряде московских магазинах сети “Магнит” уже можно встретить этот супер современный высокотехнологичный способ оплаты. Для этого необходимо скачать фирменное приложение, заполнить данные покупателя и загрузить фото.

Космическая стоимость покупки и обслуживания камер видеонаблюдения с функцией распознавания лиц – это еще один аргумент для скептиков. Действительно, если задуматься о стандартной схеме внедрения системы, то она может обойтись очень дорого. В случае государства это оправдано, в случае бизнес-экспериментов – не всегда.

Но здесь есть небольшой нюанс – классические установки видеонаблюдения и собственное программное обеспечение нужно не всем компаниям. Уже сейчас на рынке существует ряд предложений, которые позволяют существенно сократить бюджет на распознавание лиц – например, Amazon Rekognition. Это инструмент для встраивания в приложения аналитики изображений. Стоимость продукта – $10, а функционал очень широк, вплоть до распознавания эмоций. При этом на настройку и запуск системы, как утверждает Forbеs, уйдет всего пара часов.

Технология распознавания лиц быстро развивается, системы накапливают опыт и обучаются. Инновация находит применение в новых областях, порой совершенно необычных. Справедливости ради нужно отметить, что есть и “слепые пятна” – прежде всего, в области законодательства, которое не успевает за технологическим прогрессом. Появление нормативных актов, регулирующих сферу применения новейших систем видеонаблюдения, поможет снизить градус недоверия к технологии со стороны определенной части общества.

Анализ современных подходов к процедурам узнавания и распознавания лиц для систем биометрического контроля

Автор: Аноприенко А. Я., Иваница С. В., Лычагин Р. В.
Источник:

Аноприенко А. Я., Иваница С. В., Лычагин Р. В. Анализ современных подходов к процедурам узнавания и распознавания лиц для систем биометрического контроля. Определены поэтапные задачи для качественного распознавания лица в технологии распознавании объектов. Проанали-зированы основные современные алгоритмы распознавания лиц. Предложена общая идея струк-туры базы данных и поиска в рамках разрабатываемой системы динамического распознавания лиц для идентификации и аутентификации личности.

Ключевые слова: распознавание лиц, фильтр Габора, метод Виолы-Джонса, графы, FERET.

Введение

Интерес к процессам идентификации и аутентификации личности в современном мире набирает все возрастающую практическую потребность: от систем охраны и верификации банковских карточек до криминалистической экспертизы и идентификации преступников при рецидиве. Поскольку, одним из однозначно различимых критериев личности, является человеческое лицо, то в аспекте идентификации (а позже, и аутентификации) личности следует понимать процедуру динамического распознавания лиц.

Задача эффективного поиска и идентификации человеческого лица, не является для компьютерных систем тривиальной и вполне очевидной для разработчиков специализированного программного обеспечения. Работа со слабоконтрастными объектами (с точки зрения восприятия компьютерной системой человеческого лица, в отличие от естественной идентификации лица человеческим глазом) является наиболее значимой для развития искусственного интеллекта (ИИ), делающей акцент на системах компьютерного (кибернетического) зрения, которые кроме процедур распознавания обеспечивают кодирование/декодирование и хранение цифровых изображений лиц. Такие системы можно рассматривать как в свете классической проблемы восприятия, так и в свете новых подходов [1] к распознаванию объектов.

Общая структура распознавания лиц

Несмотря на большое разнообразие алгоритмов распознавания лиц, можно выделить общую структуру данного процесса [2], которая представлена на рис. 1.

Рисунок 1 – Общая структура распознавания лиц

На первом этапе производится обнаружение и локализация лица на изображении (наиболее эффективным является использование метода Виолы-Джонса). Слежение подразумевает более упрощенные способы локализации лица (т. к. лицо к данному моменту однозначно определено) на последующих кадрах непрерывного видео.

На втором этапе производится выравнивание изображения в найденной области (геометрическое и яркостное преобразование, применение фильтров). Вычисление и сравнение признаков варьируется между методами, и при этом все сводится к определенному сравнению вычисленных признаков с заложенными в базу данных эталонами. В данной работе будет также рассмотрено использование метода гибкого сравнения на графах.

Метод Виолы-Джонса

В методе Виолы-Джонса используется интегральное представление изображения – матрица, которая совпадает по размерам с исходной и в каждом ее элементе хранится сумма всех элементов, находящихся левее и выше данного [3].

Элементы представлены в матричном виде и рассчитываются по следующей формуле (1):

где i(x’, y’) — яркость пикселя исходного изображения.

Таким образом, каждый элемент I(x, y) интегрального изображения содержит в себе сумму интенсивности пикселей в прямоугольнике от (0, 0) до (x’, y’).

Формирование интегрального изображения занимает линейное время, пропорциональное числу пикселей исходного изображения, и осуществляется за один проход. Расчет интегрального изображения I можно производить по рекуррентной формуле (2):

Важнейшим достоинством интегрального представления изображения является возможность быстрого вычисления суммы пикселей произвольного прямоугольника (3), а также любой другой фигуры, которую можно аппроксимировать несколькими прямоугольниками.

Для описания искомых объектов (лицо, руки, или пр. предметы) используются каскады из признаков. Сам по себе каскад Хаара — это набор примитивов (рис. 2), для которых считается их свертка с изображением. Используются самые простые примитивы, состоящих из прямоугольников и имеющих всего два уровня, +1 и –1. При этом каждый прямоугольник используется несколько раз разного размера. Под сверткой тут подразумевается s = X – Y, где Y — сумма элементов изображения в темной области, а X — сумма элементов изображения в светлой области.

Рисунок 2 – Набор примитивов для описания объектов

Такие свертки призваны структурировать информацию об объекте: например, в работе [6] показано что, для центра лица человека будет всегда отрицательная свертка, пример получения которой показан на рис. 3.

Рисунок 3 – Пример получения свертки для центра лица человека (а – исходное изображение, б – наложение свертки на центр лица) [6]

Формирование алгоритма слежения при повороте лица

Метод Виолы-Джонсона хоть и считается достаточно быстрым для использования в потоковых видео, но он имеет свои ограничения. При повороте лица на

15° метод становится бесполезным. Поскольку полученные свертки достаточно точны, можно подгрузить дополнительные описатели либо фронтального лица, либо профильного, что приводит к потере результата, когда человек начинает поворачивать голову. Хотя подобное нельзя сказать при обнаружении более плоских объектов, например, глаза (он виден только во фронтальном расположении лица).

Так же если не настроить точность данного метода (размеры минимального и максимального квадрата поиска, количество пересечений, найденных областей и т. д.) уменьшается быстродействие, но повышается вероятность правильного результата. Однако она также может варьироваться, поскольку качество изображения или потокового видео может быть получено с вебкамер (плохое или среднее качество) или камер видео наблюдений до HD или HQ (высокое качество). При плохих разрешениях появляется много шумов или артефактов, которые могут исказить лицо (особенно находящиеся на расстоянии) настолько, что даже человек будет не в состоянии провести идентификацию по имеющемуся видеоряду. Также некоторые группы артефактов могут сформировать некоторое подобие лица, что приведет к ложному распознаванию, что потребует использовать более высокие настройки точности аппаратнопрограммного комплекса, чтобы в дальнейшем избежать подобных ошибок. Все эти особенности усложняют повторное обнаружение лица на следующих кадрах и делают слежение в реальном времени невозможным.

Так для ускорения повторного поиска можно уменьшить область повторного поиска. При частоте 30 кадров в секунду, предполагая нахождение объекта на предыдущем кадре, можно утверждать, что за 33 миллисекунды он сдвинется незначительно и тем самым при повторном поиске искать уже не на всем кадре, а лишь в увеличенном (x1.5) квадрате предыдущего результата (ROI). Так и при приближении или сдвиге объекта он будет найден в этой области.

Для решения проблем слежения при развороте объекта неизвестной стороной и потери лица методом Виолы-Джонсона, можно использовать алгоритм шаблонного соответствия (Template Matching) [9]. Сохраняя предыдущее найденное изображение и поиск подобного на ROI нового кадра. Особенность метода в том, что он всегда возвращает результат. Но и данный метод имеет свои проблемы так как со временем окно может сползти в область где нет лица и продолжать сравнивание с последовательно предыдущим кадром тем самым оставаться на месте потеряв лицо. Поэтому вводятся ограничения по времени использования для этого метода. Как только отказывает основной метод распознания, то начинает работать шаблонное соответствие, и при этом запускается таймер. Если таймер превышает некоторое ограничение (например, 2 секунды), лицо считается потерянным и сбрасываются все предыдущие значения. Однако подобное ограничение будет неприемлемым если лицо долго остается повернутым на некоторый неприемлемы для метода угол, так же при этом программа может утверждать, что затылок человека тоже лицо.

Таким образом, описанный выше алгоритм работы программы представлен в виде блоксхемы на рис. 4.

Рисунок 4 – Блоксхема работы алгоритма слежения

Метод гибкого сравнения на графах (Elastic graph matching)

Суть метода сводится к эластичному сопоставлению графов, описывающих изображения лиц [2, 5]. Лица представлены в виде графов со взвешенными вершинами и ребрами. На этапе распознавания один из графов — эталонный — остается неизменным, в то время как другой деформируется с целью наилучшей подгонки к первому. В подобных системах распознавания графы могут представлять собой как прямоугольную решетку, так и структуру, образованную характерными (антропометрическими) точками лица (рис. 5). В вершинах графа вычисляются значения признаков, чаще всего используют комплексные значения фильтров Габора или их упорядоченных наборов (рис. 6) — Габоровских вейвлет (строи Габора), которые вычисляются в некоторой локальной области вершины графа локально путем свертки значений яркости пикселей с фильтрами Габора (рис. 7).

Рисунок 5 – Пример структуры графа для распознавания лиц (а – регулярная решетка, б – граф на основе антропометрических точек лица)

Ребра графа взвешиваются расстояниями между смежными вершинами. Различие (расстояние, дискриминационная характеристика) между двумя графами вычисляется при помощи некоторой ценовой функции деформации, учитывающей как различие между значениями признаков, вычисленными в вершинах, так и степень деформации ребер графа.

Рисунок 6 – Набор (банк, jet) фильтров Габора

Рисунок 7 – Пример свертки изображения лица с двумя фильтрами Габора

Деформация графа происходит путем смещения каждой из его вершин на некоторое расстояние в определенных направлениях относительно ее исходного местоположения и выбора такой ее позиции, при которой разница между значениями признаков (откликов фильтров Габора) в вершине деформируемого графа и соответствующей ей вершине эталонного графа будет минимальной. Данная операция выполняется поочередно для всех вершин графа до тех пор, пока не будет достигнуто наименьшее суммарное различие между признаками деформируемого и эталонного графов. Значение ценовой функции деформации при таком положении деформируемого графа и будет являться мерой различия между входным изображением лица и эталонным графом. Данная «релаксационная» процедура деформации должна выполняться для всех эталонных лиц, заложенных в базу данных системы. Результат распознавания системы — эталон с наилучшим значением ценовой функции деформации (рис 8).

Рисунок 8 – Пример деформации графа в виде регулярной решетки

В отдельных публикациях указывается 95-97%-ая эффективность распознавания даже при наличии различных эмоциональных выражениях и изменении ракурса лица до 15?. Однако разработчики систем эластичного сравнения на графах ссылаются на высокую вычислительную стоимость данного подхода. Например, для сравнения входного изображения лица с 87 эталонными тратилось приблизительно 25 секунд при работе на параллельной ЭВМ с 23 транспьютерами [4]. В других публикациях по данной тематике время либо не указывается, либо говорится, что оно велико.

К недостаткам данного метода относится высокая вычислительная сложность процедуры распознавания, а также низкая технологичность при запоминании новых эталонов и линейная зависимость времени работы от размера базы компьютерного изображения лица.

Основные проблемы [4, 7], связанные с разработкой систем распознавания лиц представлены на рис. 9, 10.

Рисунок 9 – Проблема неравномерной освещенности лица

Рисунок 10 – Проблема положения головы (в подобном случае лицо – трехмерный объект)

С целью оценки эффективности предложенных методов распознавания лиц, агентство DARPA и исследовательская лаборатория армии США разработали программу FERET (FacE REcognition Technology) [8].

В масштабных тестах программы FERET принимали участие алгоритмы, основанные на гибком сравнении на графах и всевозможные модификации метода главных компонент (PCA). Эффективность всех алгоритмов была примерно одинаковой. В этой связи трудно или даже невозможно провести четкие различия между ними (особенно если согласовать даты тестирования).

Для фронтальных изображений, сделанных в один и тот же день, приемлемая точность распознавания, как правило, составляет 95%. Для изображений, сделанных различными средствами при разном освещении, точность, как правило, падает до 80%. Для изображений, сделанных с разницей в год, точность распознавания составила примерно 50%. При этом стоит заметить, что 50% — это более чем приемлемая точность работы системы подобного рода.

Ежегодно FERET публикует отчет о сравнительном испытании современных систем распознавания лиц [8] на базе лиц более одного миллиона. При этом в последних отчетах не раскрываются принципы построения систем распознавания, а публикуются только результаты работы коммерческих систем. На сегодняшний день лидирующей является система NeoFace [10] разработанная компанией NEC.

Общая идея структуры базы данных и поиска

В ходе работы над данным проектом планируется разработать систему динамического распознавания лиц и идентификации личности.

Для этого с помощью метода Виолы-Джонсона локализировать лицо на изображении. Используя фильтр Габора с набором динамических параметров определить антропологические точки лица. По ним построить граф. Используя различные методы сравнения графов определить или разработать наиболее эффективный.

Создать динамическую базу данных с набором описателей лиц, привязанных к личностям. Предполагается хранение минимум двух записей для каждого лица: одна — с коэффициентами, рассчитанными на меньшем изображении (хуже качество), вторая — в оригинальном или большем формате (выше качество). Причем второй записи у отдельных пользователей может и не быть (рис. 11), так как оригинал не был достаточно велик для его создания (увеличение изображения приводит к размытию и потери качества).

Подобная структура записей (рис. 12) позволит теоретически ускорить поиск, сделав упрощенное сравнение сначала на всех записях, а после уточнить уже на полученном множестве.

Рисунок 11 – Предложенное хранение минимум двух записей для каждого лица

Рисунок 12 – Предложенная структура записей лица

Планируется, сделать возможность динамически без участия пользователя создавать новые записи, нераспознанных лиц, и привязывать их к датам обнаружения.

Предполагается, возможность применение или разработки фильтров для повышения качества изображения (в рамках данной темы) и решения проблем с плохим освещением.

Выводы

Компьютерное зрение — развивающаяся отрасль программирования, но при этом востребована и имеет большой спектр применения. Функцию идентификации людей на фотографиях активно используют в программном обеспечении для управления фотоальбомами (Picasa, iPhoto и др.). Скомбинировав ее с реальными параметрами, можно составлять альбомы по отдельному человеку. Идентификация также находит свое применение в системах безопасности, например при распознавании сотрудников объекта (учреждения).

При разработке программного обеспечения данного проекта идентификация личности да конца не реализована, однако выполнены нахождение лица и распознавание части признаков с помощью всего двух параллельных вейвлет Габора. С увеличением ряда фильтров и калибровки их параметров, возможны нахождение большего числа признаков и отсечки шумов. На основе полученных точек также появится возможность построения графа для выполнения сравнительного анализа и идентификации личности.

Основными трудностями на данном этапе выполнения проекта является настройка параметров фильтра Габора и разработка алгоритмов построения и сравнения графов.

В дальнейшем планируется использование средств и методов постбинарного компьютинга [11, 12] для повышения точности вычислений. Так, например, некоторые помехи можно обозначать как неопределенность, вследствие чего помехи не будут просто отбрасываться, а сохранятся как возможные особенности лица.

Мы уже в «Матрице»? 7 мифов о системах распознавания лиц и отпечатков пальцев

1. Биометрия крадет приватность

В основе мифа — страх, что в современном мире у человека не останется никакого личного пространства, куда он может не пускать посторонних. Его изображения попадают в биометрическую систему, а значит — к третьим лицам, которые могут использовать их для каких угодно целей. Например, движение Ban the Scan, которое основала организация Amnesty International, призывает американцев — а затем и весь мир — бороться против биометрических систем, используемых для целей общественной безопасности. Организаторы движения считают, что распознавание лиц становится инструментом полицейского террора. При этом биометрия как неотъемлемая часть удобных, быстрых и персонализированных услуг, например в банках или каршеринге, ожидаемо вызывает гораздо меньше протестов. Однако из-за таких радикализированных точек зрения страдает репутация технологии в целом. Проблема в том, что люди не понимают, как происходит сбор, обработка и хранение данных.

Когда биометрические системы «захватывают» изображение лица или другой части тела, они обрабатывают полученную информацию и превращают ее в специальные цифровые объекты — биометрические шаблоны. Поэтому фотографии и другие изображения не хранятся в биометрических базах данных, как, например, изображения отпечатков пальцев в полицейских системах. Биометрические шаблоны можно сравнить со сложными формулами, абсолютно нечитаемыми для человека. При обработке изображения система сравнивает шаблон с другими — например, с тем, что уже хранится в базе данных или был одновременно считан с карты доступа. По сути, речь идет об определении близкого соответствия двух математических формул в некотором общем пространстве измерений. Они не содержат никакой личной информации: фамилии, имени, даты рождения, адреса и т. п.

Кроме того, миллионы людей давно поделились своими фото с друзьями в соцсетях, а отпечатками пальцев — с операционными системами смартфонов, ноутбуков и прочих гаджетов. Все эти данные не являются большой тайной. Но даже если представить Доктора Зло, который собирает их и накапливает, без привязки к личной информации извлечь из этого какую-то выгоду ему бы не удалось.

2. Биометрические системы с ИИ всесильны и самодостаточны

Иногда может показаться, что мы уже находимся в матрице почти виртуальной реальности, где искусственный интеллект (ИИ) с помощью биометрических данных скоро сможет управлять всей нашей жизнью. Люди начинают испытывать тревогу и бессилие перед близким будущим, где существование человека становится чуть ли не бессмысленным, поскольку технологии могут «сделать все гораздо лучше нас».

На самом деле технологии ИИ пока не получили такого всеобъемлюще широкого развития, так как стандартные общепринятые сценарии их использования еще только формируются, апробируются и утверждаются. Мы находимся в самом начале этого пути, и неизвестно, закончится ли он безусловным превосходством искусственного интеллекта. Пока же его приходится специально обучать почти для каждого отдельного типа решаемых задач. Правда, сама технология не стоит на месте и постоянно развивается. Сегодня уже существуют системы, которые могут обучаться самостоятельно в процессе работы с реальными данными при минимальной помощи со стороны экспертов.

3. Биометрия дорого стоит

Это не всегда и не совсем так. С одной стороны, биометрические системы — это действительно «большая» технология ИИ. Ежесекундно они производят огромный объем математических операций, а такая производительность просто не может быть дешевой. С другой стороны, биометрия стремительно коммодитизируется (становится общепринятой и широко распространенной), что приводит к быстрому снижению цены отдельного устройства или программного решения. К ним можно отнести системы доступа в квартиру или офис или системы идентификации клиентов со сбором аналитики в удобных облачных сервисах.

Важно, что появление на рынке нового класса «умных» устройств — биометрических смарт-камер, смарт-боксов, смарт-терминалов (названий и неологизмов множество) с необходимым функционалом, интегрированным в удобные приложения и API, делает биометрию еще более массовой, бюджетной и доступной. Использовать подобные типовые решения не намного сложнее, чем, например, такое «бытовое» воплощение ИИ, как умные колонки с распознаванием речи.

Конечно, крупные системы, охватывающие целые города, часто требуют применения дорогостоящего оборудования. Поэтому их стоимость остается высокой и не снижается столь же быстрыми темпами, как стоимость решений для частных пользователей или бизнеса.

4. На больших объемах биометрия дает сбои

Иногда мы сталкиваемся с сомнениями в том, что биометрические системы в масштабах страны достаточно надежны. На самом деле, у этих утверждений нет веских оснований. Современные биометрические алгоритмы тестируются на огромных массивах данных. В некотором предельном случае все население Земли можно поместить в одну большую базу данных и биометрическая технология вполне справится с успешным и точным поиском по этой базе — при условии высокого и ровного качества исходных данных. Если в процессе работы биометрическая система получает достаточно хорошие по качеству и детализации данные, она будет достаточно надежна для любого бизнеса. В некоторых случаях можно также использовать комбинацию биометрических модальностей (например, изображение лица и отпечаток пальца), тогда система станет, образно говоря, немного надежнее паспорта.

Фото:Hugo Ibari/Getty Images

5. Биометрия недостаточно точно распознает лица

Раньше системы распознавания лиц могли ошибаться из-за условий освещенности, погодных условий, измененного облика пользователя или скрывающей его одежды. За последние шесть лет точность распознавания лиц нейросетями увеличилась в 50 раз, достигнув показателя выше 99% для баз данных, содержащих сотни миллионов лиц.

Почему не 100%? Потому что любое распознавание, построенное на технологиях нейронных сетей, является вероятностным методом — сравнение биометрических шаблонов для установления их схожести всегда производится с некоторой конечной точностью, иначе говоря, уровнем строгости алгоритма.

На практике на ограниченном массиве данных можно достичь точности практически в 100%, чисто технически задавая большую строгость биометрическому алгоритму. Однако тогда алгоритм станет более строг и к качеству входных данных. Использование системы может стать неудобным или некомфортным для пользователей, поскольку любые, даже незначительные несовпадения во входных данных по сравнению с эталонными алгоритм будет квалифицировать как расхождения, выдавая в результате отказ в обслуживании. Так, сегодня некоторые банки внедрили распознавание по лицу и голосу в приложениях. Это очень полезная функция, с помощью которой можно, например, быстро заблокировать карту в случае кражи, вместо того чтобы дожидаться ответа оператора на линии и диктовать ему данные паспорта. Так вот, более строгий алгоритм будет чувствителен даже к шумовому фону вокруг говорящего и случайным изменениям тембра голоса и будет просить образец голоса вновь и вновь, пока не получит ожидаемое качество данных. Именно поэтому на практике соблюдается некоторый приемлемый баланс между точностью и удобством.

6. Отпечаток пальца можно подделать с помощью пластилина или гипса

Когда известные бренды Samsung, Xiaomi, Huawei начали использовать разблокировку мобильного телефона по отпечатку пальца, оказалось, что достаточно приложить к дисплею кусок непрозрачного материала там, где оставались следы предыдущего соприкосновения, и телефон считал, что к нему приложили настоящий палец владельца. Компания Huawei открыто прокомментировала, что блокировку можно обойти, и предоставила отчет по устранению уязвимости. Брендовые производители стали использовать другие датчики и заверили, что проблема решена. Если гаджет сертифицирован Google и работает под управлением Android 6.0 или более новой операционной системы, то шансы использовать отпечаток для взлома значительно сокращаются.

Существует спор о том, что сохраненные данные можно использовать для восстановления изображений отпечатков пальцев. Но современные технологии просто рассчитывают и кодируют данные отпечатка всякий раз, когда вы прикладываете палец к сканеру. Алгоритмы обработки могут различаться в разных версиях операционной системы, во многих смартфонах биометрические данные периодически стираются и обновляются при одновременном введении пин-кода и прикосновении к сканеру — все это для повышения надежности и периодической актуализации реальных пользовательских данных.

Современные считывающие устройства уже учитывают пульсацию кровеносных сосудов, потожировое покрытие поверхности кожи и прочие признаки, сканируют папиллярный рисунок в различных спектрах и используют дополнительные программные методы для противодействия спуфингу.

7. Биометрия помогает мошенникам

Миф основан на реальных случаях, когда систему распознавания лиц в смартфонах удалось обмануть с помощью очень качественной 3D-маски. Однако сам по себе этот мошеннический процесс очень напоминает трюки из фильмов «Миссия невыполнима». Если вы мультимиллионер или первое лицо государства — словом, человек, доступ к смартфону которого может заинтересовать крупных злоумышленников, — не стоит полагаться на встроенную в гаджеты биометрию как единственный барьер между ними и «ядерным чемоданчиком» или счетом в банке. Во всех остальных случаях биометрия существенно повышает уровень безопасности. Она используется для того, чтобы посторонние люди не могли действовать от имени пользователя, осуществляя прямой подлог или используя захваченные пароли и документы. Например, она увеличивает надежность двухфакторной аутентификации, когда пароль подтверждается биометрическим признаком, вычисленным «на месте» на основе отпечатка пальца, изображения лица или радужной оболочки глаза.

Что касается взлома непосредственно биометрической базы данных, не стоит забывать, что данные хранятся в виде шаблонов. Эти математические модели трудно поддаются дешифровке и адаптации для произвольного использования. В таком виде кража биометрических данных не имеет смысла, в отличие от кражи номеров телефонов или адресов электронной почты. Мошенникам для достижения корыстных целей понадобится еще и действующая биометрическая система, способная осуществить дешифровку и научиться работать именно с этими данными. Осуществить это на практике очень трудно.

Больше текстов об экономике, технологиях и обществе — в нашем телеграм-канале «Проект “Сноб” — Общество». Присоединяйтесь

Как не дать нейросетям распознать своё лицо

Исследователи по всему миру пытаются предотвратить «цифровое рабство». Системы распознавания лиц — это реальная угроза или мнимая опасность?

Системы распознавания лиц позволяют идентифицировать личность человека по записи с камеры видеонаблюдения или селфи в инстаграме. Для этого используются нейросети, которые считывают и анализируют характерные черты человеческого лица, а затем сверяют их с базой. Такие технологии иногда дают сбой и вредят людям: например, системы, применяемые в криминалистике, чаще указывают на темнокожих как на потенциальных преступников.

Технологии распознавания лиц активно используются в том числе и в России. Например, в 2020 году они применялись для поиска нарушителей режима самоизоляции в Москве. В июне 2021 года стало известно, что российские власти собираются объединить камеры по всей стране в единый контур видеонаблюдения. На разработку платформы и установку «умных» камер планируется потратить 250 млрд рублей за пять лет.

Руководитель «Роскомсвободы» Артём Козлюк считает, что запуск такой масштабной системы может грозить россиянам потерей персональных данных. По его словам, из-за ошибок распознавания граждане рискуют попасть под неправомерные действия правоохранительных органов.

Где сегодня используются системы распознавания лиц, чем они полезны и опасны и как учёные пытаются бороться с технологией — в материале Skillbox Media.

Технология распознавания лиц уже везде. Где и как вас точно узнают
Далеко не все считают системы распознавания чем-то плохим. Говорят, в них много пользы
Некоторые правозащитники и учёные убеждены, что технология может навредить. Чем она опасна
Как обмануть системы распознавания лиц
Кто победит: системы распознавания лиц или инструменты против них

Журналист и редактор. Пишет о бизнесе, технологиях и лайфстайле. Любит рассказывать о небольших историях, которые вырастают во что-то значимое.

Где и как применяют системы распознавания лиц

Для идентификации человека используют нейросети, умеющие считывать и анализировать черты лица, а затем сверять их с базой. Самая известная технология распознавания лиц — Face ID на iPhone.

Подобные системы используют:

Производители смартфонов — для защиты персональных данных и их недоступности в случае кражи.

Полиция и спецслужбы — для поиска преступников, доказывания преступлений и их предотвращения.

Аэропорты и погранслужбы — для автоматизированного контроля электронных паспортов.

Больницы и дома престарелых — для отслеживания и оценки состояния пациентов.

Общепиты, банки и ретейл — для идентификации, предотвращения мошенничества, анализа поведения покупателей; для открытия счёта и получения кредита.

Школы и университеты — для контроля за учениками и студентами во время экзаменов.

Маркетинговые и рекламные компании — для повышения качества обслуживания клиентов и запуска персонализированной рекламы.

Автомобильные компании — для замены ключей от машины.

В 2020 году объём мирового рынка распознавания лиц оценивался в 3,86 млрд долларов и, как ожидает исследовательская компания Grand View Research, будет увеличиваться со среднегодовым темпом роста 15,4% с 2021 по 2028 год. Согласно отчёту Global Market Insights, к 2026 году объём рынка должен превысить 12 млрд долларов.

Самые масштабные разработки в области распознавания лиц принадлежат Google, Apple, Facebook, Amazon и Microsoft. Например, Facebook с 2010 года начал автоматически отмечать людей на фотографиях с помощью встроенного инструмента, а Apple внедрила распознавание лиц в iPhone.

Технология активно используется и за пределами IT-сектора. Так, авиакомпания British Airways с 2017 года применяет систему распознавания лиц, чтобы ускорить процедуру посадки на рейс, идентифицировать пассажиров, вылетающих рейсами из США.

В России есть четыре крупных игрока в этой сфере: NtechLab, VisionLabs, Sensemaking Lab и Группа ЦРТ. NtechLab известна как разработчик приложения FindFace, которое использовали для поиска людей во «ВКонтакте» по фото. Позже компания выступила подрядчиком для внедрения камер с распознаванием лиц в Москве и других регионах России.

VisionLabs также разрабатывала системы для столичных камер и участвовала в других городских проектах. Сейчас компания входит в экосистему «Сбера» и внедряет биометрию в банковские сервисы.

Sensemaking Lab создаёт продукты для городских и федеральных служб, сотрудничает с российскими и зарубежными компаниями. Группа ЦРТ первой в России внедрила систему распознавания лиц в спорте, её решения используются более чем на десяти стадионах и ледовых аренах.

Какие проблемы связаны с технологией и почему распознавание лиц — это всё равно хорошо

На сегодня с современными системами распознавания лиц связаны две основные проблемы, которые не сильно зависят от алгоритмов и носят общий характер, рассказал Skillbox Media директор департамента решений на базе ИИ компании Oberon Владимир Борисов.

Во-первых, по мнению эксперта, есть недоверие людей, страх тотальной цифровизации и того, что в современном мире у человека не останется личного пространства. В результате вокруг систем распознавания лиц образуется негативный информационный фон. «Но это не относится к корпоративному сегменту, где на протяжении многих лет формировалось мнение, что ИИ и системы распознавания приносят много пользы и работают на благо как конкретного сотрудника, так и предприятия в целом», — утверждает Владимир Борисов.

Во-вторых, у систем распознаваний лиц есть проблемы с инфраструктурой, на которой должна работать биометрия. Если базу создавать с нуля, то сложностей не возникает. Можно довольно быстро подобрать и смонтировать оборудование. Но если на предприятии уже есть видеокамеры или системы видеонаблюдения, то зачастую приходится формировать дополнительные рекомендации по верному расположению камер, изменению фокусного расстояния и светочувствительности.

Владимир Борисов убеждён, что системы распознавания лиц не могут навредить законопослушным людям. Напротив, они помогают в повседневной жизни. «Например, это различные удобные сервисы оплаты или прохода через турникеты по лицевой биометрии, биометрические карты лояльности, позволяющие продавцу-консультанту в торговом зале быстро сориентироваться и предложить покупателю необходимый товар», — объясняет он.

Системы распознавания лиц активно используются также для борьбы с преступностью. По словам Борисова, ежесекундно в России «миллионы камер в аэропортах, на ж/д вокзалах или транспорте сопоставляют пассажиропоток с базой террористов». В случае выявления совпадений камеры выдают необходимые оповещения на пульт охраны.

Вопрос системы распознавания лиц чаще обсуждается не на уровне технологического прогресса, а на уровне этических нормативов, с сожалением отметил в разговоре со Skillbox Media директор по продуктам облачного сервиса для видеонаблюдения Ivideon Заур Абуталимов. Обсуждение проблемы инициировал ЕС, в ряде штатов США запрещено использование технологии для коммерческой деятельности, а в Сингапуре, например, уже действуют цифровые паспорта.

«У системы распознавания лиц нет цели слежки за каждым жителем города и получения его персональных данных. Камера хоть и умеет выцеплять лицо из потока, но это осуществляется для локальных целей, например, бизнеса: цифровая проходная система в офис или маркетинговый анализ поведения покупателя в магазине. Контролировать каждого жителя мегаполиса — это дорого и бесцельно», — утверждает Заур Абуталимов.

Чем могут быть опасны современные системы распознавания лиц

Тем не менее технология не всегда работает так, как утверждают её сторонники. Например, в 2020 году система распознавания лиц в московском метро ошибочно приняла горожанина Сергея Межуева за преступника в розыске. В итоге его задержали и не сняли подозрения, пока не нашли реального правонарушителя.

Другой проблемой систем распознавания называют утечки. По данным СМИ, на чёрном рынке продают доступ к московским камерам видеонаблюдения — в том числе подключённым к системе распознавания лиц. Так, волонтёр «Роскомсвободы» смогла заказать на чёрном рынке слежку за собой в Москве с использованием системы распознавания лиц. За 15 тысяч рублей она получила информацию о своих передвижениях и видеозаписи с собой.

Если меры безопасности, применяемые в технологии распознавания лиц, недостаточно строги, хакеры могут подделывать чужую внешность для незаконной деятельности, рассказал Skillbox Media директор по продуктам компании Ivideon Заур Абуталимов. Например, была обнаружена утечка данных в приложении BioStar 2, использующем технологию распознавания лиц и отпечатков пальцев для идентификации пользователей. Исследователи конфиденциальности в интернете Ноам Ротем и Ран Локар в экспериментальных целях смогли получить доступ к более чем 1 млн записей отпечатков пальцев, а также к информации о распознавании лиц.

«Однако число случаев мошенничества с идентификационными данными уменьшается благодаря всё более совершенным мерам безопасности и уровню развития технологии. Сегодня обмануть систему распознавания лиц стало очень сложно», — считает Заур Абуталимов.

Сегодня для обучения нейросетей, применяемых в системах распознавания лиц, используют базы данных, которые содержат в основном фото людей титульной нации. Поэтому системы плохо распознают азиатов, латиноамериканцев и афроамериканцев. А системы, применяемые в криминалистике, чаще указывают на чернокожих людей как на потенциальных преступников. Например, в 2020 году в Детройте система распознавания лиц приняла чернокожего мужчину за преступника. Афроамериканец был арестован, потому что алгоритм посчитал его снимок идентичным фотографии грабителя — тоже афроамериканца.

Наиболее широко распознавание лиц применяют в Китае. Там технология используется не только для поимки преступников, но и для поддержки социального рейтинга. В рамках этой системы каждый житель страны получает баллы за общественно полезную деятельность, отсутствие нарушений и своевременную уплату налогов. За проступки баллы снимаются — китайцам с плохим рейтингом могут отказать, например, в выдаче кредита или вылете из страны.

Системы распознавания лиц в современном обществе постепенно становятся инструментом контроля, заявил Skillbox Media руководитель облачного хостинг-провайдера HostFly.by Александр Хмыль. По мнению эксперта, вместо того чтобы создавать программные продукты для быстрой оплаты или совершенствования рекламных технологий, разработчики сфокусировались на государственных проектах и применении системы распознавания лиц в сфере охраны правопорядка. Но это легко объясняется тем, что разработка подобных решений — достаточно дорогая.

«Позволить себе вкладывать деньги в системы, которые реально могут работать с большим массивом данных изображений, может только государство или крупные финансовые компании. На примере банков, которые попытались внедрить систему идентификации клиентов по лицу, можно сказать, что такие инвестиции вряд ли окупятся в ближайшие годы», — рассказал Александр Хмыль. Он уточнил, что доступ к базе данных изображений граждан есть только на государственном уровне, а другим компаниям нужно самостоятельно формировать эту базу, хранить её и защищать от утечек.

В 2020 году с призывом ввести мораторий на применение технологии распознавания лиц на всей территории США выступила Ассоциация вычислительной техники. Причина кроется в задокументированной этнической, расовой и гендерной предвзятости, которую проявляют системы, использующие алгоритмы распознавания.

По мнению Александра Хмыля, чтобы технология распознавания лиц стала массовой, она должна очень хорошо себя зарекомендовать, работать идеально, без ошибок и историй вроде «машину обманули распечаткой портрета пользователя». Сейчас технологии визуальной идентификации далеки от совершенства, хотя определённый прогресс в этом направлении есть, резюмирует эксперт.

Как обмануть системы распознавания лиц

Чтобы не стать жертвой некорректной работы систем распознавания, некоторые люди стараются найти способы для их обмана.

В 2017 году директор по распространению технологий «Яндекса» Григорий Бакунов разработал специальную систему макияжа, якобы помогающего обмануть нейросети. Для этого он использовал алгоритм, подбирающий образ по принципу антисходства. Примерно в том же ключе действовали участники протестов в Лондоне в 2020 году: они пытались обмануть системы распознавания лиц с помощью цветных патчей на лице.

Битва между прогрессом и этикой. Что ждет технологию распознавания лиц — мнения предпринимателей

Распознавание лиц — одна из тех технологий, которые восхищают одних и пугают других. Она помогает ловить преступников и проходить в самолет без посадочного талона, но при этом всю глубже вторгается в частную жизнь.

Принесем ли мы нашу приватность в жертву комфорту и безопасности? Как далеко зайдет развитие систем facial recognition? И станет ли распознавание лиц привычной и неотъемлемой частью повседневной жизни?

Представители индустрии поделились с нами своими прогнозами на ближайший год и пятилетие.

Сергей Черных, заместитель председателя совета директоров ГК «ХайТэк»

На мой взгляд, распространение технологии сегодня уже не остановить, да и не стоит этого делать. Решения на базе распознавания лиц применяются в самых различных сферах: для обеспечения безопасности городской среды, в системах контроля и управления доступом, финансовом секторе, ритейле, HR и других.

Конечно, можно рассуждать о том, что применение распознавания лиц, как, впрочем, и любой другой технологии биометрической идентификации, — это некая потеря приватности, но в обмен на гораздо больший уровень безопасности и нашего с вами комфорта.

К тому же, не стоит забывать, что отследить перемещение человека можно и другими способами — к примеру, по кредитке, сим-карте или множеству приложений, использующих геолокацию.

А наши персональные данные обрабатываются банками, поликлиниками, миграционными службами, не говоря уже об интернете, социальных сетях и пользовательских сервисах, где каждый из нас регистрируется, соглашаясь с политикой обработки персональных данных, чаще всего даже не читая ее.

Очевидно, что к концу 2020 года технология распознавания лиц прочно войдет в повседневную жизнь каждого жителя крупного города России.

В первую очередь, речь идет о национальной безопасности: распознавание лиц будет широко применяться в государственных системах безопасности, для обеспечения доступа на режимные объекты, поиска преступников и предупреждения террористических актов.

Одновременно с этим можно обозначить тренд расширения функциональности систем видеоаналитики — помимо лицевой биометрии системы видеонаблюдения начинают определять пол, возраст, retention rate (коэффициент удержания клиентов) и прочие данные для дальнейшей обработки и создания аналитических массивов данных. Развитие и распространение технологии позволит достичь качественно нового уровня персонификации и защищенности сервисов.

Если же предположить, что будет в перспективе ближайших пяти лет, то думаю, что нас ждет нечто наподобие социальной сети в реальном мире, когда системы будут «знать» социальные графы всех людей, попавших в поле зрения камеры. А поверх этого будет построено огромное количество бизнесов и сервисов.

Фарид Нигматуллин, генеральный директор Videomatrix (ООО «ВидеоМатрикс»)

Технология распознавания лиц будет развиваться. Согласно оценке Bloomberg, мировой рынок распознавания лиц вырастет к 2022 году до $7,76 млрд. Для сравнения — 2017 год оценивался в $4,05 млрд.

Вопросы приватности и этики влияли и будут влиять на равномерность развития технологий биометрии. Когда Китай широко применял камеры на улицах города и очки с системой распознавания лиц для поимки преступников, Бельгия первая запретила коммерческим организациям использование таких технологий.

Первый иск против властей на основании нарушения права на приватность подан в Великобритании в 2018 году. И каждая страна, а в случае США даже каждый штат, рассматривает для себя этот вопрос в частном порядке.

Несмотря на социальные барьеры, распространение технологии биометрии очевидно. Оптимизация программных библиотек под вновь создаваемые архитектуры аппаратного обеспечения производятся регулярно. Ждем большую прогрессивность за счет усовершенствования математической базы, увеличение скорости работы детектора, классификатора, повышение точности. Вероятно парное развитие — и алгоритмов, и «железа».

Практика показывает, что «железо» развивается быстрее. Первый вектор развития — энергоемкие, результативные и при этом компактные вычислители. Nvidia в 2019 году выпустила линейку таких процессорных модулей — Jetson. Другой вектор — мощные серверные и десктопные архитектуры для AI, такие как Turing, Volta.

Повсеместное применение 3D-распознавания лиц пока преждевременно. 3D-сканеры — вещь отличная, но не каждое предприятие может позволить себе дорогостоящее оборудование. В случае собственных решений пока делаем упор на 2D-распознавание с применением серверной видеоаналитики, AI и алгоритмов. До конца 2020 года это лучшее соотношение точности разработанной системы и приемлемости цены решения для заказчика.

Мы занимаемся сложной промышленной видеоаналитикой. Хотя тренды рынка ведут к тому, что к 2025 году видеоаналитика, в том числе с элементами биометрии, станет популярна и среди обычных пользователей — для обеспечения собственной безопасности и охраны дома.

Владимир Молодых, директор по разработке и внедрению ПО «Инфосистемы Джет»

Действительно, сейчас есть противники повсеместного использования технологии распознавания лиц, и у нас есть закон о персональных данных и праве на частную жизнь (ст. 23 и 24 Конституции РФ). Уже были прецеденты, когда граждане подавали в суд на правительство, требуя запретить использование этой технологии.

Тем не менее, было бы странно отказываться от инструмента, с помощью которого можно предотвратить теракт или найти пропавшего ребенка. Технологии видеоаналитики будут развиваться несмотря на сложности.

К тому же, часто ими пользуется бизнес на территории предприятия или магазина. Например, в ритейле видеоаналитика будет помогать сформировать индивидуальный подход к покупателю, на заводе поможет обеспечить безопасность и т.д.

Сейчас есть спрос на решение сложных уникальных задач с помощью технологий искусственного интеллекта, анализирующих видеоданные. В ближайшее время будет стремительно развиваться это направление. Мы уже не первый год делаем подобные проекты.

Например, с помощью математических моделей мы можем распознавать движения рук рабочего на производстве, считать, сколько времени уходит на каждую операцию, и анализировать разные характеристики процесса. В результате анализа этих данных мы можем точно измерить эффективность работы персонала, узнать, что может мешать процессу, и дать рекомендации, что можно изменить к лучшему.

Можно привести более простой пример: видеокамеры, установленные на стройке, и математическая модель, обученная распознавать наличие защиты (касок, перчаток и т.д.), могут определить, кто из работников не выполняет требования безопасности.

А система, установленная на сортировочном оборудовании, поможет классифицировать сырье: например, при производстве драгоценных камней.

Сфера применения таких технологий безгранична, и за ними — будущее.

Дмитрий Марков, генеральный директор компании-разработчика продуктов по распознаванию лиц VisionLabs

Не думаю, что возникнут какие-то сложности с развитием этой технологии. Все новое вызывает опасение, но со временем это войдет в наш привычный образ жизни.

Сейчас можно забыть ключи от машины или квартиры, потерять скидочную или банковскую карту и т.д. С лицом такого произойти не может. Даже если вы нанесли макияж, надели шляпу или очки, продукты по распознаванию лиц вас узнают и поспособствуют предоставлению необходимого вам сервиса. Это удобно и безопасно.

На данный момент опасения людей связаны с тем, что у нас недостаточно рассказывают, что такое биометрия, как она работает, какой у нее уровень надежности и как сильно она помогает упростить наши ежедневные задачи.

Тем не менее, мы абсолютно уверены, что в течение ближайших трех лет этот барьер будет преодолен и биометрия станет привычной для абсолютного большинства людей.

Андрей Хрулев, директор по бизнес-развитию направления биометрических систем группы компаний ЦРТ

Избежать сложностей можно путем разработки нормативной базы, четко регламентирующей допустимые границы применения технологии. Что касается вопросов этики, то практически любая технология может быть использована как на пользу обществу, так и во вред.

Показательна аналогия с медициной: один препарат может быть и ядом, и целительным средством. Бояться этого не стоит, но регулировать, определять, договариваться о целевых областях применения, границах, развивая «целительное» свойство, — безусловно.

Кроме того, такой подход позволит не отстать от мирового сообщества в технологическом плане.

Именно поэтому техновизионеры ЦРТ фокусируются не только на самих технологиях и продуктовой разработке собственной системы распознавания лиц, но и являются экспертами международного Биометрического института (Biometrics Institute), где мы вместе с ключевыми мировыми экспертами формируем подходы к защите персональных данных в разрезе этических вопросов и защиты личных данных.

Тренды, актуальные для российского рынка:

Новая актуальность вопросов безопасности.

Угроза спуфинга (взлома) — вызов для разработчиков систем распознавания лиц, который стимулирует к поиску все новых и новых средств защиты. Чем доступнее становятся современные технологии, облегчающие взлом системы, тем более прогрессивными должны быть алгоритмы защиты.

Мы всегда должны быть на шаг впереди, чтобы достичь безопасности и удобства пользователя, поэтому компании-разработчики продолжат эксперименты с различными методами Liveness detection (защита от взлома).

Тенденция расширения применения технологии как для решения задач безопасности, так и оптимизации бизнес-процессов.

Традиционно системы распознавания лиц применяются для обеспечения безопасности. Так, система распознавания лиц от ЦРТ уже доказала свою эффективность более чем на 10 объектах спорта, более 20 объектов транспортной инфраструктуры, 5 городов по всей России используют ее для реализации программ «Безопасный/Умный» город.

Скоро все больше новых рыночных сегментов осознают пользу данной технологии и будут ее внедрять. Здесь и «бесшовное» управление пассажиропотоком на транспорте, и применение на объектах культуры (например, проход в музей без предъявления билета).

Актуальность правового регулирования.

В связи с проникновением технологии новую актуальность приобретает и регламент защиты персональных данных, и снятие ряда законодательных ограничений, препятствующих внедрению инноваций.

Осознание преимуществ видеоаналитики.

В высококонкурентной борьбе компании стремятся выделять себя, в том числе с помощью персональных систем лояльности, которые невозможны без знания своего клиента. Большие данные становятся все более ценным ресурсом и потребуют современные инструменты обработки и интерпретации данных.

Регулирование этики применения технологии.

Кроме того, возрастет число проектов в рамках концепции «Безопасный город», увеличится доля биометрических СКУД (систем контроля и управления доступом), пользователи смогут удаленно получать доступ к банковским и государственным услугам, используя лицо в качестве единственного идентификатора.

Если говорить не о бизнес-развитии, а о развитии технологии, — продолжится совершенствование алгоритмов, повысится точность работы систем видеоидентификации. На рынке появятся коммерческие решения на базе новых технологий, расширяющих возможности распознавания лиц, в частности, идентификация по тепловизионному изображению. На данный момент подобные алгоритмы только тестируются.

Виталий Виноградов, менеджер по продуктам сервиса облачного видеонаблюдения и видеоаналитики Ivideon

Сложности с развитием технологии возникают, но скорее из-за процесса привыкания к чему-то новому. Эти сложности уйдут сами собой, когда людям станет понятно, что ничего страшного в технологии нет, а используется она для обеспечения безопасности или повышения качества сервисов.

В банках, магазинах или кафе камеры законно могут распознавать лица людей, которые сами дали свое согласие на обработку персональных данных. Такое согласие дается при включении клиента в программу лояльности магазина. В остальных случаях полученное с видеокамер изображение не привязано к персональному идентификатору — фамилии и имени, — а посетители магазина могут быть указаны в системе как «Клиент №1», «Клиент №2».

В коммерции остается задача автоматизации процессов, и все большую роль занимают инновационные инструменты аналитики, поэтому в 2020 году бизнес сделает первые шаги в сторону полноценного внедрения технологии распознавания лиц.

Ожидаю, что скоро мы увидим описание первых кейсов применения технологии в маркетинговых целях — например, для улучшения работы программ лояльности в ритейле или повышения качества обслуживания клиентов в банках.

За пять лет развития технологий нейросеть «научится» узнавать лица с максимальной точностью даже в сложных рабочих условиях: в темноте, под проливным дождем, с неудобного ракурса и т.д. Разница между офлайном и онлайном сотрется.

Бизнесу будет неважно, откуда приходит клиент — будет важно, что бизнес знает о клиенте.

Видеоаналитика в целом и распознавание лиц в частности позволит глубже изучить потребности и вкусы покупателей и в результате предложить уникальный сервис.

Фото на обложке: Shutterstock / varuna

Бионический глаз и 3D-кости: медицина будущего, доступная уже сейчас

Бионический глаз

Люди, интересующиеся темой медицинских технологий будущего, наверняка слышали про бионический глаз Argus II. Разработанный американской компанией Second Sight, он предназначен для улучшения зрения людей с тяжелой формой пигментного ретинита. Это редкое наследственное заболевание, при котором светочувствительная сетчатка глаза постепенно деградирует.

Argus II состоит из двух элементов: имплантата сетчатки и внешней системы, состоящей из вмонтированной в очки камеры с небольшим процессором. Камера записывает изображение в реальном времени, которое обрабатывается и отправляется по беспроводной сети к импланту. Argus II использует 60 электродов, чтобы стимулировать оставшиеся здоровые клетки сетчатки глаза пациента и отправить визуальную информацию в зрительный нерв, таким образом восстанавливая способность различать свет, движение и формы.

Первая операция по установке бионического глаза прошла в 2013 году, а всего в мире уже больше 200 пациентов с Argus II.

Печать костей

Благодаря технологии 3D-печати и новой технологии, разработанной учеными из университета Нового Южного Уэльса (Австралия), появилась возможность печатать кости.

Напечатанный гибридный материал, состоящий из комбинации цинка, кремния и фосфата кальция, помещается в место, где повреждены кости, и используется в качестве каркаса, пока человеческие кости не восстановятся.

Пока что эта разработка — лишь эксперимент, и непонятно, при каких травмах можно будет использовать эту технологию. Предполагается, что после восстановления костей пациента ученые будут вынимать напечатанный материал из организма, а человек продолжит жить нормальной жизнью. Также возможно, что кости будут срастаться поверх напечатанного материала.

В дальнейшем ученые планируют заменять сильно поврежденные кости и суставы полностью, вставляя вместо них напечатанные импланты.

Биопечать тканей и органов

Ученые также работают над тем, чтобы можно было печатать мягкие ткани, органы, сосуды и даже отдельные клетки человеческого организма.
Если раньше точную форму клетки или органа было получить достаточно сложно, то теперь этот процесс автоматизирован, хотя и требует серьезных вложений и исследований.

Доктор Лучано Видал, работающий вместе с другими учеными из Центральной школы Нанта (Франция), в 2020 году провел успешный эксперимент по печати индвидуального каркаса из фосфата кальция для лечения серьезных костных дефектов у овец.
Сначала ученые сканировали весь участок организма, где наблюдался дефект, а затем печатали персонализированный каркас, анатомически подходящий под место дефекта.

Чтобы использовать технологии 3D-печати на людях, ученым предстоит решить проблему принятия организмом напечатанных клеток и тканей. В случае с имплантацией отдельных органов, нужно понять, как соединить напечатанную сосуды новых органов с сосудистой системой хозяина. Но уже сейчас можно отметить, что 3D-биопечать — область, обладающая огромным потенциалом и способная совершить прорыв в области современной медицины и здравоохранения.

Гель, останавливающий кровотечение

Биотехническая компания Suneris разработала гель Vetigel, способный почти мгновенно останавливать кровотечение.В 2015 году Vetigel придумал студент Политехнического института Нью-Йоркского университета Джо Ландолина, которому на тот момент было 17 лет.

Гель представляет собой сеть независимых полимеров. В момент нанесения на пораженный участок кожи они формируют структуру, которая не только работает как пластырь, но и помогает организму вырабатывать фибрин. Именно он отвечает за свертывание крови.

Пока что VetiGel можно использовать только в ветеринарных целях, но ученые надеются, что получат разрешение на использование геля там, где он может быть критически необходим — например, в реанимациях или зонах боевых действий.

Уже сейчас Vetigel можно купить на официальном сайте компании всего за $35.

Голограмма для медицины

Представьте себе медицинский осмотр, во время которого врач сможет не только посоветоваться со своими коллегами с другого конца света, но и посмотреть на конкретный орган человека и тут же получить всю нужную информацию во всплывающем окне. Например, результат рентгена или МРТ.

Такое решение прямо сейчас предлагает Microsoft. Компания разработала Hololens 2 — очки смешанной реальности, созданные специально для оптимизации работы специалистов.

Сами Hololens представляют собой надеваемый на голову обруч с линзой и встроенными внутрь микродиспелями, которые создают голограмму изображения в пространстве. Информацию и голограммы, которые видит пользователь, можно выводить через проектор, а сами элементы голограммы активны — например, при использовании приложения электронной почты можно отправить письмо, а голограмму МРТ пациента можно рассмотреть с разных сторон.

Помимо создания голограммы в пространстве, Hololens 2 с помощью искусственного интеллекта и машинного обучения отслеживает движение рук пользователя без каких-либо контроллеров. Пользователям достаточно в прямом смысле нажать на кнопки в воздухе.

Функцию управления интерфейсами приложения Microsoft Teams с помощью жестов в воздухе показал один из сотрудников компании на презентации Hololens 2.

Hololens используется не только в бизнесе, но и в медицине, производстве (например, чтобы видеть структуру отдельной детали в виде трехмерного изображения) и обучении. Стоимость на официальном сайте производителя — от $3,5 тыс.

Датчики в крови

Исследователи из института Макса Планка провели эксперимент с роботами микроразмеров, которые в буквальном смысле плавают в крови организма.

Подобные роботы размером меньше 1 мм обеспечат целенаправленное лечение и могут использоваться для «доставки» лекарств.

Чтобы эта технология стала по-настоящему массовой, ученым предстоит придумать, как сделать подобных роботов удобоваримыми, чтобы организм мог нормально функционировать после проглатывания микроустройства.

Подобные технологии уже есть на рынке: например, японские компании Otsuka Pharmaceutical и Proteus Digital Health создали легкоусваиваемый датчик, который пациент принимает внутрь. Подобный робот способен доставлять в организм препараты, применяемые при психических заболеваниях (депрессии, биполярном расстройстве и шизофрении).

Робот-хирург

В будущем сложные хирургические операции будут проводить с помощью роботов-помощников.

Один из самых известных роботов-хирургов Da Vinci с начала 1990-х годов помогает проводить сложные операции врачам по всему миру.

Роботизированные руки Da Vinci оснащены инструментами, имеющими семь степеней свободы и изгибающимися на 90 градусов.

С помощью Da Vinci возможно провести сложные операции по удалению злокачественных опухолей, не удаляя пораженный орган или ткани целиком, как это требовалось раньше. Благодаря этой точности, гинекологические операции и удаление опухолей, тем не менее, дают возможность женщине забеременеть и выносить ребенка.

Другая компания, производящая роботов-хирургов — Medrobotics. Благодаря своему строению, напоминающему змею, Flex Robotics System позволяет врачам проводить операции в труднодоступных участках организма.

Директор отделения хирургии головного и шейного отделов Медицинского центра Университета Питтсбурга Умамахесвар Дуввури использовал Flex Robotics System для выполнения более полудюжины операций в месяц на горле.

По словам Дуввури, роботизированная система Flex настолько проста в использовании, что даже студенты-медики могут научиться ей эффективно пользоваться за три попытки. А ее высококлассная точность позволяет врачам «пробираться» в любое место тела и причинять меньше вреда мягким тканям.

Илья Чех, основатель компании «Моторика»:

«Роботы во многих вещах заменят человека, и хирургия будет одним из первых направлений. По своей сути, операция — это линейный понятный процесс с набором действий и ситуативными вариантами решения сложностей. Здесь стоит отметить, что большая часть возможных сложностей связана как раз с тем, что операцию делает человек и инструменты заточены под него. Робот-хирург же может быть спроектирован под совсем иной способ проведения классических операций, что упростит процесс и снизит количество осложнений. Аналогичный пример можно провести с беспилотными автомобилями: можно сделать антропоморфного робота, который будет управлять автомобилем, спроектированным для человека, а можно сделать сам автомобиль изначально беспилотным. То же самое и в хирургии: первые роботы-хирурги создавались для проведения операций по сути человеческими инструментами. Сейчас разработчики вместе с врачами уже задумываются на тем, как изменить весь процесс операции с учетом того, что ее всегда будет проводить робот».

Бионические протезы

Разработка бионических протезов — одно из самых технологичных направлений в медицине. Благодаря протезированию люди, оставшиеся без конечности, могут вести почти полноценную жизнь.

Раньше биопротезы выполняли простые функции разжатия или сжатия за счет оставшихся мышц, но сейчас они стали не просто заменой недостающей опоры, а настоящим функциональным гаджетом.

Уже сейчас на рынке есть модели со встроенными многофункциональными датчиками, модулями Wi-Fi.

Пока что основная проблема при разработке и распространении всех новейших медицинских технологий — их дороговизна и недоступность для большинства специалистов и простых людей. Например, бионический протез руки в России обойдется от ₽100 тыс. до ₽1,5 млн.

Илья Чех:

«Любая вновь создаваемая технология будет изначально очень дорогой и недоступной. Затем по мере ее развития она будет упрощаться, удешевляться. Ускорить этот процесс можно, например, с помощью создания огромного спроса (через субсидии) или прямых инвестиций в разработку и улучшение технологий и продуктов».

Следующий шаг в развитии протезирования — создание вживляемых интерфейсов, которые будут считывать сигналы мозга. С помощью таких технологий носители протезов смогут делать покупки в интернете, общаться в мессенджере, передавать информацию разработчикам протеза, выполнять сложные действия.

Например, в 2015 году Агентство перспективных исследовательских проектов в области обороны США (DARPA) провело эксперимент, при котором парализованная женщина управляла авиасимулятором истребителя F-35 c помощью механических рук, которые получали сигналы от ее мозга.

В апреле 2021 года проект Илона Маска Neuralink, который занимается созданием вживляемых чипов, показал видео, где макака играет в видеоигру с помощью такого импланта.

Предполагается, что чип будет крепиться за ухо, от него к мозгу будут идти электроды, всего около 1 500 штук, каждый из которых в четыре раза тоньше человеческого волоса.

Операция по вживлению чипа — не сложнее лазерной коррекции зрения. Предполагается, что имплант в первую очередь будет полезен людям с неврологическими заболеваниями, но в будущем компания Маска планирует запустить массовое производство, чтобы с помощью чипов увеличить эффективность мозга.

Российская компания «Моторика» тоже занимается разработкой вживляемых интерфейсов. По прогнозам Чеха, примерно через 20–30 лет технология станет доступной и безопасной для людей.