Как работает распознавание лиц?

Большинству людей удобно использовать распознавание лиц в фильтрах Instagram и Face ID. Но эта относительно новая технология может показаться немного жуткой. Ваше лицо похоже на отпечаток пальца, а технология распознавания лиц сложна.

Как и у любой новой технологии, у распознавания лиц есть свои недостатки. Эти недостатки становятся все более очевидными по мере того, как военные, полиция, рекламодатели, и создатели дипфейков находят новые хитрые способы использовать преимущества программного обеспечения для распознавания лиц.

Сейчас, как никогда раньше, людям важно понимать, как работает распознавание лиц. Также важно знать ограничения распознавания лиц и то, как оно будет развиваться в будущем.

Распознавание лиц на удивление просто

Прежде чем переходить к различным средствам распознавания лиц, важно понять, как работает процесс распознавания лиц. Вот три приложения для программного обеспечения распознавания лиц и простое объяснение того, как они распознают или идентифицируют лица:

Базовое распознавание лица: для фильтров Animoji и Instagram камера вашего телефона «ищет» определяющие черты лица, в частности пару глаз, носа и рта. Затем он использует алгоритмы, чтобы зафиксировать лицо и определить, в каком направлении он смотрит, открыт ли его рот и т. Д. Стоит упомянуть, что это не идентификация лица, это просто программа, ищущая лица.
Face ID и похожие программы: после настройки Face ID (или аналогичных программ) на вашем телефоне он делает фотографию вашего лица и измеряет расстояние между вашими чертами лица. Затем, каждый раз, когда вы собираетесь разблокировать свой телефон, он «смотрит» в камеру, чтобы измерить и подтвердить вашу личность.
Выявление незнакомца: когда организация хочет идентифицировать лицо в целях безопасности, рекламы или контроля, она использует алгоритмы для сравнения этого лица с обширной базой данных лиц. Этот процесс почти идентичен Apple Face ID, но в большем масштабе. Теоретически можно использовать любую базу данных (идентификационные карты, профили в Facebook), но идеально подходит база данных четких предварительно идентифицированных фотографий.

Хорошо, перейдем к мелочам. Поскольку «базовое распознавание лиц», используемое для фильтров Instagram, является таким простым и безвредным процессом, мы собираемся полностью сосредоточиться на идентификации лиц и множестве различных технологий, которые можно использовать для идентификации лица.

Распознавание лиц в большей степени зависит от 2D-изображений

Как и следовало ожидать, большинство программ для распознавания лиц полностью полагаются на 2D-изображения. Но это сделано не потому, что 2D-визуализация лица сверхточна, а для удобства. Подавляющее большинство камер делают фотографии без какой-либо глубины, а общедоступные фотографии, которые можно использовать для баз данных распознавания лиц (например, изображения профиля Facebook), все в 2D.

Мужчина использует технологию распознавания лиц для определения объекта в базе данных.

Почему двухмерная визуализация лица не очень точна? Ну, потому что плоскому изображению вашего лица не хватает идентифицирующих черт, например глубины. С помощью плоского изображения компьютер может измерить, среди прочего, расстояние между зрачками и ширину вашего рта. Но он не может определить длину вашего носа или выступающий лоб.

Кроме того, 2D-визуализация лица основана на спектре видимого света. Это означает, что двухмерная визуализация лица не работает в темноте и может быть ненадежной в необычных или темных условиях освещения.

Очевидно, что способ обойти некоторые из этих недостатков — использовать 3D-визуализацию лица. Но как это возможно? Вам нужно специальное оборудование, чтобы увидеть лицо в 3D?

ИК-камеры добавляют глубины вашей индивидуальности

Хотя некоторые приложения для распознавания лиц полагаются исключительно на 2D-изображения, нередко для распознавания лиц также используются 3D-изображения. Фактически, ваш опыт распознавания лиц, вероятно, включает в себя щепотку 3D.

Это достигается с помощью метода, называемого лидаром, который похож на сонар. По сути, устройства для сканирования лица, такие как ваш iPhone, направляют на ваше лицо безвредную ИК-матрицу. Затем эта матрица (стена из лазеров) отражается от вашего лица и улавливается ИК-камерой (или камерой ToF) на вашем телефоне.

Женщина, использующая Face ID или аналогичную технологию распознавания лиц на основе ИК-излучения.

Где происходит волшебство 3D? Инфракрасная камера вашего телефона измеряет, сколько времени требуется, чтобы каждый бит инфракрасного света отразился от вашего лица и вернулся в телефон. Естественно, свет, который отражается от вашего носа, будет иметь более короткий путь, чем свет, который отражается от ваших ушей, и ИК-камера использует эту информацию для создания уникальной карты глубины вашего лица. При использовании вместе с базовыми 2D-изображениями 3D-изображения могут значительно повысить точность программного обеспечения для распознавания лиц.

Лидарная визуализация — это странная концепция, которую сложно осмыслить. Если это поможет, попробуйте представить, что ИК-сетка вашего телефона (или любого устройства распознавания лиц) — это игрушка-доска. Как и у игрушечной доски, ваше лицо оставляет углубление в ИК-сетке, где ваш нос заметно глубже, чем, скажем, глаза.

Тепловизор позволяет распознавать лица ночью

Одним из недостатков 2D-распознавания лиц является то, что оно полагается на видимый спектр света. С точки зрения непрофессионала, базовое распознавание лиц не работает в темноте. Но это можно обойти, используя тепловизор (да, как в Томе Клэнси).

«Погодите, — скажете вы, — разве тепловидение не зависит от ИК-света?» Да, это так. Но тепловизионные камеры не излучают вспышки инфракрасного света; они просто обнаруживают инфракрасный свет, исходящий от объектов. Теплые объекты излучают тонны инфракрасного света, в то время как холодные объекты излучают незначительное количество инфракрасного света. Дорогие тепловизионные камеры могут даже обнаруживать небольшие перепады температур на поверхности, поэтому эта технология идеально подходит для распознавания лиц.

Три фото.  Первый - это спектр видимого света, второй - неподвижное тепловое изображение, а третий - составное тепловое изображение.Изображение в спектре видимого света, тепловое изображение и комбинированное тепловое изображение.

Есть несколько разных способов для определения лица с помощью тепловизора. Все эти техники невероятно сложны, но у них есть некоторые фундаментальные общие черты, поэтому мы постараемся упростить задачу с помощью списка:

Требуется несколько фотографий: тепловизионная камера делает несколько снимков лица объекта. Каждая фотография фокусируется на различном спектре инфракрасного света (длинных, коротких и средних волн). Обычно длинноволновый спектр обеспечивает наибольшую детализацию лица.
Карты кровеносных сосудов полезны: эти ИК-изображения также можно использовать для определения кровеносных сосудов на лице человека. Это жутко, но карты кровеносных сосудов можно использовать как уникальные отпечатки пальцев на лице. Их также можно использовать для определения расстояния между органами лица (если типичное тепловизионное изображение дает некачественные изображения) или для определения синяков и шрамов.
Предмет можно идентифицировать: составное изображение (или набор данных) создается с использованием нескольких ИК-изображений. Это составное изображение затем можно сравнить с базой данных лиц для идентификации объекта.

Конечно, тепловое распознавание лица обычно используется военными, это не то, что вы найдете в Khols, и не то, что будет поставляться с вашим следующим мобильным телефоном. Кроме того, тепловидение плохо работает в дневное время (или, как правило, в хорошо освещенной среде), поэтому у него не так много потенциальных применений за пределами армии.

Ограничения распознавания лиц

Мы потратили много времени на разговоры о недостатках распознавания лиц. Как мы видели на ИК- и тепловизионных изображениях, некоторые из этих ограничений можно преодолеть. Но есть еще несколько проблем, которые еще не решены:

Препятствие: как и следовало ожидать, солнцезащитные очки и другие аксессуары могут вызвать сбой в работе программы распознавания лиц.
Позы: распознавание лиц лучше всего работает с нейтральным изображением лицом вперед. Наклон или поворот головы могут затруднить распознавание лиц даже для программного обеспечения для распознавания на основе ИК-излучения. Кроме того, улыбка, надутые щеки или любая другая поза могут изменить то, как компьютер измеряет ваше лицо.
Свет: все формы распознавания лиц полагаются на свет, будь то видимый спектр или инфракрасный свет. В результате странные условия освещения могут снизить точность распознавания лиц. Это может измениться, поскольку ученые в настоящее время разрабатывают технология распознавания лиц на основе сонара.
База данных: без хорошей базы данных распознавание лиц не может работать. В том же духе невозможно идентифицировать лицо, которое раньше неправильно идентифицировалось.
Обработка данных: в зависимости от размера и формата базы данных компьютерам может потребоваться некоторое время, чтобы правильно идентифицировать лица. В некоторых ситуациях, например в полицейской деятельности, ограничения в обработке данных ограничивают использование идентификации по лицу для повседневных приложений (что, вероятно, хорошо).

На данный момент лучший способ обойти эти ограничения — использовать другие формы идентификации в сочетании с распознаванием лиц. Ваш телефон запросит пароль или отпечаток пальца, если он не сможет идентифицировать ваше лицо, и Китайское правительство использует идентификационные карты и технологию отслеживания, чтобы сократить погрешность, существующую в ее сети распознавания лиц.

В будущем ученые обязательно найдут способ обойти эти проблемы. Они могут использовать технологию сонара вместе с лидаром для создания трехмерных карт лиц в любой среде, и они могут найти способы обрабатывать данные о лицах (и идентифицировать незнакомцев) за невероятно короткий промежуток времени. В любом случае, у этой технологии есть большой потенциал для злоупотреблений, поэтому за ней стоит не отставать.

Источники: Университет Риеки, Фонд электронных рубежей