Камеры следят за вами всюду. Как работает система распознавания лиц и нужно ли ее бояться
Камеры уже повсюду. Как нейронные сети следят за нами, нарушает ли это наши права и как изменится пугающая технология в будущем – в материале The Guardian.
Программа распознавания лиц – что это такое?
Сегодня технология распознавания лиц используется повсеместно. Facebook, где вас отмечают на фото с встречи одноклассников, свадьбы вашего кузена или летней вечеринки на работе. В программы Google, Microsoft, Apple и так далее встроены приложения для накопления информации.
Программа распознавания лиц используется в аэропортах, она есть в вашем телефоне – с ее помощью вы можете его разблокировать. И если вам нужно подтвердить свою личность для банковского перевода в £1,000, просто посмотрите в камеру.
Новые приложения появляются все время. Хотите знать, кто стоит за дверью? Видео-дверной звонок с программой распознавания лиц сообщит вам, если вы заранее загрузили фотографии ваших знакомых.
Многочисленные системы используются для обнаружения пропавших без вести и ловли прогульщиков, которые не приходят вовремя на работу. Рекламодатели, конечно, тоже не остаются в стороне. Благодаря программам распознавания лиц на рекламных щитах сегодня появляется тот товар, который интересен именно вам, исходя из оценки вашего пола, возраста и настроения.
Большой Брат здесь? Программа распознавания лиц – инструмент контроля?
В определенных случаях, конечно. Китай использует программу для расового профилирования. Резкую критику получила правительственная практика использования программы для отслеживания и контроля над мусульманами-уйгурами. Камеры с программой распознавания лиц отслеживают и штрафуют пешеходов, отмечают учеников при входе в школу и контролируют выражение их лиц на уроках, чтобы те не отвлекались.
В России технология также используется. <…>
Согласно источникам, Израиль использует распознавание лиц для слежения за палестинцами на Западном берегу реки Иордан. А в Британии полиция столицы и Южного Уэльса опробовала программу распознавания лиц, чтобы находить людей среди футбольных и регбийных толп, на городских улицах, а также на памятных мероприятиях и музыкальных фестивалях. Тейлор Свифт даже использовала программу на концерте в Калифорнии, чтобы отсеять нежелательных посетителей.
В магазинах программа все чаще используется для отпугивания и поимки воров. В следующем году она дебютирует на Олимпийских играх в Токио.
Как технология распространяется?
Большую роль сыграли достижения в трех областях: большие данные (big data), глубокие сверточные нейронные сети и мощные графические процессоры.
Благодаря Instagram, Facebook, Flickr, Google и другим системам в интернете находятся миллиарды фотографий лиц людей, которые были объединены в огромные наборы данных. Они используются для обучения глубоких нейронных сетей – главной опоры современного искусственного интеллекта – для обнаружения и распознавания лиц. Рутинная вычислительная работа обычно выполняется на графических процессорах, сверхбыстрых чипах, которые предназначены для обработки графики. Но за последнее десятилетие системы распознавания лиц распространились повсюду, и данные, собранные по ним, помогли компаниям отточить свои технологии.
Как это работает?
Во-первых, компьютер должен понять, что такое лицо. Научить его можно через алгоритм, обычно глубокой нейронной сети, на примере огромного количества фотографий в различных приложениях. Каждый раз, сталкиваясь с изображением, алгоритм оценивает, где находится лицо. Сначала будет много мусора, но постепенно алгоритм улучшается и в конечном итоге овладевает искусством определения лиц. Это шаг к функции распознавания лиц.
Следующая ступень – распознавание. Обычно используется вторая нейронная сеть. Она получает серию фотографий и учится отличать одно лицо от другого. Некоторые алгоритмы непосредственно отображают лицо, измеряя расстояния между глазами, носом и ртом и так далее. Другие отображают лицо, используя более абстрактные черты. В любом случае, сеть выводит вектор для каждого лица – строку чисел, которая однозначно идентифицирует человека среди других в обучающем блоке.
Программное обеспечение работает с видеоматериалами в режиме реального времени. Компьютер сканирует кадры видео, как правило в местах скопления людей, например на входе на футбольный стадион. И сначала он обнаруживает в кадре лица, а затем выдает векторы для каждого из них. Затем векторы лица сравниваются с векторами лиц людей в розыскном списке. Все совпадения, которые проходят предварительно установленный порог, затем ранжируются и отображаются.
Это не единственный способ, который использует полиция для распознавания лиц. Если подозреваемый замечен, офицеры могут загрузить снимки преступника из базы данных и искать записи с камер видеонаблюдения, чтобы проследить путь подозреваемого до места преступления.
Насколько это точно?
Независимые тесты Национального института стандартов и технологий США (NIST) показали, что за период с 2014 до 2018 года системы распознавания лиц улучшили показатели совпадения по базе портретных фото в 20 раз. Процент сбоев снизился с 4% до 0,2% за этот период, и такое значительное увеличение точности связано с глубокими нейронными сетями. В институте заявили, что сети привели к «промышленной революции» в распознавании лиц.
Но такая отличная производительность возможна в идеальных условиях: при наличии четкого и ясного снимка неизвестного человека, который проверяется по базе данных других высококачественных фотографий. В реальном мире изображения могут быть размытыми или снятыми при плохом освещении, люди могут отвести взгляд от камеры, надеть платок или шарф, или быть намного старше, чем на фотографии на аватарке.
И согласно тестам, проведенным институтом, даже при использовании лучших алгоритмов система дает сбои при попытке различить лица близнецов.
А как насчет системных ошибок?
Проблема возникает, когда нейронные сети обучаются на различном количестве лиц из разных групп людей. Например, если система обучается на миллионе белых мужских лиц, но почти не использует лица женщин и людей с другим цветом кожи, она будет менее точна при попытке распознать последние две группы. Меньшая точность означает больше ошибочных идентификаций, и в результате большее количество людей будут ошибочно задержаны.
В прошлом году Американский союз защиты гражданских свобод (ACLU) обнаружил, что программное обеспечение от Amazon под названием Rekognition ошибочно идентифицировало 28 членов Конгресса как людей, которые ранее находились под арестом. Оно непропорционально и неправильно идентифицировало афроамериканцев и латиноамериканцев. Но в Amazon сказали, что в ACLU просто использовали неправильные настройки.
Судебные тяжбы также выявили недостатки программы распознавания лиц. Исследование Кардиффского университета в Южном Уэльсе показало, что действенность системы NEC NeoFace снизилась, когда на экране было много людей, и она хуже работала в пасмурные дни и вечером, когда светочувствительность камеры повышалась и кадры становились более «шумными».
За 55 часов работы система отметила 2 900 потенциальных совпадений, из которых 2 755 были ложными. Основываясь на показаниях системы, полиция произвела 18 арестов, но в докладе университета не говорится, были ли кому-либо предъявлены обвинения.
Уэльский суд выделил еще одну проблему при распознавании лиц: овцы. Так называют людей из списка подозреваемых, которые не имеют особых примет и похожи на многих других людей. Во время сканирования толпы на матчах по регби в Уэльсе система NeoFace 10 раз обнаружила женщину из списка подозреваемых полиции Южного Уэльса. Ни одна из них не была настоящей подозреваемой.
Кто владеет технологией?
Технологические фирмы по всему миру развивают программы распознавания лиц, но США, Россия, Китай, Япония, Израиль и Европа лидируют. В некоторых странах технология применяется с большей готовностью, чем в других.
В Китае миллионы камер подключены к программному обеспечению распознавания лиц, а Россия заявила о планах использовать для наблюдения собственные сети. В Европе, как и везде, программа распознавания лиц используется в магазинах для задержания воров и в бизнесе для мониторинга персонала и посетителей, но распознавание лиц в режиме реального времени в общественных местах пока на стадии судебных разбирательств.
В США полиция обычно использует систему распознавания лиц для идентификации подозреваемых по видеозаписям с камер наблюдения, а не для сканирования толп людей в режиме реального времени. Но все равно система используется все больше. Согласно отчету 2016 года Центра права Университета Джорджтаун, половина всех американцев находится в полицейских базах данных по распознаванию лиц, а значит, алгоритмы выбирают подозреваемых из 117 миллионов виртуальных профилей законопослушных граждан.
Что говорит об этом закон?
Почти ничего. В Великобритании нет закона, который дает полиции право использовать программу по распознаванию лиц, и никакой государственной политики по ее использованию. Это привело к тому, что комиссар по биометрии Пол Уайлс назвал ситуацию выгодной для полиции, которая сама решает, где и когда целесообразно использовать программу распознавания лиц и что делать с изображениями, которые снимают камеры.
Компания «Свобода» призвала к полному запрету использования программы в режиме реального времени в общественных местах, заявляя, что она нарушает право на частную жизнь и принуждает людей менять свое поведение. Группа подала судебный иск против полиции Южного Уэльса в связи с использованием этой технологии. Подобные же претензии выразил Эссекский университет в ходе независимого обзора использования полицией программы распознавания лиц. Было доказано, что людей ошибочно задерживали, а значит, технология используется для выслеживания людей, которые вовсе не находятся в розыске. В заключении было сказано, что распознавание лиц в режиме реального времени нарушает закон о правах человека.
Еще одна область разногласий – списки людей, находящихся в розыске. Несмотря на решение Верховного суда 2012 года, что хранение изображений невинных людей незаконно, полиция постоянно создавала базу данных из задержанных 20 миллионов человек, многие из которых так никогда и не были осуждены. Фотографии из базы данных и из социальных сетей используются для создания списков людей, находящихся в розыске, и используются в системах распознавания лиц. В частном бизнесе ситуация еще хуже – владельцы магазинов и предприятий сами решают, кто входит в секретные списки находящихся в розыске и обмениваются фотографиями с другими фирмами.
В США ситуация не намного лучше. Только в пяти штатах есть законы, которые касаются использования программы по распознаванию лиц правоохранительными органами. Путаница в законе привела к тому, что в то время, как в полиции Сиэтла и Сан-Франциско запрещено использовать программу в режиме реального времени, в офисе шерифа в округе Марикопа, штат Аризона, каждое фото и водительские права жителей Гондураса проверяются по списку подозреваемых через программу распознавания лиц.
Как насчет других биометрических данных?
Конечно, технология распознавания лиц в центре внимания, но полиция и другие организации внимательно изучают новые биометрические данные, которые идентифицируют людей, помимо отпечатков пальцев и ДНК.
Говорят, что анализы текстуры кожи компенсируют проблемы при попытке распознать частично закрытые или искаженные лица, анализируя расстояние между порами кожи. Этот метод не часто тестировался, но разработчики утверждают, что, возможно, он позволит различать близнецов.
Еще один биометрический анализ, который интересует полицию, так как он применим на расстоянии и без взаимодействия с человеком, – это анализ походки.
Алгоритмы идентифицируют людей по уникальному стилю их шага, отражая различия в анатомии, генетике, социальном происхождении, привычках и индивидуальности.
Алгоритмы идентифицируют людей по уникальному стилю их шага, отражая различия в анатомии, генетике, социальном происхождении, привычках и индивидуальности.
Есть еще распознавание вен, когда оптические сканеры составляют карту кровеносных сосудов на руке, пальце или в глазу. Считается, что сканеры трудно обмануть, так как наши вены находятся под кожей. Система PalmSecure Fujitsu использует карты вен для мониторинга сотрудников на различных предприятиях.
Идентификация голоса уже используется банками и Министерством по налогам и сборам для подтверждения личности. В отличие от распознавания речи, которое переводит звуки в слова, идентификация голоса обнаруживает уникальные акустические паттерны, созданные голосовым трактом человека и его речевыми привычками.
Что дальше?
Вполне возможно, что эта технология станет вездесущей. Американская фирма Vuzix объединилась с дубайской фирмой NNTC для производства смарт-очков для распознавания лиц. В оправу вставлена крошечная восьмимегапиксельная камера, которая сканирует лица прохожих и предупреждает владельца о любых совпадениях в базе данных из миллиона человек. В Великобритании беспроводное видеонаблюдение работает на полицейских нательных камерах, которые делают почти то же самое. В США недавно запатентована полицейская нательная камера, которая начинает запись, когда лицо подозреваемого опознано.
А между тем технические фирмы совершенствуют свои системы, чтобы работать быстрее, с большим количеством лиц и со все более сложными изображениями – сделанными при плохом освещении или если люди прикрывают лица. Ведется работа над алгоритмами, которые смогут идентифицировать людей в масках и с использованием маскировки. Чтобы сделать системы распознавания еще более эффективными, биометрия лица будет сочетаться с другими биометрическими анализами, такими как голос и походка.
Неудивительно, что гонка вооружений началась: исследователи из Университета Карнеги-Меллона в Питтсбурге разработали свои собственные солнцезащитные очки, чтобы обмануть систему распознавания лиц: так один испытатель в очках был идентифицирован как Мила Йовович.
Перевод Марии Строгановой
Источник: The Guardian