Нейросети ошибаются в распознавании женщин и темнокожих (4 фото)
Как недавно выяснилось, на результат работы программы распознавания личности, оказывает влияние цвет кожи и половая принадлежность пользователей.
Эксперт Джой Буоламвини из MIT Media Lab при Массачусетском технологическом институте провёл эксперимент, в ходе которого проверил правильность распознавания выборки из 1200 фотографий известных личностей, занятых в политике, из стран, где во власть активно привлекают женщин. Выбранные личности были продемонстрированы трём наиболее популярным алгоритмам по распознаванию лиц: Microsoft, IBM и Megvii из Китая. Системы, основанные на искусственном интеллекте, ошиблись при определении 0,8% мужчин и 7% женщин европеоидной расы. Среди чернокожих мужчин неправильно распознано 12% личностей, а у женщин негроидной расы отклонение достигло непозволительных 34,7%.
Однако в алгоритмах распознавания лиц не закладывается расовое или гендерное неравенство. Проблема заключается в базе, на которой проходит обучение искусственного интеллекта. Так, например, самая большая база фотографий, предлагаемая для обучения программам идентификации личности, содержит 75% изображений мужчин и на 80% из этих снимков запечатлены светлокожие люди. Также, оценив цвет кожи всех людей с фотоснимков, задействованных в эксперименте, по шкале оттенков кожи Фицпатрика, исследователи заметили, что чем темнее оттенок кожного покрова, тем сложнее ИИ справиться с распознанием.
Таким образом, производителям следует расширить кругозор своих нейросетей и предоставить им для изучения фотоматериалы людей из различных регионов Земли с учётом их расовых, этнических и половых различий.
Джой Буоламвини, ведущий автор исследования, впервые столкнулась с проблемой предвзятости алгоритмов несколько лет назад. Для своего аспирантского проекта она использовала коммерческую программу для распознавания лиц. Команда Джой была этнически и расово пестрой, в ходе работы оказалось, что алгоритм надежно работает только с ее единственным белым участником. Буоламвини, сама темнокожая, попыталась проанализировать собственные фото, и оказалось, что система либо вовсе не распознает ее лицо, либо неверно определяет пол.
Исторически, искусственные нейронные сети за свою уже более чем полувековую историю испытывали как периоды стремительных взлетов и повышенного внимания общества, так и сменявшие их периоды скепсиса и равнодушия. В хорошие времена ученым и инженерам кажется, что наконец-то найдена универсальная технология, способная заменить человека в любых когнитивных задачах. Как грибы после дождя, появляются различные новые модели нейронных сетей, между их авторами, профессиональными учеными-математиками, идут напряженные споры о большей или меньшей степени биологичности предложенных ими моделей. Профессиональные ученые-биологи наблюдают эти дискуссии со стороны, периодически срываясь и восклицая «Да такого же в реальной природе не бывает!» – и без особого эффекта, поскольку нейросетевики-математики слушают биологов, как правило, только тогда, когда факты биологов согласуются с их собственными теориями. Однако, с течением времени, постепенно накапливается пул задач, на которых нейронные сети работают откровенно плохо и энтузиазм людей остывает.
В наши дни нейронные сети снова в зените славы благодаря изобретению метода предобучения «без учителя» на основе Ограниченных Больцмановских Машин (Restricted Bolzmann Machines, RBM), что позволяет обучать глубокие нейронные сети (т.е. с экстра-большим, порядка десятков тысяч, количеством нейронов) и успехам глубоких нейронных сетей в практических задачах распознавания устной речи и изображений. К примеру, распознавание речи в Android реализовано именно на глубоких нейронных сетях. Как долго это продлится и насколько сильно глубокие нейронные сети оправдают возложенные на них ожидания – неизвестно.