Расизм на грани абсурда: почему Google Photo не распознает горилл

В результате абсурдного скандала, связанного с чернокожими, сервис Google Photo больше не поддерживает запросы «горилла», «шимпанзе» и «макака». Что это — тонкий троллинг или несовершенство машинных алгоритмов обучения?
Расизм на грани абсурда: почему Google Photo не распознает горилл

С чего все началось

В 2015 году чернокожий разработчик программного обеспечения смутил Google, заявив, что сервис фотографий Google Photo пометил его снимок с чернокожим другом как «фотография горилл». Google немедленно принес свои извинения, а программист, который к тому времени уже стал публичным «лицом» движения за чистку подобных недоразумений заявил, что метка «горилла» больше не будет применяться к групповым фотоснимкам, и что Google работает над «прочими долгосрочными фиксами».

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Спустя два года результатом этих правок стало то, что гориллы и некоторые другие приматы... исчезли из внутреннего лексикона службы. Это весьма неловкое и топорное решение — хорошая иллюстрация того, с какими трудностями приходится сталкиваться огромным корпорациям, когда дело заходит об обработке миллионов снимков каждый день. В настоящее время многие крупные фирмы продвигают технологии распознавания изображений, которые надеются использовать для ПО автопилотов, персональных помощников и других аналогичных систем.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как алгоритмы машинного обучения работают с запросами

Портал WIRED проверил Google Фото, использовав подборку из 40 000 фотографий, среди которых было множество самых разнообразных животных. Результаты оказались впечатляющими, программа и в самом деле распознает всех, даже редких существ. Но вот по запросам «горилла», «шимпанзе» и «макака» система ответила коротко — «ничего не найдено». Напомним, что сервис Google Photos, существующий в формате мобильного приложения и веб-сайта, предоставляет 500 миллионам пользователей место для хранения и сортировки персональных снимков. Он использует технологию машинного обучения для автоматической группировки фотографий с похожим контентом. Такая же технология позволяет пользователям составлять и обмениваться своими личными коллекциями.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
«Результат не найден»
«Результат не найден»
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Неприязнь Google к приматам оказалась очень избирательной. К примеру, «бабуины», «гиббоны», «мармазетки» и «орангутаны» находятся без проблем. Капуцины тоже попадают в фокус, но лишь до тех пор, пока пользователь не использует «запретное слово» на букву М.

WIRED решил провести еще несколько тестов и загрузил 20 фотографий шимпанзе и горилл, полученных из некоммерческих организаций Chimp Haven и Института Диан Фосси. Некоторые из обезьян были найдены с использованием поисковых терминов «лес», «джунгли» или «зоопарк», но остальная часть оказалась труднодоступной. Для третьего испытания программы портал составил подборку из 10 000 фотографий, используемых для распознавания лиц. Результаты оказались весьма забавными: на запрос «афроамериканец» система выдала лишь фото пасущейся антилопы. Запросы «черная женщина», «черный мужчина» и «черный человек» привели к тому, что Google выдал черно-белые снимки людей, корректно отсортированных по полу, но совершенно не разделенных по расе. Единственными подходящими запросами, по которым и в самом деле можно было найти людей с темной кожей, стали «афро» и «африканцы», хотя и здесь результаты были неоднозначными.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Представитель Google подтвердил, что после инцидента 2015 года «горилла» была подвергнута цензуре в системах поиска и тегирования изображений, а на сегодня такой же блокировке подверглись «шимпанзе», «макака» и «обезьяна». «Технология пометки изображений еще совсем молодая, и, к сожалению, она не идеальна», написал пресс-секретарь компании. Подобная осторожность лишний раз подчеркивает то, как несовершенны существующие системы машинного обучения. С достаточным количеством данных и вычислительной мощности они могут быть обучены распознавать фото или имитировать речь с высокой точностью — но это, похоже, предел на сегодняшний день. Даже самые совершенные алгоритмы не могут использовать здравый смысл или оперировать абстрактными понятиями, чтобы улучшить свое восприятие информации и сделать его более похожим на человеческое.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Настоящее и будущее самообучающихся систем

Висенте Ордоньес Роман (Vicente Ordóñez Román), профессор Университета Вирджинии, в прошлом году внес свой вклад в разработку алгоритмов машинного обучения. Оказалось, что они могут не только перенять, но даже усилить предвзятые взгляды на гендерные роли, если обучать их на примерах живых людей. «Очень сложно смоделировать и предугадать все, с чем системе придется столкнуться на практике», поясняет он. Вместе с коллегой Байшахи Рэем (Baishakhi Ray), экспертом в области безопасности программного обеспечения, Роман исследует способы сдерживания возможного поведения систем распознавания изображения, используемых в таких технологиях, как например автомобили с автопилотом. Рэй говорит, что определенный прогресс был достигнут, но пока неясно, насколько можно управлять ограничениями таких систем. «Мы до сих пор в деталях не можем понять логику этих моделей машинного обучения», говорит она.

Евгений Костенко
Евгений Костенко 21 Апреля 2021, 03:36
Проверил, на запрос "горилла" и "обезьяна" система нормально показывает фото с неграми. Я всё правильно делаю? Или всё исправили? Тогда ГУГЛ - молодцы!
Дмитрий Ермаков
Дмитрий Ермаков 18 Апреля 2021, 10:50
У меня в школе был одноклассник разительно похожий на шимпанзе. Хороший парень и нормально общались. Много людей похожи на своих домашних питомцев - даже есть версия (научная якобы) что люди выбирают животное по определённой схожести характера и внешности. Если я ( и многие) похожи на своего кота (или кот на них) - это надо запретить ? А посмотрите фильм (американский, кстати) "Поездка в Америку". Мало того что он расистский - посчитайте количество чёрных актёров в соотношении к белым, особенно вторая часть, так возьмите актёра Джона Эймоса и поставьте рядом с фотографией гориллы. И что - он стал хуже играть и переживает о своей внешности? И мы его ненавидим за это ?
Сергей Матвеев
Сергей Матвеев 10 Апреля 2021, 14:30
Это показывает, что программисты гугола по умственному уровню тупее обезьян.
Морис Снейк
Морис Снейк 13 Марта 2021, 13:38
Что я делаю не так? Огромное количество фото с гориллами, мартышками, обезьянами только что выдал мне Google. Пробовал на русском и английском - всё норм.
svet113
svet113 22 Февраля 2018, 20:49
Отвечаете боту, рассылающему спам?..
Kirill Kulikov
Kirill Kulikov 22 Февраля 2018, 12:02
Привет! Не интересует! Ступай лесом, займись делом, бестолковой балбес
den2036
den2036 28 Октября 2018, 14:09
Написано же: Гугл фото, а не гугл картинки. Загрузи в аккаунт и попробуй поищи среди них ;)
Zeev Belkin
Zeev Belkin 22 Февраля 2018, 08:46
Замечательно, только зашёл в Гугль, проверил, и никакого расизма: гориллы отлично распознаются, даже есть фотография где молодая горилла вместе с негром. А вот фотографий где только негры, Гугль по ключевому слову "горилла" не выдаёт совсем: техническую проблемму решили.