Лента новостей Выбор региона Поиск
18+
Регионы {{ region.title }}
Закрыть
Лента новостей
Популярное

Google признался в подделке поисковых запросов под выборы-2020

0 Оставить комментарий

Google признался в подделке поисковых запросов под выборы-2020

В американском интернет-сообществе нарастает скандал, связанный с публикацией скрытой съемки главы департамента инноваций компании Google Джен Дженнаи. В заснятом интервью она подтверждает давно циркулирующие слухи: после неожиданной победы Дональда Трампа на президентских выборах в США в 2016 году Google тайно поменял алгоритмы машинного обучения своих поисковиков, чтобы «исключить такой сценарий в будущем».

По утверждению Дженнаи, Google готов обеспечить «нужный» результат по поисковым запросам к следующим президентским выборам 2020 года, так как в критерии «непредвзятости машинного обучения» (англ. machine learning fairness) внесены все необходимые правки.

Google признался в подделке поисковых запросов под выборы-2020

«Беспристрастный» Google

К сожалению, интервью главы департамента инноваций Google записано скрытой камерой в публичном месте, в силу чего часть ее утверждений можно понять только в общем контексте.

Впрочем, каким-либо иным способом откровения столь высокопоставленного сотрудника Google о специфике пестования искусственного интеллекта получить было бы вообще невозможно: «корпорация добра» крайне неохотно раскрывает принципы машинного обучения своих поисковых роботов. 

Тому есть сразу несколько причин. Прежде всего, сам по себе алгоритм обучения идет внутри сложной нейросети и не полностью управляется человеком. Кроме того, большая часть принципов машинного обучения представляет собой коммерческую тайну и ноу-хау Google. 

Наконец, нужно понимать, что публикация алгоритмов и принципов обучения позволит любому желающему найти в них логические «дыры» и использовать их для накрутки поисковой выдачи своего сайта или других нежелательных действий.

В силу этого Google публично оглашает только базовые принципы работы своих поисковых роботов, формирующих списки выдачи поисковых запросов пользователей. 

Одним из таких общих принципов, оглашенных Google, является подход «непредвзятости машинного обучения», который предполагает, что поисковый алгоритм избежит человеческих предубеждений (англ. human bias). 

Сама категория «предубеждений», безусловно, является предельно размытой, в силу чего проблеме дилеммы machine learning fairness/human bias в материалах Google посвящена целая страница ссылок, которые включают как наглядные объяснения, так и академические работы.

Если не вдаваться в детали, то в общем случае определить «непредвзятость» машинного алгоритма достаточно просто. Хороший поисковый алгоритм должен выдавать все информационно значимые результаты поиска — и при этом максимально убирать информационный «шум», который может быть внешне похож на цель запроса, но при этом не несет никакой смысловой нагрузки. 

Однако с категорией информационного «шума» работать крайне непросто — ведь до сих пор обучение поисковых алгоритмов ведется на основании примеров, которые в той или иной степени задаются людьми.

Например, в начале 2018 года Google даже был вынужден убрать из поискового лексикона Google Photos слово «горилла», поскольку механизм распознавания изображений подписывал им фото людей с очень темным цветом кожи. Этот факт был установлен еще в 2015 году, но за это время Google так и не смогла научить собственную систему отличать человекообразных приматов от представителей негроидной расы. 

Судя по всему, при начальном обучении алгоритма кто-то случайно или намеренно внес в систему путаницу, после чего чернокожие и гориллы стали для Google Photos «на одно лицо».

Google признался в подделке поисковых запросов под выборы-2020

«Мы все облажались»

Впрочем, в своих объяснениях глава департамента инноваций Дженнаи вовсе не затрагивала какие-то высокие материи, касающиеся технических тонкостей обучения ИИ или создания максимально непредвзятого обучения. Напротив, она практически прямо призналась в грубом вмешательстве руководства Google в этот процесс — причем с весьма неприглядными целями.

«Мы все облажались в 2016 году, люди облажались, СМИ облажались, но мы можем предотвратить это к 2020 году», — говорит она своему собеседнику.

О чем идет речь, понятно из контекста предыдущих ее фраз. В корпорации Google крайне негативно оценивают действия своих поисковых роботов во время президентской кампании 2016 года, когда они помещали в первые строки выдачи новости о Дональде Трампе и служили «интернет-усилителями» для его высказываний и выступлений. В то время как с Хиллари Клинтон ситуация была полностью противоположной — выдача Google была переполнена скандалом со взломом почты «Леди Вау» и штаба Демократической партии. 

Вскоре Дженнаи постаралась максимально дезавуировать свои слова. Она заявила, что ее собеседники, которые оказались активистами известного антисистемного проекта ProjectVeritas, «лгали о своей истинной личности, снимали меня без моего согласия, выборочно редактировали и склеивали видео, чтобы исказить мои слова и действия моего работодателя». 

Однако опровергнуть собственные высказывания ей так и не удалось — слишком уж явно Дженнаи проговорилась о сознательном вмешательстве Google в «подкрутку» алгоритмов поиска для обеспечения «правильной» выдачи в максимально политизированном вопросе президентских выборов США.

Еще одним неуклюжим оправданием функционера Google стал уже традиционный перевод всех стрелок на «плохих русских». Все, что Google делает со своими поисковыми алгоритмами и рейтингом, предназначено для предотвращения «иностранного вмешательства», заявила Дженнаи, а не для того, чтобы склонить чашу весов в пользу того или иного кандидата. 

Насколько это сочетается с развалившимся в суде делом о «российском вмешательстве» в выборы — вопрос открытый. Впрочем, такой ход лишь показывает очевидное: опровергнуть грубое вмешательство в свои алгоритмы обучения поисковых роботов и нарушение «святого» принципа «непредвзятости машинного обучения» Google попросту не в состоянии.

Google признался в подделке поисковых запросов под выборы-2020

Боты «Леди Вау»

Последним же «гвоздем в крышку гроба» доверия к Google стало массовое удаление роликов ProjectVeritas с интервью Дженнаи с популярного сервиса Youtube, также принадлежащего этой корпорации. Материал был снесен «из-за претензии третьей стороны о неприкосновенности частной жизни», несмотря на несколько тысяч лайков и около 50.000 просмотров, которые интервью Дженнаи успело набрать менее чем за сутки.

Стоит упомянуть, что предыдущие ролики ProjectVeritas подвергались цензуре на YouTube по столь же надуманным поводам. Например, только в этом месяце хостинг забанил расследование о предполагаемом удалении негативных оценок на сервисе Pinterest — все по тому же надуманному обвинению в нарушение конфиденциальности.

Судя по всему, Google крайне неприятна произошедшая утечка. Ведь впервые столь высокопоставленный сотрудник компании «прокололся» в крайне чувствительном для нее вопросе поисковой выдачи, до сих пор являвшейся образцом непредвзятости. 

Да и к тому же, Дженнаи подставила не только своих работодателей. В одной из завершающих фраз она заявила, что сенатор Элизабет Уоррен не должна настаивать на том, чтобы «корпорация добра» была разделена согласно антимонопольному законодательству, так как «меньшие компании не могли бы делать эту работу так же хорошо, как это сегодня делает Google». 

Судя по всему, именно так компания надеется доказать свою необходимость для демократов — ведь, по интересному стечению обстоятельств, именно сенатор Уоррен является одной из кандидатур «партии осла» на выборах-2020.

Вряд ли теперь у кого остаются сомнения, на чью чашу хочет уложить возможности своих поисковых роботов Google в попытке не допустить своего возможного расчленения — и с кем он ведет переговоры о «нужном результате».

Новости партнеров

Новости партнеров