Яндекс выдает ссылки на внутренние гугл-документы банков и чиновников

 «Яндекс» выдает ссылки на внутренние гугл-документы банков и чиновников

Недавно, 4 июля пользователи интернета обнаружили, что поисковая система «Яндекс», индексируя документы, хранящиеся в сервисе Google Docs, выдает по запросу файлы, содержавшие пароли, номера кредитных карт и корпоративные документы. Пресс-служба компании заявила, что действовала строго по правилам, но уже спустя несколько часов «Яндекс» переставал выдавать какие-либо результаты из Google Docs. Попробуем разобраться с тем, что случилось.

 

Что, собственно, произошло?

С 2009 года Google выводит в поиске те документы из Google Dоcs, на  которые существует публичная ссылка. Проблема «Яндекса» заключается не в том, что такие документы стали индексироваться: это делают и другие поисковые системы, ― а в том, что их очень легко найти. По запросу «пароли» «Яндекс» на первых страницах выдает таблицы с паролями, а другие поисковики заменяют их неинтересными документами-ловушками. В Google иногда вообще невозможно найти эти документы, даже используя полные названия.

«Яндекс» ничего не объясняет

Формально в утечке информации виноваты пользователи, неправильно установившие настройки приватности. Все же неясно, каким образом такие документы попали в выдачу «Яндекса». Пресс-служба компании ограничилась единственным комментарием: «„Яндекс“ индексирует только открытую часть интернета — те страницы, которые доступны при переходе по ссылкам без ввода логина и пароля. Страницы, индексация которых запрещена администратором сайта в файле robots.txt, „Яндекс“ не индексирует, даже если они находятся в открытой части интернета. В среду вечером в службу поддержки обратились пользователи с жалобами на проблему доступности файлов на docs.google.com. Наша служба безопасности связывается сейчас с коллегами из Google, чтобы обратить их внимание на то, что в этих файлах может оказаться приватная информация».

Robots.txt — служебный файл, содержащий инструкции для поисковых роботов: список файлов и путей на сервере, доступных для сканирования. Разумеется, такой файл есть и у Google Docs. Согласно этому файлу, поисковые механизмы «Яндекса» действительно имели право индексировать документы с открытым доступом. Однако подобрать адреса документов непросто: это случайные наборы символов. Вопрос в том, каким образом эти ссылки появились в «Яндексе».

 

 

Одно из возможных объяснений такой ситуации ― «Яндекс» индексирует ссылки, открытые пользователями в «Яндекс.Браузере» или отправленные через «Яндекс.Почту». Основание для такого предположения дает история, произошедшая в 2015 году. Тогда выяснилось, что «Яндекс.Браузер» передает на сервера компании информацию о страницах, посещенных пользователем. Эти ссылки попадали в базу робота, индексирующего интернет для поисковика и, таким образом, могли появиться в поисковой выдаче. Такая участь могла постигнуть именно приватные страницы, доступные лишь по прямой ссылке, однако тогда этого не произошла. По поводу этого случая пресс-служба «Яндекса» заявила, что данные попали к роботу случайно и этого больше не повторится.

 

Что стало известно из-за утечек?

Возможно, «Тинькофф-банк» не принимает на работу мужчин «кавказской национальности» и геев

В фейсбуке был выставлен документ, напоминающий инструкцию для отдела кадров «Тинькофф-банка». Согласно нему, на работу в банк не берут мужчин «кавказской национальности», людей «с неславянскими ФИО», лиц «с нетрадиционной сексуальной ориентацией», а также «представителей негроидной расы».

 

Вскоре этот документ был удален, а пресс-служба банка объяснила его появление личной инициативой одного из сотрудников, который «изготовил этот текст с неясными для нас намерениями и выложил его в интернет». Существование подобных документов и ограничений по найму персонала в банке отрицают. 

Предположительно обнаружена подготовка к повышению явки на выборах мэра Москвы

В фейсбуке межрегионального общественного движения наблюдателей «Сонар» появилась информация о том, что Светлана Истомина, начальница управления соцзащиты Северного административного округа Москвы, создала документ «Ресурсная карта УИК», содержащий информацию об избирателях, зависимх от соцзащиты: обладающих инвалидностью, голосующих на дому и т. д. Возможно, это попытка мобилизовать электорат для участия в выборах мэра города, которые пройдут в начале сентября.

 

 «Леруа Мерлен» запоминает обидчиков

Александр Плющев, сотрудник «Эха Москвы», нашел гугл-таблицу, в которой ведется учет негативных отзывов о компании «Леруа Мерлен», связанных с выступлениями ее пиар-директора Галины Паниной, что может быть частью кампании против нее. Представители «Леруа Мерлен» признали подлинность таблицы и объяснили ее существование тем, что собирали негативные комментарии с целью провести аналитику.

«Фабрика троллей» выпускает учебные пособия

 

Кроме случая с «Леруа Мерлен», Александр Плющев опубликовал ссылку на гугл-таблицу, содержащую три вкладки: «Путин», «Горбачев» и «Сталин». Таблица содержит список событий, произошедший в России во время правления этих лидеров, с пометами «позитив» и «негатив», а также аргументами и контраргументами по  заданным темам. Возможно, это модели для интернет-дискуссий, которые ведут пользователи, поддерживающие российскую власть за деньги. Насколько это достоверно, установить невозможно.

 

Святослав Гетто
7/6/2018
114