Паранойя или реальность: что слышит Алиса и умеет ли Google читать почту?

Сегодня будем разбираться в том, из каких еще источников рекламные системы получают данные о поведении, привычках и пристрастиях пользователей. Поговорим о том, могут ли сервисы «прослушивать» вас, «читать» ваши переписки и почему вы сами соглашаетесь на это не глядя.

Алиса подслушивает, Яндекс читает почту, кто-то что-то кому-то обо мне передает — такие подозрения хоть раз, да возникали у каждого из нас. Это подтверждают и ваши истории из комментариев к предыдущим статьям.

Давайте сразу определимся с понятиями. В привычном понимании вас никто не слушает и писем ваших не читает. 

Ни один сервис, который использует ваши данные «для показа релевантной рекламы», не в состоянии понять полный смысл, суть, нюансы писем, сообщений (в том числе и голосовых), комментариев или постов в соцсетях. Если вы получили письмо с электронным билетом на самолет, почтовый сервис предположит, что вы куда-то собрались и предложит вам внести дату путешествия в календарь. Это нормально. 

Если неверный муж приобретает авиабилеты на Мальдивы и пишет об этом своей пассии, почтовый сервис возможно поймет, что речь идет о путешествии и, в лучшем случае, автору покажут рекламу нового чемодана или отеля на островах, но вряд ли рекламная сеть заподозрит автора в измене. Хотя, если письмо было отправлено из дома, то рекламу курортов могут показать и жене — ведь публичный IP у всех устройств, подключенных к одному Wi-Fi-роутеру, одинаковый. А этот параметр рекламные сети учитывают при показе объявлений. В этом случае в измене нашего героя заподозрит уже не рекламная сеть, а собственная жена.

Как рекламные системы «читают» письма

Они лишь индексируют тексты, то есть определяют в них значимые слова и словосочетания (без предлогов, местоимений, междометий и т.д.), и уже из них выбирают те, которые мэтчатся со списком интересов, имеющихся на конкретной платформе. Интересы характеризуют вас как человека, увлеченного конкретной тематикой – рыбалкой, театром, образованием дошкольников, йогой и т.д. Об интересах мы говорили в этой статье

Индексация — это основа поиска в интернете. Точно так же поисковые роботы Яндекса проходят по всем сайтам, выбирают значимые фразы, записывают их в индекс. Условно это выглядит как «ключевая фраза» — «список адресов страниц, на которых она встречается». По тому же принципу индексируются ваши следы в онлайне. Выбрав в ваших письмах, сообщениях или комментах характерные слова, система приписывает вам определенный интерес. В упрощенном виде это выглядит как «интерес» — «список Hard ID пользователей, которые интересуются этой темой».

Про Hard ID мы рассказывали здесь.

Так, нашего героя-любовника система причислит к путешественникам, любителям пляжного отдыха, путешественникам на Мальдивы, но никак не к категории неверных супругов — такой, скорее всего, не существует ни на одной площадке.

Мой телефон меня прослушивает?

Нет. Давайте на чистоту — сам телефон особо ничего не умеет, все делают приложения и операционная система. «Прослушивать», а точнее, работать с информацией, которая поступает через микрофон, могут только те приложения, у которых есть к нему доступ. Проверьте это в настройках. Многие приложения, например, диктофон или мессенджеры, без доступа к микрофону работать не будут. Но есть и такие, которым этот доступ не обязателен, его можно отключить. Без микрофона вполне нормально работают VK и «Одноклассники», до тех пор, пока вы не решите записать, например, короткие видео с голосом — тогда приложение запросит разрешение на работу с микрофоном и запись аудио.

Очевидно, что голосовым помощникам необходим микрофон. Они работают в фоновом режиме, то есть доступ к микрофону у них есть постоянно — они «слушают» входящие звуки и голос, чтобы не пропустить момент, когда пользователь обратится именно к ним — «Алиса!» или «окей, Гугл!».

Вопрос в том, сохраняют ли они все, что слышат, или только диалоги с пользователем. Эта информация должна быть прописана в лицензионных соглашениях и политике конфиденциальности — тех документах, которые никто из нас не читает. 

Ни Яндекс, ни Google прямо не говорят о том, что передают аудио или распознанные фрагменты третьим сторонам. Точнее, в 2019 Google все же вынужден был признать передачу третьим лицам записей разговоров пользователей со своим ассистентом — тогда тысячи аудио просто утекли в Сеть. Но полную прослушку пользователей компания отрицает. В своей «Политике конфиденциальности» Google подтверждает, что обезличенные данные он все же отдает рекламодателям.

Но что именно входит в эти данные, в документе не уточняется. В справке по аудиоданным, которые в том числе записывает, распознает и хранит голосовой помощник, Google ничего не сообщает о передаче таких данных третьим сторонам:

«Яндекс» также не дает однозначных ответов. В лицензионном соглашении к «Алисе» утверждается, что записи реплик пользователя в обезличенном виде передаются сотрудникам или партнерам Яндекса только для улучшения сервиса.

Однако, в «Политике Конфиденциальности» Яндекса прямо заявлено о возможности не только использовать информацию о пользователе для показа более релевантной рекламы, но и передавать ее третьим сторонам, в том числе для показа рекламы. 

Apple формулирует свою позицию в отношении аудиоданных наиболее четко:

«Данные Siri и запросы к голосовому помощнику не используются для создания Вашего маркетингового профиля и никогда никому не продаются».

Но как бы там ни было, если что-то и передается третьим сторонам, то это, во-первых, обезличенная информация, а, во-вторых, уже обработанная. 

Скорее всего, обработанные расшифровки аудиосообщений будут храниться на серверах той платформы, которая их собирает. Она же их проиндексирует, примерно так же, как и тексты — выделив ключевые слова, интересы. Дальше рекламодатель в рекламном кабинете выбирает по интересам, кому показывать рекламу, а рекламная система находит у себя идентификаторы этих пользователей и показывает им рекламу.

Никогда такого не было, и вдруг реклама 

«На выходных навещал родителей, поговорили о покупке бензокосилки на дачу. Теперь мне их рекламируют! Мой телефон меня подслушал?».

Вряд ли. Скорее всего здесь сработала другая история. Смартфоны, а точнее, установленные на них приложения, отслеживают текущие GPS-координаты. И если по показаниям GPS ваш смартфон регулярно находится в непосредственной близости от смартфонов конкретных людей (если вы регулярно бываете у родителей), Яндекс или Google могут предположить, что вы как-то связаны, имеете общие интересы. Если родители озабочены покупкой косилки, вероятно, они уже пробовали искать этот аппарат в Яндексе. Рекламные алгоритмы причислили их к категории «интересующихся бензокосилками», а также, возможно, к категории дачников, садовников и т.д. Поскольку вас с родителями объединили в общую группу «часто общающихся», вы тоже видите эти объявления.

Если вы считаете, что слишком много данных о вас циркулирует между сервисами, поисковыми системами, соцсетями и другими приложениями, внимательно изучите политики конфиденциальности и лицензионные соглашения. Если возможно — запретите сервисам собирать или передавать кому-то еще ту информацию, которой вы не готовы делиться. Ограничьте доступ приложений к камере, микрофону, контактам, GPS — многие сервисы предлагают открывать доступ только во время работы приложения. Поэтому закрывайте приложения после использования, не оставляйте их висеть в фоновом режиме. Но надо понимать, что полной анонимности в интернете не существует. Пока вы пользуетесь какими-либо сервисами даже без регистрации в них, рекламные платформы и поисковые системы так или иначе найдут способ идентифицировать вас, сохранять информацию о вашем поведении и передавать ее заинтересованным партнерам.

Ну а пока вы перечитываете политики конфиденциальности и меняете настройки в смартфоне, мы готовим для вас следующий материал. Не переключайтесь!