Паранойя или реальность: что слышит Алиса и умеет ли Google читать почту?
Сегодня будем разбираться в том, из каких еще источников рекламные системы получают данные о поведении, привычках и пристрастиях пользователей. Поговорим о том, могут ли сервисы «прослушивать» вас, «читать» ваши переписки и почему вы сами соглашаетесь на это не глядя.
Алиса подслушивает, Яндекс читает почту, кто-то что-то кому-то обо мне передает — такие подозрения хоть раз, да возникали у каждого из нас. Это подтверждают и ваши истории из комментариев к предыдущим статьям.
Давайте сразу определимся с понятиями. В привычном понимании вас никто не слушает и писем ваших не читает.
Ни один сервис, который использует ваши данные «для показа релевантной рекламы», не в состоянии понять полный смысл, суть, нюансы писем, сообщений (в том числе и голосовых), комментариев или постов в соцсетях. Если вы получили письмо с электронным билетом на самолет, почтовый сервис предположит, что вы куда-то собрались и предложит вам внести дату путешествия в календарь. Это нормально.
Если неверный муж приобретает авиабилеты на Мальдивы и пишет об этом своей пассии, почтовый сервис возможно поймет, что речь идет о путешествии и, в лучшем случае, автору покажут рекламу нового чемодана или отеля на островах, но вряд ли рекламная сеть заподозрит автора в измене. Хотя, если письмо было отправлено из дома, то рекламу курортов могут показать и жене — ведь публичный IP у всех устройств, подключенных к одному Wi-Fi-роутеру, одинаковый. А этот параметр рекламные сети учитывают при показе объявлений. В этом случае в измене нашего героя заподозрит уже не рекламная сеть, а собственная жена.
Как рекламные системы «читают» письма
Они лишь индексируют тексты, то есть определяют в них значимые слова и словосочетания (без предлогов, местоимений, междометий и т.д.), и уже из них выбирают те, которые мэтчатся со списком интересов, имеющихся на конкретной платформе. Интересы характеризуют вас как человека, увлеченного конкретной тематикой – рыбалкой, театром, образованием дошкольников, йогой и т.д. Об интересах мы говорили в этой статье.
Индексация — это основа поиска в интернете. Точно так же поисковые роботы Яндекса проходят по всем сайтам, выбирают значимые фразы, записывают их в индекс. Условно это выглядит как «ключевая фраза» — «список адресов страниц, на которых она встречается». По тому же принципу индексируются ваши следы в онлайне. Выбрав в ваших письмах, сообщениях или комментах характерные слова, система приписывает вам определенный интерес. В упрощенном виде это выглядит как «интерес» — «список Hard ID пользователей, которые интересуются этой темой».
Про Hard ID мы рассказывали здесь.
Так, нашего героя-любовника система причислит к путешественникам, любителям пляжного отдыха, путешественникам на Мальдивы, но никак не к категории неверных супругов — такой, скорее всего, не существует ни на одной площадке.
Мой телефон меня прослушивает?
Нет. Давайте на чистоту — сам телефон особо ничего не умеет, все делают приложения и операционная система. «Прослушивать», а точнее, работать с информацией, которая поступает через микрофон, могут только те приложения, у которых есть к нему доступ. Проверьте это в настройках. Многие приложения, например, диктофон или мессенджеры, без доступа к микрофону работать не будут. Но есть и такие, которым этот доступ не обязателен, его можно отключить. Без микрофона вполне нормально работают VK и «Одноклассники», до тех пор, пока вы не решите записать, например, короткие видео с голосом — тогда приложение запросит разрешение на работу с микрофоном и запись аудио.
Очевидно, что голосовым помощникам необходим микрофон. Они работают в фоновом режиме, то есть доступ к микрофону у них есть постоянно — они «слушают» входящие звуки и голос, чтобы не пропустить момент, когда пользователь обратится именно к ним — «Алиса!» или «окей, Гугл!».
Вопрос в том, сохраняют ли они все, что слышат, или только диалоги с пользователем. Эта информация должна быть прописана в лицензионных соглашениях и политике конфиденциальности — тех документах, которые никто из нас не читает.
Ни Яндекс, ни Google прямо не говорят о том, что передают аудио или распознанные фрагменты третьим сторонам. Точнее, в 2019 Google все же вынужден был признать передачу третьим лицам записей разговоров пользователей со своим ассистентом — тогда тысячи аудио просто утекли в Сеть. Но полную прослушку пользователей компания отрицает. В своей «Политике конфиденциальности» Google подтверждает, что обезличенные данные он все же отдает рекламодателям.
Но что именно входит в эти данные, в документе не уточняется. В справке по аудиоданным, которые в том числе записывает, распознает и хранит голосовой помощник, Google ничего не сообщает о передаче таких данных третьим сторонам:
«Яндекс» также не дает однозначных ответов. В лицензионном соглашении к «Алисе» утверждается, что записи реплик пользователя в обезличенном виде передаются сотрудникам или партнерам Яндекса только для улучшения сервиса.
Однако, в «Политике Конфиденциальности» Яндекса прямо заявлено о возможности не только использовать информацию о пользователе для показа более релевантной рекламы, но и передавать ее третьим сторонам, в том числе для показа рекламы.
Apple формулирует свою позицию в отношении аудиоданных наиболее четко:
«Данные Siri и запросы к голосовому помощнику не используются для создания Вашего маркетингового профиля и никогда никому не продаются».
Но как бы там ни было, если что-то и передается третьим сторонам, то это, во-первых, обезличенная информация, а, во-вторых, уже обработанная.
Скорее всего, обработанные расшифровки аудиосообщений будут храниться на серверах той платформы, которая их собирает. Она же их проиндексирует, примерно так же, как и тексты — выделив ключевые слова, интересы. Дальше рекламодатель в рекламном кабинете выбирает по интересам, кому показывать рекламу, а рекламная система находит у себя идентификаторы этих пользователей и показывает им рекламу.
Никогда такого не было, и вдруг реклама
«На выходных навещал родителей, поговорили о покупке бензокосилки на дачу. Теперь мне их рекламируют! Мой телефон меня подслушал?».
Вряд ли. Скорее всего здесь сработала другая история. Смартфоны, а точнее, установленные на них приложения, отслеживают текущие GPS-координаты. И если по показаниям GPS ваш смартфон регулярно находится в непосредственной близости от смартфонов конкретных людей (если вы регулярно бываете у родителей), Яндекс или Google могут предположить, что вы как-то связаны, имеете общие интересы. Если родители озабочены покупкой косилки, вероятно, они уже пробовали искать этот аппарат в Яндексе. Рекламные алгоритмы причислили их к категории «интересующихся бензокосилками», а также, возможно, к категории дачников, садовников и т.д. Поскольку вас с родителями объединили в общую группу «часто общающихся», вы тоже видите эти объявления.
Если вы считаете, что слишком много данных о вас циркулирует между сервисами, поисковыми системами, соцсетями и другими приложениями, внимательно изучите политики конфиденциальности и лицензионные соглашения. Если возможно — запретите сервисам собирать или передавать кому-то еще ту информацию, которой вы не готовы делиться. Ограничьте доступ приложений к камере, микрофону, контактам, GPS — многие сервисы предлагают открывать доступ только во время работы приложения. Поэтому закрывайте приложения после использования, не оставляйте их висеть в фоновом режиме. Но надо понимать, что полной анонимности в интернете не существует. Пока вы пользуетесь какими-либо сервисами даже без регистрации в них, рекламные платформы и поисковые системы так или иначе найдут способ идентифицировать вас, сохранять информацию о вашем поведении и передавать ее заинтересованным партнерам.
Ну а пока вы перечитываете политики конфиденциальности и меняете настройки в смартфоне, мы готовим для вас следующий материал. Не переключайтесь!