Как издателям защититься от "умных" ИИ-браузеров, если они выглядят как обычные пользователи?
Появление новых «умных» браузеров на базе искусственного интеллекта ставит под сомнение привычные способы защиты онлайн-контента. Выпущенный недавно браузер Atlas от OpenAI, а также Comet от Perplexity и Copilot-режим Microsoft Edge становятся инструментами, способными не просто отображать веб-страницы, а выполнять многошаговые задачи — например, собирать сведения из календаря и формировать краткие брифинги по клиентам на основе новостей. Их возможности уже создают серьёзные трудности для издателей, пытающихся ограничить использование своих материалов искусственным интеллектом.
Проблема в том, что такие браузеры внешне ничем не отличаются от обычных пользователей. Когда Atlas или Comet обращаются к сайту, они идентифицируются как стандартные сессии Chrome, а не как автоматические сканеры. Это делает невозможным их блокировку с помощью Robots Exclusion Protocol, поскольку попытка запретить подобные запросы может одновременно перекрыть доступ обычным людям. Отчёт компании TollBit «State of the Bots» отмечает, что новое поколение ИИ-посетителей «всё больше похоже на людей», и именно это осложняет мониторинг и фильтрацию таких агентов.
Дополнительное преимущество для ИИ-браузеров создаёт то, как устроены современные платные подписки. Многие сайты, включая MIT Technology Review, National Geographic и Philadelphia Inquirer, используют клиентскую схему: статья загружается полностью, но скрывается под всплывающим окном с предложением оформить подписку. Для человека текст остаётся невидимым, а для искусственного интеллекта он доступен. Только серверные платные стены, как у Bloomberg или Wall Street Journal, надёжно скрывают контент до авторизации пользователя. Однако если человек вошёл в свой аккаунт, ИИ-агент может свободно читать материал от его имени.
OpenAI Atlas получил полный текст эксклюзивной статьи для подписчиков из MIT Technology Review (CJR)
Во время тестов Atlas и Comet без труда извлекали полный текст закрытых публикаций MIT Technology Review, несмотря на запреты для корпоративных краулеров OpenAI и Perplexity. В одном из случаев Atlas также смог пересобрать заблокированную статью PCMag, комбинируя сведения из других источников: твитов, агрегаторов и цитат на сторонних сайтах. Этот приём, получивший название «цифровые хлебные крошки», ранее описал специалист по онлайн-исследованиям Хенк ван Эсс.
Агент Atlas смог восстановить закрытую статью, собрав информацию из разных источников (CJR)
По заявлениям OpenAI, контент, который пользователи просматривают через Atlas, не используется для обучения моделей, если не включена функция «browser memories». Тем не менее « ChatGPT будет помнить ключевые детали из просматриваемых страниц», что, по замечанию обозревателя Washington Post Джеффри Фаулера, делает политику конфиденциальности OpenAI запутанной и непоследовательной. Пока остаётся неясным, насколько компания использует данные, полученные через доступ к платным материалам.
Отдельно наблюдается выборочная осторожность: Atlas избегает прямого обращения к сайтам, которые подали иски против OpenAI , например к New York Times, но при этом старается обойти запрет, формируя сводку по теме из материалов других изданий — The Guardian, Reuters, Associated Press и Washington Post, имеющих лицензионные соглашения с OpenAI. Comet, напротив, не проявляет такой сдержанности.
Подобная стратегия превращает искусственного агента в посредника, который сам решает, какие источники считать «допустимыми». Даже если издателю удаётся закрыть прямой доступ, агент просто заменяет оригинал альтернативной версией событий. Это меняет само восприятие информации — пользователь получает не статью, а интерпретацию, составленную машиной.
ИИ-браузеры пока не получили массового распространения, но уже ясно, что привычные барьеры вроде платных стен и блокировок краулеров перестают работать. Если именно такие агенты станут основным способом чтения новостей, издательским домам придётся искать новые механизмы прозрачности и контроля над тем, как их контент используется искусственным интеллектом.
Появление новых «умных» браузеров на базе искусственного интеллекта ставит под сомнение привычные способы защиты онлайн-контента. Выпущенный недавно браузер Atlas от OpenAI, а также Comet от Perplexity и Copilot-режим Microsoft Edge становятся инструментами, способными не просто отображать веб-страницы, а выполнять многошаговые задачи — например, собирать сведения из календаря и формировать краткие брифинги по клиентам на основе новостей. Их возможности уже создают серьёзные трудности для издателей, пытающихся ограничить использование своих материалов искусственным интеллектом.
Проблема в том, что такие браузеры внешне ничем не отличаются от обычных пользователей. Когда Atlas или Comet обращаются к сайту, они идентифицируются как стандартные сессии Chrome, а не как автоматические сканеры. Это делает невозможным их блокировку с помощью Robots Exclusion Protocol, поскольку попытка запретить подобные запросы может одновременно перекрыть доступ обычным людям. Отчёт компании TollBit «State of the Bots» отмечает, что новое поколение ИИ-посетителей «всё больше похоже на людей», и именно это осложняет мониторинг и фильтрацию таких агентов.
Дополнительное преимущество для ИИ-браузеров создаёт то, как устроены современные платные подписки. Многие сайты, включая MIT Technology Review, National Geographic и Philadelphia Inquirer, используют клиентскую схему: статья загружается полностью, но скрывается под всплывающим окном с предложением оформить подписку. Для человека текст остаётся невидимым, а для искусственного интеллекта он доступен. Только серверные платные стены, как у Bloomberg или Wall Street Journal, надёжно скрывают контент до авторизации пользователя. Однако если человек вошёл в свой аккаунт, ИИ-агент может свободно читать материал от его имени.
OpenAI Atlas получил полный текст эксклюзивной статьи для подписчиков из MIT Technology Review (CJR)
Во время тестов Atlas и Comet без труда извлекали полный текст закрытых публикаций MIT Technology Review, несмотря на запреты для корпоративных краулеров OpenAI и Perplexity. В одном из случаев Atlas также смог пересобрать заблокированную статью PCMag, комбинируя сведения из других источников: твитов, агрегаторов и цитат на сторонних сайтах. Этот приём, получивший название «цифровые хлебные крошки», ранее описал специалист по онлайн-исследованиям Хенк ван Эсс.
Агент Atlas смог восстановить закрытую статью, собрав информацию из разных источников (CJR)
По заявлениям OpenAI, контент, который пользователи просматривают через Atlas, не используется для обучения моделей, если не включена функция «browser memories». Тем не менее « ChatGPT будет помнить ключевые детали из просматриваемых страниц», что, по замечанию обозревателя Washington Post Джеффри Фаулера, делает политику конфиденциальности OpenAI запутанной и непоследовательной. Пока остаётся неясным, насколько компания использует данные, полученные через доступ к платным материалам.
Отдельно наблюдается выборочная осторожность: Atlas избегает прямого обращения к сайтам, которые подали иски против OpenAI , например к New York Times, но при этом старается обойти запрет, формируя сводку по теме из материалов других изданий — The Guardian, Reuters, Associated Press и Washington Post, имеющих лицензионные соглашения с OpenAI. Comet, напротив, не проявляет такой сдержанности.
Подобная стратегия превращает искусственного агента в посредника, который сам решает, какие источники считать «допустимыми». Даже если издателю удаётся закрыть прямой доступ, агент просто заменяет оригинал альтернативной версией событий. Это меняет само восприятие информации — пользователь получает не статью, а интерпретацию, составленную машиной.
ИИ-браузеры пока не получили массового распространения, но уже ясно, что привычные барьеры вроде платных стен и блокировок краулеров перестают работать. Если именно такие агенты станут основным способом чтения новостей, издательским домам придётся искать новые механизмы прозрачности и контроля над тем, как их контент используется искусственным интеллектом.
- Источник новости
- www.securitylab.ru