ИИ-стартап Perplexity уличили в том, что он собирает и сканирует контент с веб-сайтов, которые выступили против использования своего контента в таких целях. Соответствующее исследование опубликовал Cloudflare, сообщает TechCrunch.
В отчете говорится, что стартап игнорирует блокировки и маскирует свою деятельность по сканированию и сбору данных. В частности, он без разрешения извлекает тексты, изображения и видео из интернета, чтобы обеспечить работу своих продуктов.
В последнее время веб-сайты пытаются противостоять этому, используя стандартный файл Robots.txt, который сообщает поисковым системам и компаниям, разрабатывающим ИИ, какие страницы можно индексировать, а какие нет. Однако эта мера пока не дала видимых результатов — Perplexity, в частности, намеренно обходит эти блокировки.
Представитель Perplexity назвал отчет Cloudflare «коммерческим», уверяя, что доступ к защищенному контенту не осуществлялся. Cloudflare в свою очередь, настаивает, что Perplexity обходит эти блокировки.
Это не первый раз, когда Perplexity обвиняют в несанкционированном сборе данных. В прошлом году новостные агентства, включая Wired, заявили, что Perplexity занимается плагиатом их контента.
Ранее сообщалось, что представители американских медиакомпаний на саммите IAB Tech Lab призвали создать обязательные технические стандарты для доступа ИИ к редакционным материалам. Представители компаний, чьи ИИ-технологии оказались в центре дискуссии, на встрече не присутствовали. По мнению участников саммита, это «красноречиво говорит» о разделении отрасли на два лагеря.
