Заблокируйте сканирование сайта поисковым роботом Common Crawl.
https://commoncrawl.org/
Роботы.txt · ИИ-бот
Получите доступ к данным о 5 133 646 веб-сайты которые есть Common Crawl Bot Disallow Клиенты. Мы знаем о 4 137 593 живые сайты с использованием Common Crawl Bot Disallow и дополнительный 996 053 сайты, которые использовали Common Crawl Bot Disallow исторически и 2 795 422 веб-сайты в Соединенные Штаты.
Получить список 5 133 646 веб-сайты, использующие Common Crawl Bot Disallow которая включает в себя информацию о местоположении, данные о хостинге, контактные данные, 4 137 593 в настоящее время работают веб-сайты и дополнительный 1 980 601 домены, которые перенаправляют на сайты из этого списка. 996 053 сайты, которые использовали эту технологию ранееи 2 795 422 веб-сайты в Соединенные Штаты в настоящее время использую Common Crawl Bot Disallow.
Страны
Financial
Group
Region