Заблокируйте сканирование сайта поисковым роботом Common Crawl.
https://commoncrawl.org/
Роботы.txt · ИИ-бот
Получите доступ к данным о 4 796 720 веб-сайты которые есть Common Crawl Bot Disallow Клиенты. Мы знаем о 3 722 656 живые сайты с использованием Common Crawl Bot Disallow и дополнительный 1 074 064 сайты, которые использовали Common Crawl Bot Disallow исторически и 2 568 345 веб-сайты в Соединенные Штаты.
Получить список 4 796 720 веб-сайты, использующие Common Crawl Bot Disallow которая включает в себя информацию о местоположении, данные о хостинге, контактные данные, 3 722 656 в настоящее время работают веб-сайты и дополнительный 1 819 486 домены, которые перенаправляют на сайты из этого списка. 1 074 064 сайты, которые использовали эту технологию ранееи 2 568 345 веб-сайты в Соединенные Штаты в настоящее время использую Common Crawl Bot Disallow.
Страны
Financial
Group
Region