Заблокируйте сканирование сайта поисковым роботом Common Crawl.
https://commoncrawl.org/
Роботы.txt · ИИ-бот
Получите доступ к данным о 4 766 999 веб-сайты которые есть Common Crawl Bot Disallow Клиенты. Мы знаем о 3 681 953 живые сайты с использованием Common Crawl Bot Disallow и дополнительный 1 085 046 сайты, которые использовали Common Crawl Bot Disallow исторически и 2 540 879 веб-сайты в Соединенные Штаты.
Получить список 4 766 999 веб-сайты, использующие Common Crawl Bot Disallow которая включает в себя информацию о местоположении, данные о хостинге, контактные данные, 3 681 953 в настоящее время работают веб-сайты и дополнительный 1 797 361 домены, которые перенаправляют на сайты из этого списка. 1 085 046 сайты, которые использовали эту технологию ранееи 2 540 879 веб-сайты в Соединенные Штаты в настоящее время использую Common Crawl Bot Disallow.
Страны
Financial
Group
Region