Bloquear un sitio para que no sea rastreado por Common Crawl Crawler.
https://commoncrawl.org/
Archivo robots.txt · Bot de IA
Obtenga acceso a los datos sobre 5.133.646 sitios web que son Common Crawl Bot Disallow Clientes. Sabemos de 4.137.593 sitios web en vivo usando Common Crawl Bot Disallow y un adicional 996.053 sitios que utilizaron Common Crawl Bot Disallow históricamente y 2.795.422 sitios web en Estados Unidos.
Obtenga una lista de 5.133.646 sitios web que utilizan Common Crawl Bot Disallow que incluye información de ubicación, datos de alojamiento, detalles de contacto, 4.137.593 sitios web actualmente activos y un adicional 1.980.601 dominios que redireccionan a sitios de esta lista. 996.053 sitios que utilizaron esta tecnología anteriormentey 2.795.422 sitios web en Estados Unidos Actualmente usando Common Crawl Bot Disallow.
Países
Financial
Group
Region