Crawlen einer URL - Stuffing macht es nicht schneller

von Jochen Moschko

Kategorie(n): News Datum: 2. April 2019
Manchmal ist es notwendig, eine URL über die Search Console von Google (neu) crawlen zu lassen. Zwar besucht der Googlebot in gewissen Abständen von sich aus jede indexierte Seite und aktualisiert diese im Index. Wie oft, hängt von der Beschaffenheit der Website ab: Nachrichtenportale mit topaktuellen News werden deutlich häufiger vom Googlebot besucht, als eine Firmenwebsite, auf der einmal im Monat etwas geändert wird – wenn überhaupt. Wenn man auf der eigenen Website eine oder mehrere Unterseiten überarbeitet oder sogar neu hinzugefügt hat, kann man durchaus an einer schnellstmöglichen Aktualisierung bzw. Indexierung dieser Seiten interessiert sein. Oder wenn sich auf einer Seite eine Rechtsverletzung befand, die man schnellstmöglich tilgen möchte. In diesem Fall kann man in der Google Search Console den Crawl über das neue „URL Inspection Tool“ anstoßen (auf Deutsch heißt es „URL-Prüfung“): Nach dem Anstoß des Crawls erhält man die Meldung „Die URL wurde einer bevorzugten Crawling-Warteschlange hinzugefügt. Das mehrmalige Versenden einer Seite ändert weder ihre Reihung noch ihre Priorität.“. Es ist in der Tat ein verbreiteter Irrglaube, dass es das Crawling beschleunigen würde, wenn man eine URL mehrmals zur Neuindexierung anstößt. Natürlich ist der Wunsch, dass ein neuer Crawl möglichst zeitnah stattfindet, verständlich. In einem Hilfeartikel dazu schreibt man bei Google, dass das Crawling „einige Tage oder mehrere Wochen“ (!) dauern könne. Das mag vielleicht auf den Crawl kompletter und sehr großer Websites zutreffen, denn jede Website verfügt über ein gewisses, begrenztes Crawl-Kontingent. Hier zieht sich ein kompletter Crawl durchaus in die Länge. Wenn es sich aber nur um einzelne URLs handelt, werden diese aus unserer Erfahrung meistens innerhalb eines halben Tages neu gecrawlt und direkt im Index aktualisiert. Wie Google verfährt, wenn man eine URL dennoch mehrfach zum Crawlen anstößt, ist nicht bekannt. Möglicherweise wird bei der manuellen Einreichung einer URL geprüft, ob sich diese bereits in der Warteschlange befindet und, wenn dies der Fall ist, die erneute Einreichung einfach ignoriert. Oder die URL verschiebt sich an das Ende der Warteschlange und man hätte das Gegenteil dadurch erreicht.