Ein Noindex-Tag ist eine Anweisung im HTML-Quellcode einer Webseite, die Suchmaschinen mitteilt, dass die betreffende Seite nicht in den Suchergebnissen erscheinen soll. Der Tag gehört zu den sogenannten Meta Robots Tags und wird im -Bereich einer Seite eingebunden.
Der Zweck des Noindex-Tags besteht darin, gezielt einzelne Seiten oder Seitentypen von der Indexierung auszuschließen, ohne die Seite selbst zu blockieren oder für Nutzer unzugänglich zu machen.
Wie funktioniert der Noindex-Tag?
Suchmaschinen wie Google oder Bing erkennen den Noindex-Tag beim Crawlen einer Seite. Sobald sie die Anweisung auslesen, wird die Seite nicht in den Index aufgenommen oder nachträglich daraus entfernt, wenn sie bereits gelistet ist.
Der Tag im HTML sieht so aus:
<meta name="robots" content="noindex">
Code-Sprache: HTML, XML (xml)
Der Tag lässt sich mit weiteren Anweisungen kombinieren, zum Beispiel:
<meta name="robots" content="noindex, nofollow">
Code-Sprache: HTML, XML (xml)
Wann wird der Noindex-Tag verwendet?
Der Noindex-Tag kommt in der Praxis in verschiedenen Situationen zum Einsatz:
- Archiv- oder Tag-Seiten mit geringem eigenständigem Inhalt
- Duplicate Content, etwa Druckversionen oder gefilterte Shop-Ansichten
- Interne Systemseiten wie Danke-Seiten, Login-Formulare oder Suchergebnisse
- Temporäre Inhalte, die nicht über Suchmaschinen auffindbar sein sollen
- Staging- oder Testseiten, die öffentlich abrufbar sind, aber nicht gelistet werden sollen
Unterschied zur robots.txt
Der Noindex-Tag wird häufig mit der robots.txt verwechselt. Beide Werkzeuge erfüllen unterschiedliche Zwecke:
Kriterium | Noindex-Tag | robots.txt |
Zugriff für Crawler | Ja, die Seite wird gecrawlt | Nein, der Zugriff wird unterbunden |
Sichtbarkeit | Die Seite wird nicht indexiert | Die Seite kann über externe Links dennoch erscheinen |
Position | Im HTML-Head der Seite | In der Datei robots.txt im Hauptverzeichnis der Domain |
Technisches SEO und Best Practices
Der Noindex-Tag sollte gezielt eingesetzt werden. Häufige Anwendungsfehler und Empfehlungen:
- Wichtige Seiten wie Produktseiten oder Conversion-Landingpages dürfen nicht versehentlich mit Noindex versehen werden
- Seiten mit Noindex sollten nicht in XML-Sitemaps erscheinen
- Bei doppelten Inhalten ist rel=“canonical“ oft die bessere Alternative, wenn die Seite weiterhin indexiert bleiben soll
- Die Entfernung einer Seite aus dem Index kann einige Tage oder Wochen dauern
Fazit
Der Noindex-Tag ist ein wichtiges Werkzeug, um die Indexierung einzelner Seiten gezielt zu steuern. Er hilft dabei, unnötige oder doppelte Inhalte aus dem Suchindex zu halten, die Crawl-Effizienz zu verbessern und die Relevanz der indexierten Seiten zu steigern. Wer den Tag strategisch einsetzt, erhält mehr Kontrolle über die Sichtbarkeit seiner Inhalte in Suchmaschinen.
Häufige Fragen zum Noindex-Tag – FAQ
Welche Seiten sind auf Noindex?
Typische Beispiele für Noindex-Seiten sind interne Suchergebnisseiten, Login-Bereiche, Staging-Umgebungen, Filterseiten in Shops, rechtliche Seiten wie Impressum und Datenschutzerklärung oder Druckversionen.
Was bedeutet durch Noindex ausgeschlossen?
Die Seite wurde von Suchmaschinen gecrawlt, aber nicht in den Index aufgenommen. Sie erscheint dadurch nicht in den Suchergebnissen. Der Status „ausgeschlossen durch Noindex“ wird in der Google Search Console unter „Indexierung“ angezeigt.
Wie sieht der Noindex-Befehl im Quellcode aus?
<meta name=“robots“ content=“noindex“>
Wie kann ich eine Seite auf Noindex setzen?
Fügen Sie den folgenden Meta-Tag in den der betreffenden Seite ein:
<meta name=“robots“ content=“noindex“>
Wie überprüfe ich das Robots-Meta-Tag?
Öffnen Sie die Quellcode-Ansicht der Seite (Rechtsklick: Seitenquelltext anzeigen) und suchen Sie im nach dem Meta-Tag mit name=“robots“. Alternativ können Tools wie Screaming Frog, SEO Meta in 1 Click oder die URL-Prüfung in der Google Search Console verwendet werden.
Wird eine noindex-Seite weiterhin gecrawlt?
Ja, Suchmaschinen crawlen die Seite weiterhin, um den Noindex-Befehl zu erkennen. Erst danach wird entschieden, ob die Seite aus dem Index entfernt wird. Nur wenn sie zusätzlich in der robots.txt blockiert ist, wird sie nicht mehr gecrawlt.
Wie lange dauert es, bis eine Seite nach noindex aus dem Index verschwindet?
Das kann je nach Crawl-Frequenz der Seite zwischen wenigen Tagen und mehreren Wochen dauern. Über die Google Search Console lässt sich der Prozess beschleunigen, indem die Seite manuell zur erneuten Überprüfung eingereicht wird.
Wie kann ich prüfen, ob eine Seite im Index ist?
Nutzen Sie die Google-Suchanfrage site:ihre-domain.de/seite oder die Indexabdeckung in der Google Search Console. Wenn die Seite nicht erscheint oder dort als „ausgeschlossen durch noindex“ gelistet ist, wurde der Befehl korrekt erkannt.
Kann ich den Noindex-Tag auf PDF- oder andere Dateitypen setzen?
Nein, der Noindex-Tag ist ein HTML-Meta-Tag und funktioniert nur auf HTML-Seiten. Für andere Dateitypen muss die Indexierung über die X-Robots-Tag-HTTP-Header gesteuert werden.
Was passiert, wenn eine Seite sowohl noindex als auch canonical enthält?
Google priorisiert den Noindex-Befehl. Auch wenn die Seite auf eine andere URL verweist, wird sie durch Noindex aus dem Index entfernt. Diese Kombination kann sinnvoll sein, wenn die Seite nicht gelistet, aber dennoch eine klare inhaltliche Verbindung signalisiert werden soll.