Technisches SEO ~10 Min. Lesezeit

XML-Sitemap

Eine XML-Sitemap listet alle indexierungswürdigen URLs einer Website und hilft Suchmaschinen bei der gezielten Entdeckung und Indexierung von Inhalten.

Eine XML-Sitemap ist eine strukturierte Datei im XML-Format, die alle indexierungswürdigen URLs einer Website auflistet. Sie dient Suchmaschinen als Wegweiser, um Inhalte gezielt zu entdecken, abzurufen und in den Index aufzunehmen. Das Sitemaps-Protokoll wurde 2005 von Google eingeführt und im November 2006 gemeinsam von Google, Yahoo und Microsoft als offener Standard in der Version 0.90 auf sitemaps.org veröffentlicht. Seitdem hat sich das Protokoll nicht verändert, die letzte Aktualisierung der Spezifikation datiert auf November 2016. Für die Suchmaschinenoptimierung ist die Sitemap kein direkter Rankingfaktor, aber ein zentrales Werkzeug für die technische Infrastruktur: Sie steuert, welche Seiten Suchmaschinen als indexierungswürdig erkennen, und beeinflusst damit direkt die Effizienz des verfügbaren Crawl-Budgets.

Was ist eine XML-Sitemap?

Eine XML-Sitemap beantwortet eine grundlegende Frage für Suchmaschinen: Welche URLs einer Website existieren und welche davon sollen im Index erscheinen? Der Googlebot entdeckt Seiten über drei Wege: durch das Verfolgen interner und externer Links, über die URL-Prüfung in der Google Search Console und über eingereichte Sitemaps. Bei grossen Websites mit komplexer Architektur, bei neuen Domains ohne externes Linkprofil und bei Seiten mit wenig interner Verlinkung ist die Sitemap häufig der schnellste Weg zur Indexierung.

Die Einreichung einer Sitemap ist ein Hinweis an die Suchmaschine, keine verbindliche Anweisung. Google garantiert weder das Crawling noch die Indexierung aller enthaltenen URLs. Gary Illyes (Google Search Analyst) betonte, dass die Sitemap ein Entdeckungsmechanismus ist, kein Indexierungsbefehl.

Wie ist eine XML-Sitemap aufgebaut?

Das Sitemaps-Protokoll definiert eine klare Struktur mit einem Pflicht-Tag und drei optionalen Tags pro URL-Eintrag. Die technischen Grenzen liegen bei maximal 50.000 URLs und 50 MB unkomprimierter Dateigrösse pro Sitemap-Datei.

TagPflichtFunktionGoogles Nutzung
<loc>JaVollständige URL der SeiteWird ausgewertet
<lastmod>NeinDatum der letzten inhaltlichen Änderung (W3C Datetime)Wird ausgewertet, wenn konsistent gepflegt
<changefreq>NeinHinweis auf die ÄnderungshäufigkeitWird von Google ignoriert
<priority>NeinRelative Wichtigkeit innerhalb der Website (0.0 bis 1.0)Wird von Google ignoriert

Google ignoriert die Tags changefreq und priority vollständig. John Mueller (Google Search Advocate) bestätigte: “Priority and change frequency doesn’t really play that much of a role with Sitemaps anymore.” Gary Illyes bezeichnete das Priority-Tag als “essentially a bag of noise”, weil Website-Betreiber die Wichtigkeit ihrer eigenen Inhalte systematisch überschätzen.

Das lastmod-Datum verdient besondere Aufmerksamkeit. Google nutzt diesen Wert als Signal, allerdings nur dann, wenn er die tatsächliche inhaltliche Änderung widerspiegelt. Illyes erklärte sinngemäss, dass Google lastmod in den meisten Fällen ignoriert, weil Website-Betreiber das Datum nicht zuverlässig pflegen. Wer das Datum bei jeder Sitemap-Regenerierung aktualisiert, ohne den Seiteninhalt zu ändern, zerstört das Vertrauen in dieses Signal.

Welche Sitemap-Typen gibt es?

Neben der Standard-XML-Sitemap unterstützt Google mehrere spezialisierte Formate, die unterschiedliche Inhaltstypen abdecken. Jeder Typ adressiert spezifische Anforderungen an die Medienindexierung.

  • Standard-XML-Sitemap: Listet reguläre Webseiten-URLs mit Metadaten. Das Basisformat für jede Website.
  • Bild-Sitemap: Hilft Google, Bilder zu entdecken, die über JavaScript geladen oder in komplexen Seitenstrukturen eingebettet sind. Seit Mai 2022 sind nur noch zwei Tags erforderlich: <image:image> und <image:loc>.
  • Video-Sitemap: Erforderlich für die Indexierung in den Video-Suchergebnissen. Pflicht-Tags umfassen Thumbnail, Titel und Beschreibung. Videos können alternativ über mRSS-Feeds eingereicht werden.
  • News-Sitemap: Für Google-News-Publisher. Enthält Publikationsdatum, Titel und Sprachinformation. Nur Artikel der letzten 48 Stunden werden von Google News verarbeitet.
  • Sitemap-Index: Eine übergeordnete Datei, die auf mehrere einzelne Sitemaps verweist. Notwendig bei Websites mit mehr als 50.000 URLs. Verschachtelte Sitemap-Indexes (Index innerhalb eines Index) werden nicht unterstützt.

Für die Praxis empfiehlt sich eine Segmentierung nach Inhaltstyp: separate Sitemaps für Seiten, Blogartikel, Produkte und Medien, zusammengefasst in einem Sitemap-Index. Diese Struktur ermöglicht gezieltes Monitoring in der Google Search Console, wo pro Sitemap die Indexierungsrate einzeln ausgewertet werden kann.

Was gehört in eine Sitemap und was nicht?

Die Qualität einer Sitemap bestimmt, wie effizient Suchmaschinen das Crawl-Budget einsetzen. Eine Sitemap mit 50.000 URLs, von denen 30.000 auf Soft 404s, Duplikate oder Parameter-Varianten verweisen, verschwendet den Grossteil der verfügbaren Crawl-Ressourcen.

Drei Grundregeln definieren den Inhalt einer sauberen Sitemap:

In die Sitemap gehören ausschliesslich URLs, die alle folgenden Kriterien erfüllen: HTTP-Status 200, keine noindex-Anweisung, keine Weiterleitung aktiv, nicht durch die robots.txt blockiert und als kanonische Version deklariert. Jede URL erscheint in absoluter Form mit vollständigem Protokoll (https://).

Nicht in die Sitemap gehören URLs mit noindex-Tag (widersprüchliches Signal), URLs mit aktivem 301- oder 302-Redirect, URLs die 404- oder 5xx-Fehler zurückgeben, nicht-kanonische URL-Varianten (Duplicate Content), Session-ID-URLs, interne Suchergebnisseiten und Parameter-Varianten ohne eigenständigen Inhalt.

Spezialfall noindex: Gary Illyes wies darauf hin, dass das temporäre Hinzufügen von noindex-URLs zur Sitemap die Deindexierung beschleunigen kann, weil Google Sitemap-Einträge priorisiert abruft. Für den Regelbetrieb gehören noindex-URLs aber nicht in die Sitemap.

Wie reicht man eine Sitemap bei Google ein?

Nach der Einstellung der URL-Ping-Endpunkte Ende 2023 stehen drei Methoden zur Verfügung, um Google auf eine Sitemap aufmerksam zu machen.

Die primäre Methode ist die Einreichung über die Google Search Console. Der Sitemap-Bericht zeigt den Verarbeitungsstatus, die Anzahl entdeckter URLs und eventuelle Fehler. Jede eingereichte Sitemap wird separat ausgewertet, was eine segmentierte Analyse der Indexierungsrate nach Inhaltstyp ermöglicht.

Die zweite Methode ist die Referenzierung in der robots.txt-Datei. Ein Eintrag wie Sitemap: https://www.example.com/sitemap.xml ermöglicht die automatische Entdeckung durch jeden Crawler, der die robots.txt abruft. Mehrere Sitemap-Referenzen sind erlaubt. Diese Methode wurde 2007 von Google, Yahoo und Microsoft als automatischer Entdeckungsmechanismus eingeführt.

Die dritte Methode ist die programmatische Einreichung über die Search Console API, relevant für Websites mit automatisierter Deployment-Pipeline.

Wie unterscheidet sich eine XML-Sitemap von einer HTML-Sitemap?

Beide Formate tragen den Namen “Sitemap”, adressieren aber unterschiedliche Zielgruppen und erfüllen verschiedene Funktionen.

EigenschaftXML-SitemapHTML-Sitemap
ZielgruppeSuchmaschinen-CrawlerMenschliche Besucher
FormatMaschinenlesbares XMLNavigierbare HTML-Seite mit Hyperlinks
ZweckCrawling-Steuerung und URL-EntdeckungNavigation und Nutzerführung
Ablageort/sitemap.xml (nicht sichtbar für Nutzer)Im Footer verlinkt als navigierbare Seite
SEO-WirkungDirekt: steuert Crawl-EffizienzIndirekt: verbessert interne Verlinkung

Für die meisten Websites empfiehlt sich der Einsatz beider Formate. Die XML-Sitemap steuert die maschinelle Entdeckung, die HTML-Sitemap bietet Nutzern eine strukturierte Übersicht und stärkt gleichzeitig die interne Verlinkungsstruktur.

Wie generiert man Sitemaps in gängigen CMS?

Die technische Implementierung hängt vom verwendeten System ab. Vier Wege decken die häufigsten Szenarien ab.

  • WordPress: Seit Version 5.5 (August 2020) generiert WordPress eine integrierte Sitemap unter /wp-sitemap.xml. Plugins wie Yoast SEO und Rank Math bieten erweiterte Kontrolle mit separaten Sitemaps pro Inhaltstyp, automatischer Aktualisierung bei Veröffentlichung und Ausschlussoptionen für einzelne URLs oder Taxonomien.
  • Shopify: Generiert automatisch eine Sitemap unter domain.com/sitemap.xml mit Unterstrukturen für Produkte, Kollektionen, Blogs und Seiten. Die Anpassungsmöglichkeiten sind begrenzt, die Automatisierung aber zuverlässig.
  • Static Site Generators: Astro, Next.js und Gatsby erzeugen Sitemaps zur Build-Zeit über Plugins. Bei Astro kommt @astrojs/sitemap zum Einsatz, bei Next.js die Sitemap-API oder Pakete wie next-sitemap.
  • Individuelle Lösungen: Bei datenbankgetriebenen Websites empfiehlt sich die dynamische Sitemap-Generierung aus der Datenbank mit programmatischer Filterung nach Indexierbarkeit.

Welche Fehler treten bei Sitemaps am häufigsten auf?

Zehn Fehler verursachen die meisten Indexierungsprobleme im Zusammenhang mit Sitemaps. Die Sortierung folgt der Häufigkeit in technischen SEO-Audits:

  1. noindex-URLs in der Sitemap: Die Sitemap signalisiert "bitte indexieren", das noindex-Tag signalisiert das Gegenteil. Google muss die Seite crawlen, um den Widerspruch aufzulösen, und verschwendet dabei Crawl-Ressourcen.
  2. Weiterleitende URLs in der Sitemap: URLs mit 301- oder 302-Status gehören nicht in die Sitemap. Nur die finalen Ziel-URLs werden gelistet.
  3. 404- und 5xx-Fehlerseiten: Defekte URLs in der Sitemap verschwenden Crawl-Budget und erzeugen Fehlermeldungen in der Search Console.
  4. Nicht-kanonische URLs: Wenn die Sitemap eine URL enthält, deren Canonical-Tag auf eine andere URL verweist, ignoriert Google den Sitemap-Eintrag zugunsten der kanonischen Version.
  5. Lastmod ohne tatsächliche Änderung: Das Datum bei jedem Build aktualisieren, ohne den Inhalt zu ändern, zerstört Googles Vertrauen in dieses Signal dauerhaft.
  6. Dateilimits überschreiten: Mehr als 50.000 URLs oder über 50 MB pro Datei führen zu Verarbeitungsfehlern. Ein Sitemap-Index löst dieses Problem.
  7. Durch robots.txt blockierte URLs: Seiten, die über die robots.txt vom Crawling ausgeschlossen sind, können nicht indexiert werden, auch wenn sie in der Sitemap stehen.
  8. Verschachtelte Sitemap-Indexes: Nur die Struktur Index > Sitemap wird unterstützt. Ein Sitemap-Index innerhalb eines anderen Index funktioniert nicht.
  9. Inkonsistente URL-Protokolle: Mischung aus www/non-www oder http/https innerhalb einer Sitemap erzeugt doppelte Einträge.
  10. Sitemap nach Relaunch nicht aktualisieren: Alte URL-Strukturen in der Sitemap nach einem [Website-Relaunch](/glossar/relaunch/) führen zu massenhaften 404-Fehlern in der Search Console.

Wie ergänzt IndexNow die klassische Sitemap?

IndexNow ist ein Push-basiertes Protokoll, das Suchmaschinen in Echtzeit über neue oder geänderte URLs informiert. Im Gegensatz zur Sitemap, die von Crawlern aktiv abgerufen wird (Pull-Prinzip), sendet IndexNow die Benachrichtigung direkt an die Suchmaschine.

EigenschaftXML-SitemapIndexNow
MechanismusPull (Crawler ruft Datei ab)Push (Website benachrichtigt Suchmaschine)
IndexierungsgeschwindigkeitStunden bis WochenMinuten bis Stunden
Google-UnterstützungJaNein
Bing-UnterstützungJaJa
Yandex-UnterstützungJaJa

Stand Ende 2023 nutzen über 60 Millionen Websites IndexNow, mit täglich 1,4 Milliarden eingereichten URLs. 17 Prozent der neuen URL-Entdeckungen bei Bing stammen aus IndexNow-Benachrichtigungen. Google unterstützt das Protokoll bisher nicht, beobachtet die Entwicklung aber aktiv.

Für die Praxis empfiehlt sich der parallele Einsatz beider Methoden: Die XML-Sitemap als Sicherheitsnetz für die vollständige URL-Entdeckung bei allen Suchmaschinen, IndexNow für beschleunigte Indexierung bei Bing, Yandex und weiteren unterstützenden Suchmaschinen.

Häufig gestellte Fragen zu XML-Sitemaps

Braucht jede Website eine Sitemap?

Kleine Websites mit weniger als 500 Seiten und guter interner Verlinkung werden in der Regel auch ohne Sitemap vollständig gecrawlt. Für grössere Websites, neue Domains, Websites mit schwacher interner Verlinkung oder Seiten, die regelmässig neue Inhalte veröffentlichen, ist eine Sitemap dringend empfehlenswert.

Verbessert eine Sitemap die Rankings?

Nein. Eine Sitemap ist kein Rankingfaktor. Sie verbessert die Auffindbarkeit und Indexierungsgeschwindigkeit von URLs, hat aber keinen direkten Einfluss auf die Ranking-Position. Indirekt profitieren Rankings davon, dass neue Inhalte schneller im Index erscheinen.

Wie oft sollte die Sitemap aktualisiert werden?

Idealerweise automatisch bei jeder Veröffentlichung oder Änderung. CMS-Plugins wie Yoast oder Rank Math regenerieren die Sitemap bei jedem Publish-Vorgang. Bei statischen Websites erfolgt die Aktualisierung im Build-Prozess.

Was passiert, wenn die Sitemap Fehler enthält?

Google meldet Fehler im Sitemap-Bericht der Search Console. Häufige Fehler wie ungültige URLs, Weiterleitungen oder noindex-Konflikte werden einzeln aufgelistet. Fehlerhafte Einträge werden nicht indexiert, verschwenden aber Crawl-Budget beim Abrufversuch.

Kann eine Sitemap die Indexierung garantieren?

Nein. Die Einreichung einer Sitemap ist ein Hinweis, keine Garantie. Google entscheidet eigenständig, welche URLs gecrawlt und indexiert werden. Faktoren wie Inhaltsqualität, Vertrauenswürdigkeit und thematische Relevanz beeinflussen die Indexierungsentscheidung.

Soll die Sitemap in der robots.txt referenziert werden?

Ja. Der Eintrag Sitemap: https://www.example.com/sitemap.xml in der robots.txt ermöglicht die automatische Entdeckung durch alle Crawler, nicht nur durch Google. Diese Methode ergänzt die manuelle Einreichung über die Search Console.

Wie viele URLs darf eine Sitemap enthalten?

Maximal 50.000 URLs und 50 MB unkomprimierte Dateigrösse pro Datei. Für grössere Websites wird ein Sitemap-Index eingesetzt, der auf mehrere einzelne Sitemaps verweist. In der Praxis empfehlen sich rund 1.000 URLs pro Sitemap, weil die Search Console nur die ersten 1.000 Einträge pro Sitemap im Detail anzeigt.

Was ist der Unterschied zwischen Sitemap und Sitemap-Index?

Eine Sitemap enthält einzelne URL-Einträge mit Metadaten. Ein Sitemap-Index enthält Verweise auf mehrere Sitemaps und fungiert als übergeordnetes Inhaltsverzeichnis. Der Index selbst enthält keine direkten URL-Einträge, sondern nur Pfade zu den untergeordneten Sitemap-Dateien.

André Schäfer

Geschrieben von

André Schäfer

Geschäftsführer & SEO-Stratege

André Schäfer (*1990, Kronach) ist Gründer der sagemedia GmbH in Bad Staffelstein. Ehemaliger E-Sportler (n!faculty, deutsches Nationalteam) und seit 2009 im SEO tätig. 2021 gewann er den deutschen SEO-Contest, 2022 Top-5 beim SommerSEO. Sein Fokus: datengetriebene SEO-Strategien mit der Organic-Ovation Methode.

Nächster Schritt

SEO nicht nur verstehen, sondern umsetzen?

Wir machen die Theorie zur Praxis. In einem kostenlosen Erstgespräch zeigen wir dir, wie diese Konzepte konkret für dein Unternehmen funktionieren.