Suchmaschinen ~8 Min. Lesezeit

Yandex

Yandex hält 72 % Suchmarktanteil in Russland. Der Code-Leak 2023 legte 1.922 Ranking-Faktoren offen und beeinflusste SEO weltweit.

Yandex ist die führende Suchmaschine im russischsprachigen Raum mit rund 72 % Marktanteil in Russland und 42 % in der Türkei. Gegründet 1997 von Arkady Volozh, Arkady Borkovsky und Ilya Segalovich, betreibt das Moskauer Unternehmen heute über 70 Produkte und beschäftigt knapp 37.000 Mitarbeiter. Im Januar 2023 wurden durch einen Code-Leak 1.922 Ranking-Faktoren öffentlich. Diese beispiellose Transparenz lieferte der internationalen SEO-Branche die bislang detailliertesten Einblicke in die Funktionsweise eines Web-Ranking-Systems.

Was ist Yandex?

Yandex ist ein russisches Technologieunternehmen mit Hauptsitz in Moskau, das seit September 1997 eine Suchmaschine für den russischsprachigen Markt betreibt. Der Name bedeutet “Yet Another iNDEXer”. Mit rund 37.000 Mitarbeitern und mehr als 70 eigenen Produkten bildet Yandex das dominierende digitale Ökosystem in der Russischen Föderation.

Die Suchmaschine versteht russische Grammatik, Deklination, Konjugation und regionale Dialekte präziser als Google, weil die Sprachmodelle speziell auf das Russische trainiert wurden. Im Juli 2024 veräußerte die niederländische Muttergesellschaft Yandex N.V. (heute Nebius Group) ihre russischen Geschäftsbereiche für rund 5,4 Milliarden US-Dollar an ein Konsortium russischer Investoren. Der westliche Unternehmensteil firmiert seitdem als Nebius und hat keinen operativen Zugriff mehr auf die russische Suchmaschine. Im Konsortium der neuen russischen Eigentümer hält Lukoil 15 %, Investor Alexander Chachava 25 %, das Senior Management gemeinsam 35 %.

Das Yandex-Produktportfolio deckt nahezu jeden digitalen Lebensbereich ab:

  • Suche und Information: Yandex.Search, Yandex.News, Yandex.Translate
  • Navigation und Mobilität: Yandex.Maps, Yandex.Taxi (das Uber-Pendant im russischen Raum), Yandex.Drive (Carsharing-Dienst)
  • Unterhaltung und Content: Yandex.Music, Yandex.Zen (Empfehlungsplattform)
  • E-Commerce: Yandex.Market (Handelsportal), Yandex.Eda (Lebensmittelzustellung)
  • Analyse und Werbung: Yandex.Direct (Pendant zu Google Ads), Yandex.Metrica (kostenloses Webanalyse-Tool)
  • Cloud und Infrastruktur: Yandex.Cloud, Yandex.Disk (Cloud-Speicher), Yandex.Browser

Wie funktioniert der Yandex-Suchalgorithmus?

Der Yandex-Suchalgorithmus kombiniert mehrere spezialisierte Systeme zu einem hierarchischen Ranking-Stack. MatrixNet, 2009 eingeführt und 2017 durch CatBoost abgelöst, bildet das statistische Fundament. Die neuronalen Netze Palekh (seit 2016) und Korolyov (seit 2017) ergänzen semantisches Verständnis für komplexe Longtail-Anfragen.

Die Algorithmen-Evolution in der chronologischen Übersicht:

  • MatrixNet (2009 bis 2017): Boosting-basiertes Ranking-Modell, das tausende Faktoren gewichtet und je nach eingegebenem Suchbegriff, Standort und Intent unterschiedliche Gewichtungen anwendet. MatrixNet galt als Vorläufer von Googles RankBrain und ging diesem sechs Jahre voraus.
  • Palekh (2016): Erstes neuronales Netz zur Bedeutungsanalyse bei Longtail-Queries. Verarbeitete bis zu 150 Seiten pro Suchanfrage und ordnete semantische Ähnlichkeit zwischen Dokument und Frage.
  • Korolyov (2017): Nachfolger von Palekh mit deutlich höherer Rechenkapazität. Analysiert bis zu 200.000 Seiten parallel und füttert seine Erkenntnisse zurück in das Basis-Ranking-System.
  • CatBoost (seit 2017): Gradient-Boosting-Framework, das MatrixNet ablöste und heute die Hauptkomponente der Yandex-Relevanzberechnung bildet. Open-Source veröffentlicht und auch außerhalb von Yandex weit verbreitet.

Ergänzt wird der Stack durch die Crowdsourcing-Plattform Toloka, auf der menschliche Bewerter Trainingsdaten für die Modelle liefern. Anonymisierte Nutzersignale aus Yandex.Metrica und dem Yandex.Browser fließen zusätzlich in die Ranking-Berechnung ein.

Welche Ranking-Faktoren offenbarte der Yandex-Leak 2023?

Im Januar 2023 wurden durch einen internen Leak 44,7 GB Quellcode des Yandex-Suchalgorithmus öffentlich. Analysten identifizierten 1.922 Ranking-Faktoren in der initialen Datei und insgesamt rund 17.800 Faktoren über alle Code-Dateien hinweg. Rund 64 % sind im Code als deprecated oder unused markiert, womit etwa 417 aktive Faktoren verbleiben.

Die bestätigten Hauptfaktoren aus der Leak-Analyse:

  • Nutzersignale aus Klick- und Verweildaten: Klickrate in den Suchergebnissen, Verweildauer auf der Zielseite, Rückkehrrate in die Ergebnisliste und Wiederkehrverhalten. Direkt aus Yandex.Metrica und dem Browser gespeist.
  • PageRank-ähnliche Link-Bewertung: Qualität und Quantität eingehender Verlinkungen, thematische Relevanz der verweisenden Domain, Alter der Linkbeziehung.
  • Content-Relevanz mit TF-IDF: Klassisches Term-Frequency/Inverse-Document-Frequency-Modell zur Abbildung thematischer Relevanz. Meta-Keywords werden weiterhin ausgewertet, anders als bei Google seit 2009.
  • Host-Zuverlässigkeit: Server-Uptime, Ladezeit, technische Fehlerquote. Instabile Hoster verlieren Rankings.
  • Aktualität und Frische: Insbesondere bei Nachrichten- und zeitkritischen Queries. Dokumenten-Alter und Update-Frequenz fließen ein.
  • Crawl-Tiefe: URLs mit geringer Klick-Distanz zur Startseite werden stärker gewichtet. Flache Seitenarchitekturen profitieren.
  • YMYL-Kriterien: Für medizinische, juristische und finanzielle Inhalte gelten strengere Autoritätsanforderungen, vergleichbar mit Googles YMYL-Konzept.
  • URL-Struktur: Anzahl der Zahlen, Großbuchstaben und Schrägstriche in der URL beeinflussen das Ranking, Parameter-URLs werden abgewertet.

Yandex selbst erklärte, das geleakte Archiv entspreche einer veralteten Version des Repositories und enthalte Testalgorithmen, die nur intern zur Verifikation verwendet worden seien. Trotzdem lieferte der Leak die erste dokumentierte Blaupause eines großen Web-Suchalgorithmus und bestätigte viele Vermutungen zur Arbeitsweise von Google.

Wie unterscheidet sich Yandex von Google?

Yandex konzentriert sich auf den russischsprachigen Raum, Google dominiert global. Die Unterschiede betreffen Sprachverständnis, Gewichtung von Nutzersignalen, lokale Suche und KI-Integration. In russischer Morphologie, Dialekten und ortsabhängigen Anfragen arbeitet Yandex präziser, Google punktet bei Geschwindigkeit und globaler Sprachabdeckung.

KriteriumYandexGoogle
Marktanteil72 % in Russland, 42 % in der Türkei91 % weltweit
SprachverständnisSpezialisiert auf Russisch, Morphologie, DialekteGlobal über Dutzende Sprachen
NutzersignaleDirekt und stark gewichtet (CatBoost, Metrica)Indirekter, weniger transparent
Lokale SucheAutomatische Standorterkennung, ortsnahe TrefferStark, meist mit expliziter Standortabfrage
KI-AssistentAlice, YandexGPT, auf Russisch fokussiertGemini, AI Overviews, global
IndexierungstempoGründlich, aber langsamer als GoogleSchnell, Mobile-First
Meta-KeywordsNoch ausgewertet (laut Leak)Seit 2009 ohne Ranking-Einfluss

Ein auffälliger Unterschied: Yandex erkennt den Standort automatisch und liefert ortsbezogene Ergebnisse, ohne dass Nutzer eine Stadt eingeben müssen. In lokalen Anfragen reagiert die russische Suchmaschine kontextgenauer als Google im gleichen Sprachraum.

Welche Datenschutz-Risiken birgt Yandex für EU-Unternehmen?

Yandex ist nach russischem Recht verpflichtet, dem Föderalen Sicherheitsdienst FSB auf Anforderung Zugriff auf Nutzerdaten zu gewähren, einschließlich Standortinformationen, Suchanfragen und E-Mail-Inhalten. Aus DSGVO-Perspektive ist der Einsatz von Yandex-Produkten in der EU rechtlich kritisch.

Die wichtigsten regulatorischen Einschränkungen und Risiken für europäische Unternehmen:

  • Staatliche Durchgriffsrechte: Der FSB kann per gesetzlicher Grundlage Daten anfordern, eine richterliche Kontrolle wie in der EU fehlt.
  • Yandex.News-Inhalte unter Aufsicht: Die Medienaufsicht Roskomnadsor bestimmt, welche Quellen in den Nachrichtenergebnissen erscheinen. Rund 70 % der angezeigten Nachrichten stammen laut Recherchen aus staatsnahen Medien.
  • Datenübertragung an russische Server: Der Yandex.Browser sendet jede eingegebene URL zusammen mit eindeutigen Geräte-IDs an Yandex-Server. Finnlands Datenschutzbehörde hat die Übermittlung sensibler Daten an Yandex bereits per Bescheid untersagt.
  • Goldene Aktie des russischen Staates: Der Staat hält eine Sperrminorität mit Vetorecht bei strategischen Unternehmensentscheidungen, was die Unabhängigkeit der Plattform rechtlich begrenzt.

Für DACH-Unternehmen bedeutet das praktisch: Yandex.Metrica, Yandex.Direct und der Yandex.Browser sollten ohne rechtliche Absicherung nicht eingesetzt werden. Eine DSGVO-konforme Nutzung erfordert mindestens eine Datenschutz-Folgenabschätzung und vertragliche Garantien, die nach aktueller Lage kaum erreichbar sind.

Ist Yandex für den DACH-Markt relevant?

Für deutschsprachige Unternehmen ist Yandex als Trafficquelle nicht relevant. Der Marktanteil liegt in Deutschland unter 1 %, in Europa unter 3 %. Relevanz entsteht in zwei Sonderfällen: bei Zielgruppen im russischen oder türkischen Markt und als Referenzquelle für algorithmische Erkenntnisse nach dem Leak von 2023.

Zwei Szenarien, in denen eine Yandex-Strategie sinnvoll ist:

  • Russisch- und türkischsprachige Zielgruppen: Unternehmen mit Aktivitäten im russischen Markt, in der Türkei oder mit russischsprachigen Communities in Europa brauchen eine separate Yandex-Strategie. In der Türkei ist Yandex mit 42 % Marktanteil sogar die Nummer eins.
  • Algorithmische Erkenntnisse als Lernquelle: Der Code-Leak von 2023 lieferte die erste direkte Bestätigung vieler Ranking-Vermutungen für Google. Nutzersignale, Host-Zuverlässigkeit, Content-Frische und Linkqualität wurden als aktive Faktoren dokumentiert. Diese Erkenntnisse helfen bei Google-SEO, auch ohne Yandex-Traffic als Ziel.

Für die meisten Unternehmen im DACH-Raum bleibt der Fokus auf Google und Microsofts Suchmaschine, einschließlich der Bing-basierten Anbieter wie datenschutzorientiertem DuckDuckGo und nachhaltiger Berliner Alternative Ecosia. sagemedia optimiert mit der Organic-Ovation-Methode für das gesamte relevante Such-Ökosystem, einschließlich der KI-gestützten Antwortsysteme von Google und Microsoft.

Was war der Yandex-Leak 2023?

Im Januar 2023 wurden 44,7 GB Quellcode der Yandex-Suche öffentlich. Analysten identifizierten 1.922 Ranking-Faktoren in der initialen Datei, insgesamt rund 17.800 über alle Dateien hinweg, davon etwa 417 aktiv.

Brauche ich Yandex-SEO für den deutschen Markt?

Nein. In Deutschland liegt der Yandex-Marktanteil unter 1 %. Nur Unternehmen mit russisch- oder türkischsprachigen Zielgruppen benötigen eine eigene Yandex-Strategie.

Was ist Yandex.Metrica?

Yandex.Metrica ist ein kostenloses Webanalyse-Tool mit Session-Replay, Heatmaps und detaillierter Nutzeranalyse, vergleichbar mit Google Analytics. Aufgrund der Datenübertragung an russische Server ist der Einsatz in der EU datenschutzrechtlich problematisch.

Wie unterscheidet sich die Yandex-Sprachassistentin von Google?

Alice, die Yandex-Sprachassistentin, versteht russische Dialekte, umgangssprachliche Wendungen und prosodische Nuancen präziser als Google Assistant im gleichen Sprachraum. Google Assistant unterstützt dafür Dutzende Sprachen, Alice konzentriert sich auf Russisch.

Was bedeutet der Yandex-Leak für Google-SEO?

Der Leak bestätigte viele bisher nur vermutete Google-Ranking-Muster: Nutzersignale wie Klickrate und Verweildauer, Host-Zuverlässigkeit, Content-Aktualität und Linkqualität. Er ist die erste dokumentierte Blaupause eines großen Suchalgorithmus und dient als Referenzrahmen für datengetriebene SEO-Strategien weltweit.

Was ist Yandex.Direct?

Yandex.Direct ist die Werbeplattform des Moskauer Konzerns, vergleichbar mit Google Ads. Sie bietet Suchanzeigen, Display-Werbung und Retargeting im russischsprachigen Raum. Für Unternehmen, die den russischen oder türkischen Markt adressieren, ist Yandex.Direct neben SEO der wichtigste bezahlte Werbekanal. Die Klickpreise liegen in vielen Branchen deutlich unter Google-Ads-Niveau.

André Schäfer

Geschrieben von

André Schäfer

Geschäftsführer & SEO-Stratege

André Schäfer (*1990, Kronach) ist Gründer der sagemedia GmbH in Bad Staffelstein. Ehemaliger E-Sportler (n!faculty, deutsches Nationalteam) und seit 2009 im SEO tätig. 2021 gewann er den deutschen SEO-Contest, 2022 Top-5 beim SommerSEO. Sein Fokus: datengetriebene SEO-Strategien mit der Organic-Ovation Methode.

Nächster Schritt

SEO nicht nur verstehen, sondern umsetzen?

Wir machen die Theorie zur Praxis. In einem kostenlosen Erstgespräch zeigen wir dir, wie diese Konzepte konkret für dein Unternehmen funktionieren.