Experten für Suchmaschinen-Optimierung fokussieren sehr häufig auf die Website und ihre Webseiten, die dort zu platzierende Keywords und auf die Gewinnung von externen Links. Weniger stark beachtet wird die Suchanfrage der potentiellen Nutzer. Wie geht eigentlich Google vor, wenn es die Bedeutung dieser Suchanfrage bestimmt? Schließlich ist dies sehr wichtig, um aus der Milliardenfülle des Webs die Links zu relevanten Seiten in die Suchmaschinen-Ergebnisseite zu transferieren.
In diesem Artikel geht es zunächst um die Frage, welche Teilmenge der Webseiten überhaupt während oder nach der Suchanfrage ausgeliefert wird. Das Ranking dieser vergleichsweise kleinen Teilmenge ist Gegenstand des nächsten Artikels.
Wie gehen Suchmaschinen vor, wenn sie die Bedeutung einer Suchanfrage bestimmen
Dazu muss man wissen, dass für das gesamte sichtbare Web bei Google ein invertierter Index angelegt ist, der die Basis der Keywords repräsentiert, die für die Webseiten aller Websites genutzt werden. Man muss sich diesen Index so vorstellen wie den Index eines Buches: Das Buch enthält die einzelnen Websites als Kapitel und der Index gibt an wo (auf welchen Webseiten und damit auf welcher Website) ein bestimmtes Keyword zu finden ist. Der Index heißt deshalb invertiert, weil in ihm die Verlinkungen oder Verweise als Zeile vorhanden sind, während man sich das Vorkommen der Keywords in den Webseiten als Spalte vorstellt.
Während die Suchanfrage geschrieben wird, werden bereits Selektionen vorgenommen, die darauf abzielen, die relevante Auswahl an Verweisen im Index zu reduzieren: Google Instant. Doch erst nachdem die Suchanfrage abgeschlossen ist, kann endgültig über die relevanten Keywords entschieden werden. Google und andere Suchmaschinen machen also aus der Suchanfrage eine Liste von Keywords, die im invertierten Index vorkommen.
Insbesondere wenn die Liste sehr kurz ist, wird Google die Liste um weitere anders ermittelte Keywords „anreichern“, dies macht Dirk Lewandowski sehr gut deutlich. Bei den Eingaben des Nutzers werden noch weitere Korrekturen vorgenommen, die wesentlich elementarer sind:
- Rechtschreibfehler werden korrigiert
- Stoppwörter werden eliminiert
- Grammatikalische Endungen werden beseitigt
- Keyword-Phrasen werden zu Keywords, wenn sie eine Wortfolge darstellen, die häufig verwandt wird. (Bsp. bus stop, Auto Ersatzteile)
Beispiel: aus „die gute Fahrrad Werkstatt Berlin“ werden also drei Keywords generiert: gut, Fahrrad-Werkstatt, Berlin. Möglicherweise wird noch ein Keyword wie „Kreuzberg“ hinzugenommen, wenn erkennbar ist, dass der Nutzer mobil aus Kreuzberg diese Abfrage startet oder wenn Google annehmen kann, dass der Nutzer in Kreuzberg seinen beruflichen bzw. privaten Schwerpunkt hat.
Die (angereicherte) Anfrage dient der Selektion
Nun kann die Suchmaschine hingehen und alle Zeilen der Keywords zusammenwerfen, um alle potentiell relevanten Webseiten zu finden. Doch halt, das wäre zu unspezifisch. Möglicherweise finden sich ja Zeilen bei denen bestimmte Websites mehrfach vorkommen oder eine Website oder Webseite kommt in mehreren (oder fast allen) Indexzeilen vor. Damit ist klar, die Selektion, die bereits über 99 Prozent der Webseiten aus dem Ranking ausgeschlossen hat, kann auch sehr gut für das Ranking selbst genutzt werden.