Kostenlose Erstberatung
+49 (0)30 69 20 6347

Entity Extraction

Immer stärker wird den Internetnutzern bewusst, dass Suchmaschinen wie Google Texte auf Webseiten nicht nur formal analysieren, sondern auch inhaltlich besser bestimmen können. Eines der dort angewandten Konzepte ist die Entity Extraction, also das Bestimmen der Personen, Objekte und Konzepte, die für den Text und damit für die Webseite tragend sind. Man sollte das Paradigma Entity Extraction verstehen, um mehr für die Suchmaschinen-Optimierung tun zu können.

Schaut man zu einem beliebigen (aber einem gut bekannten Thema) die Ergebnisseite von Google an, dann kann man sich oft darüber wundern, wie gut dort diejenigen Webseiten ranken, die man als relevant für das Thema bereits vor der Google-Suche eingeschätzt hat. Gelegentlich ist aber auch das Gegenteil der Fall, Expertenwebsites mit hoher Kompetenz fallen hinter Webseiten zurück, die nur scheinbar kompetenter sind.

Man kann für diesen urwünschten Erfolg Suchmaschinen-Optimierung verantwortlich machen. Den vorne stehenden Webmastern ist es gelungen, durch inhaltliche Aufbereitung (OnPage-SEO) und/oder externe Verlinkungen (OffPage-SEO) einen Vorsprung zu erzielen. Stellt man aber bei diesen Webseiten keine relevanten Unterschiede in Bezug auf SEO-Maßnahmen fest, dann könnten auch die Menge und die Art der Objekte (Personen, Konzepte) für das unterschiedliche Ranking verantwortlich sein. Google kennt zu Sach- oder Fachbegriffen das semantische Feld und rankt Webseiten besser, die dieses semantische Feld besser abgrasen können. So die These, die deutlich machen kann, dass rein Keyword bezogenes Denken der Vergangenheit angehört. Obwohl natürlich nicht zu bestreiten ist, dass die Personen oder Konzepte letztendlich durch Keywords repräsentiert werden.

Interessanterweise gibt es ein Tool, mit dem man sich das semantische Feld bzw. die Entity Extraction von Webseiten erschließen kann:  Entity Extraction Demo auf dandelion.eu . Hier kann man eine URL oder direkt Text eingeben, um die Objekte zu bestimmen, die eine automatische Analyse erbringt. Man dieses Tool nutzen, um eigene oder fremde Webseiten oder eigene Texte für neue Webseiten zu analysieren. Stellt man dann fest, dass die eigenen Seiten oder die noch nicht veröffentlichten Texte andere Objekte erbringen als die führenden Webseiten zum gleichen Thema, dann ist dies ein Grund zum Nachdenken. Entweder man hat hier ein Alleinstellungsmerkmal, dass man ausbauen kann oder man stellt fest, dass im eigenen Angebot relevante Objekte, Personen oder Konzepte fehlen, die man noch in den Text einbaut oder die man in einer ergänzenden Webseite berücksichtigt.

Das man hierbei nicht formal und automatisch vorgehen kann, soll an einem Beispiel verdeutlicht werden. Vor einiger Zeit habe ich auf meiner Website train-und-coach.de einen Blogbeitrag zum Themenkomplex Kognitive Dissonanz http://www.train-und-coach.de/kognitive-dissonanz.html veröffentlicht, der bei Google zeitweise ein gutes Ranking hatte, wie ich leicht über die Google Search Console feststellen konnte. Diese Webseite vergleiche ich nun mit der englischen Wikipedia-Webseite zum gleichen Themenkomplex https://en.wikipedia.org/wiki/Cognitive_dissonance, deren Ranking natürlich besser ist als meine Platzierung. Die Entity Extraction liefert in Bezug auf meine Seite 3 Personen, 4 Arbeitsbereich, 39 Konzepte aber keine Organisationen, Plätze oder Ereignisse.

Demgegenüber kann die Wikipedia mit deutlich größeren Anzahlen nach der Entity Extraction punkten. Es gibt fast dreimal so Personen, fast 10-mal so viele Konzepte und sogar 4 Organisationen und einen Ort und ein Ereignis. Das allerdings das Mehr nicht unbedingt mit besser gleichzusetzen ist, wird schnell deutlich, wenn man sich die Personen anschaut, die bei der englischen Wikipedia berücksichtigt wurden. Dort tauchen auch Hillary Clinton und Donald Trump auf, die mit der kognitiven Dissonanz als Wissenschaftskonzept nur am Rande zu tun haben können. Es wäre also nicht unbedingt sinnvoll, diese Personen in der eigenen Webseite zu berücksichtigen. Denkbar wäre es dann schon eher, einen aktuellen Blogbetrag zu schreiben und dort dann Trump und Clinton hinsichtlich der kognitiven Dissonanz zu vergleichen, wobei schnell klar wird, dass dies dann eine Glosse sein muss.

Für die eigene Webseite, die verändert werden soll, um das Ranking zu verbessern, sind dann schon eher die Orte interessant, wobei dies auch die Universitäten Harvard und Standford sind. Da dort die relevanten Experimente gemacht wurden, scheint es kein Fehler zu sein, diese auch im eigenen Beitrag zu berücksichtigen, womit man Suchmaschinen nicht nur ein Aktualitätssignal gibt, sondern auch aufzeigt, dass man die eigene Webseite auf eine breitere Basis gestellt hat.

Man erkennt also: Es macht Sinn für die bessere Suchmaschinen-Optimierung auf die Entity Extraction zu achten. Durch die Nutzung von Tools zur Entity Extraction bekommt man neue Ideen und kann auch schon vorhandene Webseiten ausbauen, um das Ranking zu verbessern.

Schreibe einen Kommentar

13 − acht =

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.