Wenn eine Webseite aus vielen unterschiedlichen Code-Bestandteilen zusammengesetzt werden muss, dann kann das Verhältnis zwischen dem reinen Text und der gesamten Zeichenmenge der Webseite sehr niedrig ausfallen. Als Text to Code Ratio (bzw. Text-zu-Code-Rate) könnte dieser Indikator möglicherweise relevant sein. Doch hier fallen die Meinungen unterschiedlich aus.
Viel Text und wenig Inhalt, das ist schlecht für die Besucherakzeptanz und auch schlecht für die SEO, selbst wenn nach wie vor unklar bleibt, wie Google und andere Suchmaschinen die Qualität des Inhalts bestimmen können. Algorithmische Systeme wie Suchmaschinen sind auf quantitative Daten angewiesen, um ein qualitativ akzeptables Ergebnis zu produzieren. Die Text to Code Ratio (der quantitative Anteil des reinen Textes an der Zeichenzahl der Webseite) könnte möglicherweise ein Ranking-Kriterium darstellen, gemäß dem Motto: Ein hoher Anteil von reinem Text ist besser und bringt die Webseite nach vorn. Doch entsprechende Überlegungen sind ziemlich kurz gesprungen, schließlich sagt ja eine hohe Text to Code Ration nichts über die Art und Menge des Inhalts aus.
Man kann das Verhältnis von Text zu Code recht einfach selbst berechnen und ist nur dann auf externe Tools angewiesen, wenn man sehr häufig messen möchte oder viele Webseiten zu überprüfen sind. Allerdings ist das wahrscheinlich unnötig, denn die Text to Code Ration wird im wesentlichen durch das Content-Management-System, die verwendeten Plugins und eingebettete Inhalte bestimmt, sollte also annähernd gleich bei allen relevanten Webseiten einer Website sein. Man kann also die Berechnung der Text to Code Ratio auf die Startseite beschränken.
Um die Text to Code Ratio zu berechnen, öffnet man die Webseite in einem beliebigen Browser und lässt sich die Seite im Quelltext anzeigen. Dies geht oft mit der rechten Maustaste. Man markiert den Inhalt komplett und fügt ihn in ein Textverarbeitungsprogramm oder einen normalen Editor ein. So hat man dann die Anzahl der Zeichen einschließlich Code. Um an den reinen Text zu kommen, muss man auf den Google Cache zurückgreifen. Mit „cache:Adresse der Webseite“ bekommt man den Inhalt der Webseite so angezeigt, wie ihn Google zuletzt indexiert hat. Google bietet dann die Möglichkeit sich diesen Cache-Inhalt als reinen Text anzeigen zu lassen. Auch diesen Inhalt transferiert man in ein neues Editor-Fenster und hat so die Anzahl der Zeichen (ohne Code). Diesen Wert dividiert man durch den vorher bestimmten Wert (mit Code) und multipliziert mit 100, um eine Prozentzahl zu bekommen.
Ich war ganz erstaunt, dass meine Website-Startseite http://www.train-und-coach.de nur auf knapp 20 Prozent Text to Code Ratio kommt. Da ich WordPress verwende und recht zurückhaltend mit dem Einsatz von PlugIns umgehe, wäre dieser Wert nur zu verbessern, wenn ich auf statische HTML-Seiten wechsle, was aber keine wirklich praktische Option wäre.
Sucht man mit Google nach dem Begriff „Text to Code Ratio“ dann findet man zwar einige nützliche Angaben, aber keine Aussagen dazu, welcher Wert für SEO akzeptabel oder gut ist und wie man den Wert verbessern könnte. Das ist schon ein guter Hinweis darauf, dass das Text zu Code Verhältnis nicht sonderlich relevant sein kann. Es wäre auch wenig sinnvoll Webseiten für bestimmte Suchbegriffe nach vorne zu schieben, die als einzeln erstellte HTML-Seiten individuell entwickelt wurden. Gute Webseiten finden sich meist nur auf größeren Websites, die heutzutage fast immer nur mit Content-Management-Systemen publiziert werden. Falls unterschiedliche Content-Management-Systeme eine sehr unterschiedliche Text to Code Ratio produzierten sollten, dann wäre das Ranking-Merkmal indirekt eine Bewertung des Systems. Auch das erscheint wenig wahrscheinlich. Naheliegender ist es also auf die Verbesserung der Geschwindigkeit der Seitendarstellung zu achten. Diese ist schließlich auch für Menschen wichtig und nicht nur für Maschinen.