Immer dann, wenn es um komplexere Zusammenhänge geht, werden die Überlegungen oft in PDF-Dateien zusammengefasst und auch in dieser Form veröffentlicht. Google platziert solche PDF-Dateien in der ganz normalen Suche an prominenter Stelle, wenn die Inhalte relevant für die Suchbegriffe des Nutzers sind und die Datei auch eine gute externe Verlinkung aufweist. Deshalb ist die Suchmaschinen-Optimierung für PDF-Dateien auch interessant, denn man möchte bei den entsprechenden Anfragen mit seinen PDFs vorne liegen. Schließlich ist auch zu bedenken, dass die erweitere Suche von Google gezielt das Recherchieren von PDF-Dateien anbietet, eine Möglichkeit auf die professionelle Sucher bei Google gerne zurückgreifen.
Kürzlich hat die Webmaster-Zentrale von Google Hinweise zu PDFs gegeben, womit man auch die Suchmaschinen-Optimierung für eigene PDF-Dateien verbessern kann.
Welche PDF-Dateien landen im Google-Index?
Zunächst müssen die PDF-Dateien, die auf einem Webserver liegen, natürlich über einen Link erreichbar sein. Dann muss man sie öffnen und lesen können. PDFs, die man nur mit einem Passwort öffnen kann, kann Google natürlich nicht indexieren. Idealerweise sollte in der PDF-Datei dann Text vorliegen. Aber auch Text in Bildern kann vom Google Algorithmus erkannt werden, denn mittels OCR-Techniken kann Text in Bilddateien umgewandelt werden.
Doch im Sinne der Suchmaschinen-Optimierung wäre es natürlich besser, wenn man Texte auch tatsächlich als Texte in die PDF-Datei packt. Auch hier ist dann der Inhalt gezielt über Keywords zu gestalten. Man sollte also darauf achten, dass die Hauptthemen der PDF in wenigen aber aussagekräftigen Keywords gebündelt werden kann und dass diese Keywords in angemessener Häufigkeit in der PDF-Datei auftauchen.
Wie wird mit Bildern in PDFs verfahren?
Bilder in PDFs werden nicht in den Google-Index aufgenommen, sie können also nicht die Suchmaschinen-Optimierung bei der Google Bildersuche unterstützen. Wenn man die Bildersuche von Google im Seo-Sinne nutzen möchte, dann muss man HTML-Dateien schaffen in denen die Bilder eingebettet sind. Im Umfeld der Bilder, im Alt-Text und im Dateinamen der Bilder sollte man dann relevante Keywords verwenden.
Wie werden Links in PDF-Dokumenten behandelt?
Interne und externe Verlinkungen in PDF-Dokumenten werden ähnlich behandelt wie Links in HTML-Dateien. Aber es gibt keine Möglichkeit mit „noFollow“ den Link daran zu hindern, dass der Suchrobot den Link auch verfolgt. Links in PDF-Dateien können also PageRank und weitere Indexierungssignale an andere Webseiten übertragen. Das ist natürlich auch eine Möglichkeit externe Links für eigene Webseiten im Sinne der Off-Page-Optimierung zu gewinnen, wenn man eigene PDFs auf fremden Webservern veröffentlicht.
Kann es ein Duplicate Content Problem mit PDF-Dateien geben?
Duplicate Content sind annähernd gleiche Seiteninhalte, die dann dazu führen, dass nur ein von Google bestimmtes Dokument in den Suchmaschinen-Ergebnissen angezeigt wird. Dieses Problem kann natürlich entstehen, wenn man nur geringfügig unterschiedliche PDFs zu einem Thema publiziert. Es ist aber auch problematisch, zu einem Thema eine PDF-Datei und eine inhaltsgleiche HTML-Datei vorrätig zu halten. In diesem Fall verwendet man das Attribut rel=“canonical“ um den Suchmaschinen mitzuteilen, welche der Dokumente das eigentliche Dokument ist, das in den Index kommen soll.
Wie kann man die Suchmaschinen-Optimierung für PDFs beeinflussen?
Relevant sind hier die Meta-Angaben in der PDF-Datei und die Ankertexte, die von anderen externen oder internen Links auf die PDF-Datei verweisen. Man hat also gute Möglichkeiten den Titel oder andere Metaangaben innerhalb der PDF suchmaschinengerecht zu bestimmen. Anders als bei HTML-Dokumenten hat man aber keine Möglichkeiten durch Formatierung von Keywords auf die Suchmaschinen-Optimierung einzuwirken. Diese Art der Feinsteuerung kann man nur mit HTML-Dateien erreichen.
Als Fazit kann festgehalten werden, dass die Suchmaschinen-Optimierung für PDF-Dateien zwar möglich ist, aber nicht mit gleich vielen Stellschrauben wie bei HTML. Es macht also keinen Sinn, PDF-Dateien zu entwickeln und dann mit diesen in die Suchmaschinen-Optimierung einzusteigen. Wenn man aber schon PDF-Dateien hat, die interessant für eine Veröffentlichung sind, dann macht es Sinn vor der Veröffentlichung diese PDF-Dateien im Sinne der Suchmaschinen-Optimierung anzupassen.