|
| |
Pagerank
Der PageRank-Algorithmus ist ein Verfahren, eine
Menge verlinkter Dokumente, wie beispielsweise das
World Wide Web, anhand ihrer Struktur zu bewerten
bzw. zu gewichten. Dabei wird jedem Element ein
Gewicht, der Pagerank, aufgrund der
Verlinkungsstruktur zugeordnet.
Der Algorithmus wurde von Larry Page (daher der Name
Pagerank) und Sergey Brin an der Stanford University
entwickelt und von dieser patentiert[1]. Er diente
Google, dem von Brin und Page gegründeten
Unternehmen, als Grundlage für die Bewertung von
Seiten.
Das Grundprinzip lautet: Je mehr Links auf eine
Seite verweisen, umso höher ist das Gewicht dieser
Seite. Je höher das Gewicht der verweisenden Seiten
ist, desto größer ist der Effekt. Der
PageRank-Algorithmus bildet einen zufällig durch das
Netz surfenden User nach.
Die Wahrscheinlichkeit, mit der dieser auf eine
Webseite stößt, korreliert mit dem PageRank.
Das Prinzip des PageRank-Algorithmus ist, dass jede
Seite ein Gewicht (PageRank) besitzt, das umso
größer ist, je mehr Seiten (mit möglichst hohem
eigenem Gewicht) auf diese Seite verweisen.
Das Gewicht PRi einer Seite i berechnet sich also
aus den Gewichten PRj der auf i verlinkenden Seiten
j. Verlinkt j auf insgesamt Cj verschiedene Seiten,
so wird das Gewicht von PRj anteilig auf diese
Seiten aufgeteilt. Folgende rekursive Formel kann
als Definition des PageRank-Algorithmus angesehen
werden:
Aufgrund der wirtschaftlichen Bedeutung ist es
inzwischen zu gezielten Manipulationen und
Fälschungen gekommen. So wurde dieses sinnvolle
System in der Praxis von Suchmaschinenoptimierern
durch Gästebuch-, Blog- und Forum-Spamming, dem
Betreiben von Linkfarmen und anderen unseriösen
Methoden unterlaufen. Durch Weiterleitung auf
bestehende Seiten mit hohem PageRank wird gezielt
versucht, die Anzeige in der Googletoolbar zu
manipulieren.
Anfang 2005 implementierte Google ein neues
Attribut, rel="nofollow", für Verweise. Dies ist ein
Versuch, gegen Spam vorzugehen. Links, die mit
diesem Attribut versehen werden, werden nicht für
die PageRank-Berechnung berücksichtigt. Durch
Kennzeichnung ausgehender Links kann so
beispielsweise dem Gästebuch-, Blog- und
Forum-Spamming entgegengewirkt werden. Allerdings
ist diese Methode, Spam zu verhindern, umstritten.
|
|
| |
|
|