úvod | čo je Google AdSense | články | diskusia & poradňa

Google PageRank - vzorec, vysvětlení a odpovědi

PageRank je číslo, které si Google přiřazuje ke každé stránce (přesněji řečeno ke každému URL). Vyjadřuje něco jako věrohodnost nebo důležitost stránky. Někdy se píše zvlášť jako "Page Rank" a zkracuje se do zkratky PR.

Vzorec PageRanku

Pagerank v klasickém pojetí dosahuje hodnot od nuly do jedné. Google si Page Rank počítá (zjednodušeně řečeno) podle toho, kolik a jak důležitých stránek na tu počítanou stránku odkazuje. Existuje na to vzoreček. Je to trochu matiky, tak to případně přeskočte, není nutné to chápat detailně.

PageRank stránky A označím jako PR(A). Vypočítá se z PageRanků stránek, které na ni odkazují. To jsou stránky T1 až Tn.

PR(A) = (1-d)/m + d * ( PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)

kde d je dampening faktor (nastavený pravděpodobně na 0,85),m je celkový počet zaindexovaných stránek.C(T) je počet odkazů vedoucích ze stránky T.

Jako vstupní hodnoty PR(Ti) se berou hodnoty PageRanku stránek z minulé iterace výpočtu. Vzoreček po několika iteracích dobře konverguje (tím lépe, čím je nižší d). Hodnoty PageRanku všech stránek se pohybují těsně nad nulou.

Originální dokumentace uvádí vzoreček trochu chybný:
PR(A) = (1-d) + d * (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn)) je to špatně, chybí tam to m.

Pro zasvěcené zdůrazňuji, že PageRank je veličina skalární, tedy pro každou stránku (URL, dokument) jde o jediné číslo. (V rámci některých pojetí se o PageRanku mluví jako o vektoru v n-rozměrném prostoru, kde n je počet dokumentů. To je pouze složitější pohled na jednoduchá čísla.)

Vzorec se dá zjednodušeně přetlumočit tak, že stránka předává část svého PageRanku stránkám, na které odkazuje. Čím víc obsahuje odkazů (hodnota C), tím méně každé stránce předá. Tím, že stránka obsahuje odkazy, o svůj PR nepřichází. Spíše než o "předávání" bych měl mluvit o "kopírování" nebo "přeposílání" PageRanku. Čím méně má stránka odkazů, tím víc Page Ranku se každým odkazem přeposílá. PageRank nijak nezávisí na hledaném slově (je to veličina skalární). Page Rank má každá jednotlivá stránka (URL), nikoliv celý web dohromady (site, doména). Čím má stránka vyšší PageRank, tím bude pravděpodobně výše ve výsledcích. Pozor! Page Rank zdaleka není jediné kritérium pro nalezení stránky v Google. Poslední dobou kolem Page Ranku vypukla na webu doslova hysterie. Page Rank je jistě velmi důležitý, ale jeho význam je podle mého názoru přeceňován. Moje výzkumy jednoznačně svědčí o tom, že Google používá PageRank zejména pro řízení robota (crawlera). Stránky s nízkým rankem navštěvuje zřídka. Některá nová URL ani nenavštíví, dokud jejich PR nedosáhne určité hodnoty (PR se dá počítat i pro ještě nenavštívené stránky).

Jak zjistit Page Rank své stránky

Jde to pouze přibližně. Nainstalujte si Google Toolbar, malý prográmek dostupný zdarma na Google.Google Toolbar má velmi dobrou nápovědu, ze které se dozvíte podrobnosti. Kromě jednodušší práce s hledáním se pomocí Google Toolbar přibližně dozvíte, jak velký PR má právě prohlížená stránka.

Na toolbaru se objevuje zelené měřítko Page Ranku od 0 do 10.

  • Tento PR zobrazovaný na toolbaru udávejte, až se vás někdo zeptá, jaký máte PageRank. PageRanku ve škále od 0 do 10 se říká Google Toolbar PageRank, zkracuje se do tvaru GTPR.
  • PageRank zobrazený na Toolbaru není skutečný PageRank, ale nějaká jeho odvozenina (patrně logaritmická). (GTPR šest může znamenat třeba skutečný PR=0,00000008.)
  • Pokud se ukazuje PR 0, může to znamenat dvě věci. Buďto Google stránku ještě nezná (neindexoval ji), nebo je stránka natolik nevýznamná, že má skutečně PR = 0
  • Pokud se neukazuje nic, stránka není v Google indexu nebo má toolbar na chvilku výpadek. Je potřeba to zkusit po nějakém čase znovu.

Vyčerpávající článek o Google Toolbar PageRanku jsem napsal pro Lupu. V rychlosti jenom nejdůležitější věci:

  • Hodnoty GTPR se aktualizují najednou přibližně každé tři nebo čtyři měsíce. Mladé stránky tedy mají dlouho nulu.
  • Při vyhodnocování GTPR Google z URL stránky usekne všechno, co je za otazníkem. Tomu říkám otazníkový omyl, který vede k chybnému pocitu o kvalitě dynamické stránky.
  • Máte-li v adresy dynamické (s otazníkem), skutečný GTPR takové stránky se nedozvíte.

Jak zvýšit svým stránkám PR

Postarejte se, aby na stránku vedlo co nejvíc odkazů ze stránek, které mají vysoký PR. Jinak to nejde.

Odkazům, které vedou na moji stránku, se říká zpětné odkazy (asi jako protějšek k dopředným odkazům, které jsou na mé stránce a míří pryč). Zpětné odkazy se získávají špatně, zejména pokud máte stránky horší nebo průměrné kvality.

Nejsnáze se základní zpětné odkazy získávají v katalozích. Stačí si vyhlédnout tematickou stránku nějakého katalogu a zaregistrovat do ní ručně URL a popisek stránky. Čím více registrací v různých katalozích, tím lépe. Jakmile ale nemá vyhlédnutá stránka katalogu na toolbaru PR alespoň 3, je otázka, zda má cenu mít na takové stránce odkaz.

Dobrý nápad je oslovovat spřízněné weby se žádostí o výměnu odkazů. Čím méně je na zdrojové stránce odkazů, tím je odkaz hodnotnější.

Existují matematické modely, které ukazují, jak se dá vzájemným prolinkováním stránek na určitých stránkách webu koncentrovat PR z jiných stránek. Nejčastěji se doporučuje mít na každé stránce odkaz na domovskou stránku. Je to jedna z mnoha metod a rozhodně není univerzální, někdy je dokonce kontraproduktivní (to když je na hlavní stránce málo hodnotného obsahu).

Jednoduchým výsledkem modelů je to, že by se na stránky mělo dávat co nejméně "odkazů pryč" mířících na cizí stránky ven z webu, aby se na stránkách koncentroval Page Rank. Podle mých výpočtů to ale není zas tak podstatné. Je to zbytečné škudlení. Mnohem lepšího výsledku než odstraněním vnějšího linku se dá dosáhnout přidáním další stránky s hodnotným (nejlépe unikátním) obsahem.

(c) by 2007