sobota, septembra 01, 2007

Google PageRank

PageRank je algoritmus pre hodnotenie relevantnosti webových stránok, navrhnutý v 1987 Larry Pagom a Sergeyom Brinom. Je základom vyhľadávača Google. V preklade je to Hodnotenie stránky, alebo tiež Pageovo hodnotenie. Podle vyjadrenia spoločnosti Google bol algoritmus pomenovaný práve po Pageovi.

Algoritmus využívá strukturu hypertextových odkazov ako vzájomné “doporučovanie” stránok. Hodnotenie stránky sa nepočíta len z prostého počtu odkazov, ktoré na ňu ukazujú, ale berie do úvahi aj hodnotenie odkazujúcich stránok.

Ak teda chceme spočítať PageRank R(a) stránky a, môžeme použiť vzorec, ktorý vyzerá asi takto:

kde Ba je množina všetkých stránok, ktoré odkazujú na a, a Nu je počet odkazov, ktoré vedú z u. Každá stránka tak svoje hodnotenie v podstate predáva ďalej cez odkazy.

Rovnica sa ešte upravuje normalizujúcim faktorom c tak, aby súčet všetkých hodnotení bol konštantný:

Problémom pri výpočte PageRanku sú uzavrené štruktúry stránok, pri ktorých vedú odkazy dnu, ale už nie von. Napríklad dve vzájomne prepojené stránky, s odkazom vedúcim zvonka na jednu z nich, by pri výpočte PageRank akumulovali, ale nič by nepúšťaly von (pretože nie je kade). Tým vzniká akási pasca, ktorú Page a Brin nazývajú rank sink. Aj preto je PageRank vzorec ešte zložitejší, lebo zabraňuje práve týmto sinkom.
Ak chcete reálne vypočítať PageRank svojej stránky nepomôže vám nič iné ako Google Toolbar. Nie je to ale úplne presné a zatiaľ existuje len na IE a Mozzilu. Vyzerá to asi takto:



PageRank je obchodná značka Google, Inc. a algoritmus je patentovaný (Patent v USA 6285999) Stanfordskou Univerzitou.

Pre tvorcov webových stránok to znamená toľko, že čím väčší je náš PageRank, tým väčšiu dôležitosť stránke prideľuje Google. A čím je dôležitosť väčšia, tým vyššie je umiestnenie medzi výsledkami vyhľadávania. Samozrejme to nie je jediné kritérium, ktoré stránky posúva medzi výsledkami vyššie, Google ich má cca 100. Druhou výhodou je, že vyhľadávač prehľadáva najviac stránky, ktoré majú najväčší PageRank. Google aktualizuje PageRank cca v 3-mesačnom intervale.

Je treba priznat, že toto je len teória a nikdo s výnimkou najhlbších zamestnancov Googlu nevie, na čo presne PageRank je.

Odkazy:
Anglická Wikipédia
Slovenská Wikipédia
Vysvetlenie na JakPsatWeb.cz
Článok o Toolbarovom PageRanku

5 komentárov:

Anonymný povedal(a)...

WTF?
A čo s tým? ^^

Yreg Yorulis povedal(a)...

Ty nič.

Anonymný povedal(a)...

Aj tak je to vzrušujúce...

Anonymný povedal(a)...

...please where can I buy a unicorn?

Anonymný povedal(a)...

Hvala za zanimljive informacije