Jdi na obsah Jdi na menu
 


Software, PageRank

 Program nazývaný Googlebot pravidelně žádá aktuální verze všech webových stránek, o kterých ví. Pokud na nějaké stránce nalezne (hypertextový) odkaz na jemu dosud neznámou stránku, přidá ji do své databáze. Načtené stránky ukládá do svého archívu, ve kterém je pak analyzuje a indexuje, čímž umožňuje jejich rychlé prohledávání. Data archívu a indexů zabírají několik terabytů.

Pro hodnocení stránek, které odpovídají zadanému hledanému výrazu, používá Google algoritmus nazývaný PageRank. Ten spočívá v tom, že se pro každou indexovanou stránku rekurzivním postupem vypočítá specifická hodnota, závislá na tom, kolik (a jak významných) stránek na tuto stránku odkazuje. Hojně odkazované stránky jsou považovány za důležitější, takže jsou ve výsledcích vyhledávání uvedeny na předních místech. Kromě tohoto základního kritéria používá Google mnoho dalších vlastností, z nichž některé nejsou ani veřejně známy.

Google dokáže indexovat nejenom textové a HTML stránky, ale také dokumenty ve dvanácti dalších formátech (např. PDFPostScriptMicrosoft WordMicrosoft Excel či Shockwave Flash).

 

Komentáře

Přidat komentář

Přehled komentářů

Zatím nebyl vložen žádný komentář