Slovník pojmů

Crawler

Zkrácená definice:

Crawler (také známý jako bot, spider, vyhledávací robot) je program používaný vyhledávacími motory k prozkoumávání webu a indexaci stránek.

Plná definice:

Crawler je program nebo automatizovaný skript, který prochází webové stránky a sbírá informace, které vyhledávací motor může použít k indexaci. Tyto informace mohou zahrnovat obsah stránky, meta tagy, odkazy na jiné stránky a další relevantní data. Crawler je základním nástrojem pro vyhledávací motory jako je Google, Bing, Yandex a další.

Crawler funguje tak, že začne s listem URL adres (často nazývaným „seeds“) a prochází každou stránku, odkazy na této stránce pak přidává do svého seznamu k dalšímu prozkoumání. Tento proces se opakuje, dokud nejsou prozkoumány všechny dostupné stránky, nebo dokud nejsou vyčerpány zdroje crawlera.

Příklady z reálné situace:

Googlebot je příklad crawlera používaného Googlem k procházení a indexaci webových stránek.
Bingbot je crawler používaný vyhledávačem Bing.

Situace, které se nedoporučuje:

Některé webové stránky mohou blokovat crawlera v souboru robots.txt, což může způsobit, že tyto stránky nebudou indexovány vyhledávači. To by mělo být provedeno pouze v případech, kdy nechcete, aby byla konkrétní stránka dostupná ve výsledcích vyhledávání.

Otázky k zamyšlení:

Jak může optimalizace mé webové stránky pro crawlers zlepšit moje SEO?
Jaký obsah na mé webové stránce je nejdůležitější pro crawlers k indexaci?

Citát:

„Úspěch vaší webové stránky nezávisí na tom, kolik návštěvníků dostane, ale na tom, kolik z nich se změní na zákazníky. To je místo, kde se SEO hodí.“ – Jill Whalen

Inspirace pro další studium:

Jaké jsou nejlepší praktiky pro optimalizaci mé webové stránky pro crawlers?
Jak mohu zkontrolovat, zda crawler správně indexuje mou webovou stránku?
Jak mohu použít soubor robots.txt k řízení, jak crawlers interagují s mou webovou stránkou?