Hledat:

Invia.cz Last minute Tunisko Dovolená v Chorvatsku Pojeďte do Egypta Bulharsko Vydělávejte peníze s INVIA.CZ
 

Internetový vyhledávač

Internetový vyhledávač je služba, která umožňuje na Internetu najít webové stránky, které obsahují požadované informace. Uživatel zadává do rozhraní vyhledávače klíčová slova, která charakterizují hledanou informaci a vyhledávač obratem na základě své databáze vypisuje seznam odkazů na stránky, které hledané informace obsahují (text, obrázky nebo jiné typy multimediálních informací). Databáze je udržována převážně automaticky na rozdíl od internetových katalogů, které jsou udržovány převážně ručně.

Cílem vyhledávačů je poskytnout uživateli při odpovědi na dotaz co nejlepší relevantní informace, a proto různými způsoby měří kvalitu webových stránek, které mají ve své databázi (např. PageRank).

Obsah

[editovat] Jak vyhledávač pracuje

Vyhledávač pracuje z větší části automaticky, k čemuž využívá desítky až statisíce počítačů. Kvalita vyhledávače je závislá na tom, jak kvalitní dává odpovědi, tj. jestli uživatel najde hledanou informaci na prvních místech odpovědi vyhledávače. Z tohoto důvodu je nutné měřit kvalitu stránek, které vyhledávač má ve své databázi (např. PageRank u Google, S-Rank u Seznamu) a naopak majitelé stránek se snaží modifikací svých stránek dosáhnout na co nejvyšší pozice ve výstupu vyhledávače (SEO). Výsledkem je, že vyhledávač musí své metody neustále vylepšovat, aby vyhověl čím dál vyšším požadavkům svých návštěvníků.

Obecně většina internetových vyhledávačů pracuje ve třech krocích (viz odstavce níže):

  1. prohledání webových stránek
  2. indexování
  3. vyhledávání

[editovat] Prohledání webových stránek

Pro prohledání webových stránek má internetový vyhledávač automatický program, tzv. vyhledávací robot (bot nebo též spider – „pavouk“), který prochází celý Web. Procházení Webu se dělá tak, že robot dostane na začátku seznam atraktivních vstupních míst (odkazů), jejichž obsah si přečte, uloží na disk do databáze a zapamatuje si navštívenou adresu odkazu, aby se na ni již podruhé nevracel. Z obsahu stažené stránky vybere seznam všech obsažených odkazů a opět všechny odkazy navštíví. Cyklus návštěvy, sesbírání odkazů a dalších návštěv se stále opakuje. Robot se na navštívené stránky vrací v pravidelných intervalech, aby zjistil, zda se na stránce neobjevily nějaké nové informace. Vyhledávač shromažďuje obrovské množství dat, a proto není jednoduché ho naprogramovat a technicky zajistit.

[editovat] Indexování

Databázi obsahující uložené obsahy navštívených stránek je potřeba indexovat, aby bylo možné podle zadaných slov co nejrychleji najít adresy stránek, které je obsahují. Zároveň je nutné vystavět index tak, aby poskytoval na prvních místech stránky s nejvyšší užitnou hodnotou (relevancí, mající nejvyšší hodnocení kvality, nejvyšší váhu). Pro výpočet relevance se používají nejrůznější algoritmy, které jsou založeny na nejrůznějších znacích stránek a různých úhlech analýzy jejich obsahu.

Váha slov
Stránka má vyšší hodnocení, když má hledané slovo na stránce vyšší váhu. Váha slov se zvyšuje, je-li slovo v titulku stránky, nadpisu nebo blíže k začátku stránky, případně se na stránce opakuje. Váhu slov lze zneužít vkládáním „zajímavých“ slov do obsahu stránky bez ohledu na její skutečný obsah nebo prostým opakováním slov. Vyhledávač se brání penalizací (snížením kvality) podezřelých stránek.
Atraktivita stránky
Stránka má vyšší hodnocení, když na ni odkazuje více jiných stránek, protože zřejmě obsahuje zajímavé informace. Atraktivitu lze zneužít vytvářením falešných stránek, které odkazují na stránku, která má získat vyšší hodnocení. Vyhledávač se brání sledováním podezřelého náhlého hromadění odkazů.
Serióznost Webu
Webové servery, které obsahují velké množství kvalitních stránek, jsou při výpočtu váhy zvýhodněny. Seznam se může udržovat i ručními zásahy.
Sponzorované odkazy
Váha odkazu se zvyšuje zaplacením poplatku. Seriózní vyhledávače se této praxi vyhýbají nebo zřetelně oddělují výsledky zobrazené na základě komerčního zvýhodnění. Tento způsob je jedním z možných zdrojů příjmů vyhledávače.
Technická kvalita
Váha odkazu se zvyšuje, pokud jsou stránky správně sestaveny a vyhovují webovým standardům.

[editovat] Vyhledávání

Databáze a její index se zpřístupní na vstupní stránce vyhledávače. Uživatel získá po zadání hledaných slov seznam adres, na kterých robot hledaná slova našel. Pro vyšší přehlednost se zobrazuje kromě odkazu ještě titulek stránky, a okolí nalezených slov.

[editovat] Aktuálnost databáze

Z principu práce vyhledávače vyplývá, že nikdy nemá úplně aktuální informace, ale prezentuje je se zpožděním. Robot navštěvuje zajímavé adresy co nejčastěji (např. zpravodajské servery) nebo se dokonce uzavírá smlouva o snadnějším zpřístupnění obsahu pro robota. Pro vyšší efektivitu se databáze aktualizuje po částech nebo průběžně nebo se co nejčastěji aktualizují alespoň nejzajímavější a nejčastěji hledané informace.

[editovat] Nežádoucí aktivity robotů

Někdy je nežádoucí, aby robot indexoval některé stránky. Proto existuje možnost, jak roboty omezit pomocí souboru robots.txt, který se umisťuje do kořene webového serveru.

[editovat] SEO

Technika, která dokáže stránky upravit tak, aby se co nejlépe umístily ve výsledcích vyhledávání, se nazývá SEO (anglicky Search Engine Optimization) a v poslední době je velmi žádanou službou. SEO techniky se rozlišují na „povolené“ a „zakázané“ (tzv. Black Hat SEO, které vyhledávače tvrdě postihují například vyřazením ze svého indexu), avšak z hlediska vyhledávačů je jakékoliv umělé zlepšování umístění ve výsledcích vyhledávání nežádoucí (snad kromě případů, kdy robot stránce z nějakého důvodu nerozumí).

Podrobnější informace naleznete v článku Search Engine Optimization.

Na podobném principu funguje i tzv. Google bomba, která umožňuje do výsledků vyhledávání zahrnout i stránky, které hledané slovo neobsahují.

[editovat] Nejznámější vyhledávače

[editovat] Ve světě

[editovat] V České Republice

[editovat] Historie

[editovat] Externí odkazy

 
Internetový vyhledávač v jiných jazycích: Afrikaans, العربية, Български, Bosanski, Català, Dansk, Deutsch, Ελληνικά, English, Esperanto, Español, Euskara, Estremeñu, فارسی, Suomi, Français, Galego, עברית, Hrvatski, Magyar, Interlingua, Bahasa Indonesia, Italiano, 日本語, 한국어, Latviešu, Македонски, Bahasa Melayu, Nederlands, ‪Norsk (nynorsk)‬, ‪Norsk (bokmål)‬, Polski, Português, Română, Русский, Sicilianu, Simple English, Српски / Srpski, Svenska, தமிழ், ไทย, Türkçe, Українська, O'zbek, Tiếng Việt, 中文
Tento článek je převzat z české wikipedie - otevřené encyklopedie, originální článek naleznete na adrese: „http://cs.wikipedia.org/wiki/Internetov%C3%BD_vyhled%C3%A1va%C4%8D
Stránka byla naposledy upravena v Stránka byla naposledy editována 7. 11. 2008 v 11:41.
Veškerý text je dostupný za podmínek GNU Free Documentation License (Autorské právo pro podrobnosti).
Další služby: Portál | Katalog | Hledej | Zprávy | Počasí | Kurzy | Práce | Slovník | TV | Online hry | Java hry | SMS | Loga a melodie | Chat | Fórum | Kontakt | Set-top-boxy