Jak fungují vyhledávače

Dobrý den, milí čtenáři!

V současné době je v globálním internetovém prostoru poměrně hodně vyhledávačů. Každý z nich má své vlastní algoritmy pro indexování a hodnocení stránek, ale obecně je princip vyhledávačů velmi podobný.

Znalost fungování vyhledávače v rychle rostoucí konkurenci je významnou výhodou při propagaci nejen komerčních, ale i informačních stránek a blogů. Tyto znalosti vám pomohou vytvořit účinnou strategii optimalizace webových stránek a s menším úsilím se dostat na TOP výsledky vyhledávání pro propagované skupiny dotazů.

Účelem práce optimalizátoru je „přizpůsobit“ propagované stránky vyhledávacím algoritmům a pomoci tak těmto stránkám dosáhnout vysokých pozic pro určité dotazy. Před zahájením práce na optimalizaci webu nebo blogu je však nutné alespoň povrchně porozumět zvláštnostem práce vyhledávačů, abychom pochopili, jak mohou reagovat na akce prováděné optimalizátorem.

Detailní detaily tvorby výsledků vyhledávání jsou samozřejmě informace, které vyhledávače nezveřejňují. Pro správné vyhledávání však stačí pochopení hlavních principů, podle kterých vyhledávače fungují.

Metody vyhledávání informací

Dvě hlavní metody, které dnes vyhledávače používají, se liší v přístupu k získávání informací.

Algoritmus přímého vyhledávání, která zahrnuje spárování každého z dokumentů uložených v databázi vyhledávače s klíčovou frází (dotaz uživatele), je poměrně spolehlivou metodou, která vám umožní najít všechny potřebné informace. Nevýhodou této metody je, že při prohledávání velkých datových souborů je čas potřebný k nalezení odpovědi poměrně dlouhý.
Algoritmus obráceného indexu, kdy je klíčová fráze spojena se seznamem dokumentů, ve kterých se vyskytuje, je vhodná při interakci s databázemi obsahujícími desítky a stovky milionů stránek. S tímto přístupem se vyhledávání neprovádí ve všech dokumentech, ale pouze ve speciálních souborech, včetně seznamů slov obsažených na webových stránkách. Každé slovo v takovém seznamu je doprovázeno uvedením souřadnic pozic, kde se vyskytuje, a dalších parametrů. Právě tato metoda se dnes používá v práci takových známých vyhledávačů, jako jsou Yandex a Google.

Zde je třeba poznamenat, že když uživatel vstoupí do vyhledávací lišty prohlížeče, vyhledávání se neprovádí přímo na internetu, ale v předem shromážděných, uložených a aktuálně relevantních databázích obsahujících bloky informací zpracovávaných vyhledávači (webové stránky) . Rychlé generování výsledků vyhledávání je možné díky práci s reverzními indexy.

Textový obsah stránek (přímé indexy) také ukládají vyhledávače a slouží k automatickému generování úryvků z textových fragmentů, které jsou pro požadavek nejvhodnější.

Matematický klasifikační model

Pro urychlení vyhledávání a zjednodušení procesu generování výsledků, které nejlépe vyhovují požadavku uživatele, se používá určitý matematický model. Úkolem tohoto matematického modelu je vyhledat potřebné stránky v aktuální databázi reverzních indexů, posoudit jejich míru shody s požadavkem a rozdělit je v sestupném pořadí podle relevance.

Pouhé nalezení požadované fráze na stránce nestačí. Při určení pomocí vyhledávačů se váha dokumentu vypočítá vzhledem k požadavku uživatele. Pro každý požadavek je tento parametr vypočítán na základě následujících údajů: frekvence použití na analyzované stránce a koeficient odrážející, jak zřídka se stejné slovo objeví v jiných dokumentech v databázi vyhledávače. Součin těchto dvou veličin odpovídá hmotnosti dokumentu.

Prezentovaný algoritmus je samozřejmě velmi zjednodušený, protože vyhledávače mají k dispozici řadu dalších doplňkových koeficientů, které se používají při výpočtech, ale to nic nemění na významu. Čím častěji se v dokumentu objeví jediné slovo z uživatelského dotazu, tím vyšší je jeho váha. V tomto případě je textový obsah stránky považován za spam při překročení určitých limitů, které jsou pro každý požadavek jiné.

Základní funkce vyhledávače

Všechny existující vyhledávací systémy jsou navrženy tak, aby vykonávaly několik důležitých funkcí: vyhledávání informací, jejich indexování, kvalitativní hodnocení, správné hodnocení a generování výsledků vyhledávání. Prvořadým úkolem každého vyhledávače je poskytnout uživateli informace, které hledá, a co nejpřesnější odpověď na konkrétní požadavek.

Vzhledem k tomu, že většina uživatelů nemá ponětí, jak internetové vyhledávače fungují a možnost naučit uživatele „správně“ vyhledávat je velmi omezená (například pomocí tipů pro vyhledávání), jsou vývojáři nuceni vylepšovat samotné vyhledávání. Ten zahrnuje vytvoření algoritmů a principů fungování vyhledávačů, které umožňují najít požadované informace bez ohledu na to, jak „správně“ je vyhledávací dotaz formulován.

Snímání

Jedná se o sledování změn v již indexovaných dokumentech a hledání nových stránek, které mohou být prezentovány ve výsledcích vyhledávání pro požadavky uživatelů. Vyhledávače skenují zdroje na internetu pomocí specializovaných programů nazývaných pavouci nebo vyhledávací roboti.

Skenování internetových zdrojů a sběr dat provádějí automaticky vyhledávací roboti. Po první návštěvě webu a jeho zařazení do vyhledávací databáze začnou roboti pravidelně navštěvovat tento web, aby sledovali a zaznamenávali změny, ke kterým došlo v obsahu.

Vzhledem k tomu, že počet rozvojových zdrojů na internetu je velký a každý den se objevují nové stránky, popsaný proces se nezastaví ani na minutu. Tento princip fungování internetových vyhledávačů jim umožňuje mít vždy aktuální informace o stránkách dostupných na internetu a jejich obsahu.

Hlavním úkolem vyhledávacího robota je vyhledat nová data a přenést je do vyhledávače k dalšímu zpracování.

Indexování

Vyhledávač je schopen najít data pouze o stránkách zastoupených v jeho databázi – jinými slovy indexovaných. V tomto kroku musí vyhledávač určit, zda mají být nalezené informace vloženy do databáze, a pokud ano, do které sekce. Tento proces se také provádí automaticky.

Předpokládá se, že Google indexuje téměř všechny informace dostupné na internetu, zatímco Yandex přistupuje k indexování obsahu selektivněji a ne tak rychle. Oba vyhledávací giganti Runet pracují ve prospěch uživatele, ale obecné principy fungování vyhledávačů Google a Yandex jsou poněkud odlišné, protože jsou založeny na jedinečných softwarových řešeních, která tvoří každý systém.

Společným bodem pro vyhledávače je, že proces indexování všech nových zdrojů trvá déle než indexování nového obsahu na stránkách, které systém zná. Informace objevující se na stránkách, které jsou vysoce důvěryhodnými vyhledávači, skončí v indexu téměř okamžitě.

V rozsahu

Hodnocení je hodnocení významnosti indexovaných dat pomocí algoritmů vyhledávačů a jejich uspořádání podle faktorů specifických pro daný vyhledávač. Přijaté informace jsou zpracovávány za účelem generování výsledků vyhledávání pro celý rozsah uživatelských dotazů. To, jaké informace budou uvedeny nad a pod ve výsledcích vyhledávání, je zcela určeno tím, jak funguje vybraný vyhledávač a jeho algoritmy.

Stránky v databázi vyhledávačů jsou rozděleny do témat a skupin dotazů. Pro každou skupinu požadavků je vygenerován předběžný výstup, který podléhá další úpravě. Pozice většiny webů se mění po každé aktualizaci SERP – aktualizace hodnocení, ke které dochází denně na Googlu a každých pár dní ve vyhledávání Yandex.

Člověk jako asistent v boji za kvalitu dodávky

Realita je taková, že i ty nejpokročilejší vyhledávače, jako jsou Yandex a Google, v současnosti stále vyžadují lidskou pomoc, aby generovaly výsledky, které splňují přijaté standardy kvality. V případě, že vyhledávací algoritmus nefunguje dostatečně dobře, jsou jeho výsledky upraveny ručně – posouzením obsahu stránky podle více kritérií.

Velká armáda speciálně vyškolených lidí z různých zemí – moderátoři vyhledávačů (posuzovatelé) – musí každý den vykonat obrovské množství práce, aby kontrolovali shodu webových stránek s požadavky uživatelů, filtrovali výsledky od spamu a zakázaného obsahu (texty, obrázky , videa). Práce hodnotitelů umožňuje čistší výsledky vyhledávání a přispívá k dalšímu rozvoji samoučících se vyhledávacích algoritmů.

Závěr

S rozvojem internetu a postupnou změnou standardů a forem prezentace obsahu se mění i přístup k vyhledávání, zdokonalují se procesy indexování a řazení informací, používané algoritmy a objevují se nové faktory řazení. To vše umožňuje vyhledávačům generovat ty nejkvalitnější výsledky, které jsou adekvátní požadavkům uživatelů, ale zároveň to komplikuje život webmasterům a specialistům, kteří se podílejí na propagaci webových stránek.

V komentářích pod článkem vás zvu, abyste promluvili o tom, který z hlavních vyhledávačů RuNet - Yandex nebo Google, podle vašeho názoru funguje lépe, poskytuje uživateli lepší vyhledávání a proč.

Dlouho se staly nedílnou součástí ruského internetu. Vyhledávače jsou dnes obrovské a složité mechanismy, které představují nejen nástroj pro vyhledávání informací, ale také lákavé oblasti pro podnikání.

Většina uživatelů vyhledávačů nikdy nepřemýšlela (nebo o tom nepřemýšlela, ale nenašla odpověď) nad principem fungování vyhledávačů, schématem zpracování uživatelských požadavků, z čeho se tyto systémy skládají a jak fungují...

Tato hlavní třída je navržena tak, aby odpověděla na otázku, jak fungují vyhledávače. Nenajdete zde však faktory, které ovlivňují pořadí dokumentů. Kromě toho byste neměli počítat s podrobným vysvětlením algoritmu Yandex. Podle Ilji Segaloviče, ředitele technologie a vývoje vyhledávače Yandex, může být rozpoznán pouze „na mučení“ samotným Ilyou Segalovičem...

2. Pojem a funkce vyhledávače

Vyhledávací systém je softwarový a hardwarový komplex určený k prohledávání internetu a odpovídání na požadavek uživatele, specifikovaný ve formě textové fráze (vyhledávací dotaz), vytvořením seznamu odkazů na zdroje informací v pořadí podle relevance ( v souladu s žádostí). Největší mezinárodní vyhledávače: "Google", Yahoo , MSN . Na ruském internetu jsou to Yandex, Rambler, Aport.

Podívejme se blíže na koncept vyhledávacího dotazu pomocí vyhledávače Yandex jako příkladu. Vyhledávací dotaz by měl uživatel formulovat v souladu s tím, co chce najít, co nejstručněji a nejjednodušeji. Řekněme, že chceme v Yandexu najít informace o tom, jak vybrat auto. Chcete-li to provést, otevřete hlavní stránku Yandex a zadejte text vyhledávacího dotazu „jak si vybrat auto“. Dále je naším úkolem otevřít odkazy poskytnuté na naši žádost na zdroje informací na internetu. Je však dost možné, že potřebné informace nenajdeme. Pokud k tomu dojde, pak buď musíte svůj požadavek přeformulovat, nebo databáze vyhledávačů skutečně nemá k našemu požadavku žádné relevantní informace (to se může stát při velmi „úzkých“ dotazech, jako např. „jak si vybrat auto v Archangelsku“)

Primárním cílem každého vyhledávače je doručit lidem přesně ty informace, které hledají. A naučit uživatele zadávat „správné“ požadavky do systému, tzn. dotazy, které jsou v souladu s principy fungování vyhledávačů, jsou nemožné. Vývojáři proto vytvářejí algoritmy a provozní principy pro vyhledávače, které uživatelům umožní najít informace, které hledají.

To znamená, že vyhledávač musí „myslet“ stejně jako uživatel při vyhledávání informací. Když uživatel zadá požadavek do vyhledávače, chce co nejrychleji a nejsnáze najít to, co potřebuje. Po obdržení výsledku vyhodnotí výkon systému podle několika základních parametrů. Našel, co hledal? Pokud to nenašel, kolikrát musel dotaz přeformulovat, aby našel, co hledal? Kolik relevantních informací mohl najít? Jak rychle vyhledávač zpracoval dotaz? Jak pohodlné byly zobrazeny výsledky vyhledávání? Byl výsledek, který jste hledali, první nebo stý? Kolik zbytečných odpadků bylo nalezeno spolu s užitečnými informacemi? Budou potřebné informace nalezeny při přístupu do vyhledávače řekněme za týden nebo za měsíc?

Aby vývojáři vyhledávačů uspokojili všechny tyto otázky odpověďmi, neustále vylepšují vyhledávací algoritmy a principy, přidávají nové funkce a schopnosti a snaží se všemi možnými způsoby urychlit provoz systému.

3. Hlavní vlastnosti vyhledávače

Pojďme si popsat hlavní vlastnosti vyhledávačů:

Úplnost
Úplnost je jednou z hlavních charakteristik vyhledávacího systému, což je poměr počtu dokumentů nalezených žádostí k celkovému počtu dokumentů na internetu, které danou žádost splňují. Pokud je například na internetu 100 stránek obsahujících frázi „jak si vybrat auto“ a pro odpovídající dotaz bylo nalezeno pouze 60 z nich, bude úplnost vyhledávání 0,6. Je zřejmé, že čím je vyhledávání úplnější, tím je menší pravděpodobnost, že uživatel nenajde požadovaný dokument, za předpokladu, že na internetu vůbec existuje.
Přesnost
Přesnost je další hlavní charakteristikou vyhledávače, která je dána mírou, do jaké se nalezené dokumenty shodují s dotazem uživatele. Pokud například dotaz „jak vybrat auto“ obsahuje 100 dokumentů, 50 z nich obsahuje frázi „jak si vybrat auto“ a zbytek jednoduše obsahuje tato slova („jak vybrat správné rádio a nainstalovat jej do auto“), pak se přesnost vyhledávání považuje za rovnou 50/100 (=0,5). Čím přesnější je vyhledávání, tím rychleji uživatel najde potřebné dokumenty, tím méně různých druhů „odpadků“ mezi nimi najde, tím méně často nalezené dokumenty nebudou odpovídat požadavku.
Relevantnost
Neméně důležitou složkou vyhledávání je relevance, která je charakterizována dobou, která uplyne od okamžiku zveřejnění dokumentů na internetu do jejich zadání do indexové databáze vyhledávačů. Například den poté, co se objevily zajímavé zprávy, se velké množství uživatelů obrátilo na vyhledávače s relevantními dotazy. Objektivně neuplynul ani den od zveřejnění zpravodajských informací na toto téma, ale hlavní dokumenty již byly indexovány a dostupné pro vyhledávání, a to díky existenci tzv. „rychlé databáze“ velkých vyhledávačů, které je aktualizován několikrát denně.
Rychlost vyhledávání
Rychlost vyhledávání úzce souvisí s jeho odolností vůči zátěži. Například podle Rambler Internet Holding LLC dnes během pracovní doby vyhledávač Rambler přijímá asi 60 požadavků za sekundu. Taková pracovní zátěž vyžaduje zkrácení doby zpracování jednotlivého požadavku. Zde se zájmy uživatele a vyhledávače shodují: návštěvník chce získat výsledky co nejrychleji a vyhledávač musí požadavek zpracovat co nejrychleji, aby nezpomaloval výpočet následných dotazů.
Viditelnost

4. Stručná historie vývoje vyhledávačů

V počátečním období rozvoje internetu byl počet jeho uživatelů malý a množství dostupných informací relativně malé. Přístup k internetu měli většinou pouze výzkumní pracovníci. V této době nebylo hledání informací na internetu tak naléhavé jako nyní.

Jedním z prvních způsobů, jak organizovat přístup k síťovým informačním zdrojům, bylo vytvoření otevřených adresářů stránek, odkazů na zdroje, ve kterých byly seskupeny podle tématu. Prvním takovým projektem byl web Yahoo.com, který byl otevřen na jaře roku 1994. Poté, co se výrazně zvýšil počet stránek v katalogu, přibyla možnost vyhledávat potřebné informace v katalogu. V plném smyslu to ještě nebyl vyhledávač, protože oblast vyhledávání byla omezena pouze na zdroje v katalogu, nikoli na všechny internetové zdroje.

Adresáře odkazů byly v minulosti široce používány, ale v současnosti téměř úplně ztratily svou popularitu. Protože i moderní katalogy, které mají obrovský objem, obsahují informace pouze o zanedbatelné části internetu. Největší adresář sítě DMOZ (nazývaný také Open Directory Project) obsahuje informace o 5 milionech zdrojů, zatímco databázi vyhledávače Google tvoří více než 8 miliard dokumentů.

V roce 1995 se objevily vyhledávače Lycos a AltaVista. Poslední jmenovaný je již řadu let lídrem v oblasti vyhledávání informací na internetu.

V roce 1997 vytvořili Sergey Brin a Larry Page vyhledávač Google jako součást výzkumného projektu na Stanfordské univerzitě. Google je v současnosti nejpopulárnější vyhledávač na světě!

V září 1997 byl oficiálně oznámen vyhledávač Yandex, který je nejpopulárnější na ruskojazyčném internetu.

V současné době existují tři hlavní vyhledávače (mezinárodní) – Google, Yahoo a, které mají své vlastní databáze a vyhledávací algoritmy. Většina ostatních vyhledávačů (kterých je velké množství) používá v té či oné podobě výsledky ze tří uvedených. Například vyhledávání AOL (search.aol.com) používá databázi Google, zatímco AltaVista, Lycos a AllTheWeb používají databázi Yahoo.

5. Složení a principy fungování vyhledávacího systému

V Rusku je hlavním vyhledávačem Yandex, následovaný Rambler.ru, Google.ru, Aport.ru, Mail.ru. V současné době navíc Mail.ru používá vyhledávač a databázi Yandex.

Téměř všechny velké vyhledávače mají svou vlastní strukturu, odlišnou od ostatních. Je však možné identifikovat hlavní součásti společné všem vyhledávačům. Rozdíly ve struktuře mohou být pouze ve formě implementace mechanismů interakce těchto složek.

Indexovací modul

Indexovací modul se skládá ze tří pomocných programů (robotů):

Spider je program určený ke stahování webových stránek. Pavouk stáhne stránku a načte z ní všechny interní odkazy. Stáhne se html kód každé stránky. Roboti používají ke stahování stránek protokoly HTTP. Pavouk funguje následovně. Robot odešle na server požadavek „get/path/document“ a některé další příkazy HTTP požadavku. V reakci na to robot obdrží textový proud obsahující servisní informace a samotný dokument.

URL stránky
datum stažení stránky
HTTP hlavička odpovědi serveru
tělo stránky (html kód)

Crawler („cestující“ pavouk) je program, který automaticky sleduje všechny odkazy nalezené na stránce. Vybere všechny odkazy na stránce. Jeho úkolem je určit, kam má pavouk jít dál, na základě odkazů nebo na základě předem určeného seznamu adres. Crawler podle nalezených odkazů vyhledává nové dokumenty, které vyhledávač dosud nezná.

Indexer (robot indexer) je program, který analyzuje webové stránky stažené pavouky. Indexátor analyzuje stránku na jednotlivé části a analyzuje je pomocí vlastních lexikálních a morfologických algoritmů. Analyzují se různé prvky stránky, jako je text, nadpisy, odkazy, strukturální a stylové prvky, speciální servisní HTML značky atd.

Modul indexování vám tedy umožňuje procházet danou sadu zdrojů pomocí odkazů, stahovat nalezené stránky, extrahovat odkazy na nové stránky z přijatých dokumentů a provádět kompletní analýzu těchto dokumentů.

Databáze

Databáze nebo index vyhledávače je systém ukládání dat, informační pole, ve kterém jsou uloženy speciálně převedené parametry všech dokumentů stažených a zpracovaných indexovacím modulem.

Vyhledávací server

Vyhledávací server je nejdůležitějším prvkem celého systému, protože kvalita a rychlost vyhledávání přímo závisí na algoritmech, které jsou základem jeho fungování.

Vyhledávací server funguje následovně:

Požadavek přijatý od uživatele je podroben morfologické analýze. Pro každý dokument obsažený v databázi se vygeneruje informační prostředí (které se následně zobrazí ve formě, tedy textové informace odpovídající požadavku na stránce s výsledky vyhledávání).
Přijatá data jsou předávána jako vstupní parametry speciálnímu hodnotícímu modulu. Data jsou zpracovávána pro všechny dokumenty, v důsledku čehož má každý dokument své vlastní hodnocení, které charakterizuje relevanci dotazu zadaného uživatelem a různé součásti tohoto dokumentu uložené v indexu vyhledávače.
V závislosti na volbě uživatele může být toto hodnocení upraveno dalšími podmínkami (například tzv. „pokročilé vyhledávání“).
Dále se vygeneruje úryvek, to znamená pro každý nalezený dokument se z tabulky dokumentu extrahuje název, krátký abstrakt, který nejlépe odpovídá dotazu, a odkaz na samotný dokument a nalezená slova se zvýrazní.
Výsledné výsledky vyhledávání jsou uživateli předány ve formě SERP (Search Engine Result Page) – stránky s výsledky vyhledávání.

Jak vidíte, všechny tyto komponenty spolu úzce souvisejí a fungují v interakci a tvoří jasný, poměrně složitý mechanismus pro fungování vyhledávacího systému, který vyžaduje obrovské množství zdrojů.

6. Závěr

Nyní si shrňme vše výše uvedené.

Primárním cílem každého vyhledávače je doručit lidem přesně ty informace, které hledají.
Hlavní vlastnosti vyhledávačů:
1. Úplnost
2. Přesnost
3. Relevantnost
4. Rychlost vyhledávání
5. Viditelnost
Prvním plnohodnotným vyhledávačem byl projekt WebCrawler, publikovaný v roce 1994.
Vyhledávací systém obsahuje následující součásti:
1. Indexovací modul
2. Databáze
3. Vyhledávací server

Doufáme, že naše mistrovská třída vám umožní lépe se seznámit s konceptem vyhledávače a lépe porozumět hlavním funkcím, vlastnostem a principům fungování vyhledávačů.

S nárůstem cenzury a dohledu jsou alternativy k Google a Yandex pro uživatele stále zajímavější. Řekneme vám o třech vyhledávačích bez omezení, které o vás neshromažďují osobní údaje, ale naopak chrání vaše soukromí.

Úvodní stránka: Nejdiskrétnější vyhledávač na světě

Startpage.com se nazývá „nejdiskrétnějším vyhledávačem na světě“. Od roku 2016 je služba sloučena s webem Ixquick. Jako důkaz bezpečnosti svého vyhledávání se Startpage.com účtuje jako jediný vyhledávač s certifikátem ochrany osobních údajů EU.

Startpage.com slibuje, že nebude ukládat IP adresy uživatelů a podle službynepoužívá soubory cookie ke sledování. Startpage.com je navíc přístupný ze sítě Tor.Servery vyhledávačů se nacházejí v Nizozemsku.

Stránka má pohodlnou funkci:Výsledky vyhledávání lze prohlížet pomocí volby Proxy, která šifruje připojení k odpovídající webové stránce pomocí proxy serveru. Jedná se tedy o skutečný vyhledávač bez omezení: můžete bezpečně zobrazit, co váš poskytovatel blokuje.

Vyhledávací servery proxy: Úvodní stránka snadno obchází blokování Yandex.DNS

Hlavní funkcí Startpage jsou vyhledávací servery proxy, které z ní činí vyhledávač bez cenzury. Pokud potřebujete hledat bez blokování, tato služba je pro vás.

DuckDuckGo: anonymní vyhledávač z USA

DuckDuckGo je nejrozšířenější zabezpečená alternativa ke Googlu s více než deseti miliony vyhledávání denně.I když se servery vyhledávače nacházejí v USA, DuckDuckGo.com stále nabízí některé zajímavé funkce.

Při vyhledávání přes DuckDuckGo.com se vaše IP adresa neuloží. Systém takéNepoužívá soubory cookie ke sledování.DuckDuckGo používá šifrování HTTPS. Přes síť Tor můžete také zadat dotaz do vyhledávače. Můžete také použít různá témata k přizpůsobení vzhledu stránky vyhledávání.

Zde nemůžete otevírat webové stránky přes proxy. Ale s přihlédnutím k tomu, že systém je mimo jurisdikci Ruské federace, nevztahuje se na něj například „právo být zapomenut“ ve smyslu, v jakém je chápán u nás.Výsledky vyhledávání nemusí být dokonalé, ale přesto jsou docela užitečné.

Právo být zapomenut: DuckDuckGo najde stránky s kompromitujícími důkazy blokovanými v Ruské federaci. Google – pouze novinky

Tato služba je vhodná spíše pro ty, kteří si cení především anonymity a vyhledávání bez sledování. Nebo pro ty, kteří chtějí najít informace vyloučené z výsledků vyhledávání v Ruské federaci. Měli bychom vás však varovat: v Rusku se DuckDuckGo stal partnerem Yandexu, takže můžete očekávat vše.

notEvil: Internetové vyhledávání, které neexistuje

Vyhledávač notEvil vám umožňuje prohledávat internet pomocí anonymní sítě Tor. K tomu nemusíte instalovat žádný další software (ačkoli jej budete potřebovat k otevření výsledků vyhledávání).

Tento vyhledávač umožňuje vyhledávat na tzv. darknetu – té části internetu, která je pro běžného uživatele obvykle nedostupná. Kvůli blokování se do něj postupně přesouvají užitečné služby například pro stahování obsahu.

Většina webových vyhledávačů na Tor bezostyšně vydělává peníze z reklamy: od Tor získáte výsledky a navíc - hrstku reklam a sledování zdarma. notEvil to zásadně nedělá. Je jasné, že se zde vůbec nebavíme o IP sledování a používání cookies.

notEvil: pomáhá vám najít věci v Tor, které možná na internetu neexistují

Stránka bude užitečná pro ty, kteří se chtějí seznámit s obsahem neviditelného internetu; tvrdá anonymita zaručena. Mimochodem, doporučujeme okamžitě uložit odkaz do záložek - adresy URL v kategorii „Tor-to-web“ jsou z hlediska zapamatování velmi nepřátelské.

Anonymní vyhledávače jako bezpečná alternativa ke Google

Všechny tři vyhledávače nezaznamenávají vaši IP adresu ani nepoužívají soubory cookie ke sledování. Šifrování pomocí HTTPS zajišťují všichni jmenovaní poskytovatelé.

Nejlepší výsledky vyhledávání v testu vykázal vyhledávač DuckDuckGo a při výběru alternativního vyhledávače se systémem Startpage.com získáte zaručenou jistotu. Certifikace EU na ochranu dat potvrzuje, že vyhledávač dostojí svému slibu anonymity vyhledávání. NotEvil je zase užitečný pro prohledávání darknetu.

co to je

DuckDuckGo je poměrně známý open source vyhledávač. Servery jsou umístěny v USA. Kromě vlastního robota využívá vyhledávač výsledky z jiných zdrojů: Yahoo, Bing, Wikipedia.

Ten lepší

DuckDuckGo se staví jako vyhledávač, který poskytuje maximální soukromí a důvěrnost. Systém neshromažďuje žádná data o uživateli, neukládá protokoly (žádná historie vyhledávání) a používání cookies je maximálně omezeno.

DuckDuckGo neshromažďuje ani nesdílí osobní údaje od uživatelů. Toto jsou naše zásady ochrany osobních údajů.
Gabriel Weinberg, zakladatel DuckDuckGo

Proč to potřebuješ?

Všechny velké vyhledávače se snaží personalizovat výsledky vyhledávání na základě údajů o osobě před monitorem. Tento jev se nazývá „filtrační bublina“: uživatel vidí pouze ty výsledky, které jsou v souladu s jeho preferencemi nebo které systém za takové považuje.

Vytváří objektivní obrázek, který nezávisí na vašem minulém chování na internetu, a eliminuje tematickou reklamu Google a Yandex na základě vašich dotazů. S DuckDuckGo je snadné vyhledávat informace v cizích jazycích, zatímco Google a Yandex ve výchozím nastavení upřednostňují stránky v ruštině, i když je dotaz zadán v jiném jazyce.

co to je

not Evil je systém, který prohledává anonymní síť Tor. Chcete-li jej použít, musíte přejít do této sítě, například spuštěním specializovaného .

not Evil není jediným vyhledávačem svého druhu. Existuje LOOK (výchozí vyhledávání v prohlížeči Tor, přístupné z běžného internetu) nebo TORCH (jeden z nejstarších vyhledávačů v síti Tor) a další. Rozhodli jsme se ne Zlo kvůli jasné nápovědě od Googlu (stačí se podívat na úvodní stránku).

Ten lepší

Vyhledává tam, kde jsou Google, Yandex a další vyhledávače obecně zavřené.

Proč to potřebuješ?

Síť Tor obsahuje mnoho zdrojů, které nelze nalézt na internetu, který dodržuje zákony. A jejich počet poroste, jak se vládní kontrola nad obsahem internetu zpřísní. Tor je druh sítě v rámci internetu s vlastními sociálními sítěmi, sledovači torrentů, médii, obchodními platformami, blogy, knihovnami a tak dále.

3. YaCy

co to je

YaCy je decentralizovaný vyhledávač, který funguje na principu P2P sítí. Každý počítač, na kterém je nainstalován hlavní softwarový modul, skenuje internet samostatně, to znamená, že je analogický s vyhledávacím robotem. Získané výsledky se shromažďují do společné databáze, kterou používají všichni účastníci YaCy.

Ten lepší

Je těžké říci, zda je to lepší nebo horší, protože YaCy je zcela odlišný přístup k organizaci vyhledávání. Absence jediného serveru a společnosti vlastníka činí výsledky zcela nezávislými na preferencích kohokoli. Autonomie každého uzlu eliminuje cenzuru. YaCy je schopen prohledávat hluboký web a neindexované veřejné sítě.

Proč to potřebuješ?

Pokud jste zastáncem open source softwaru a svobodného internetu, nepodléháte vlivu vládních agentur a velkých korporací, pak je YaCy vaše volba. Lze jej také použít k organizaci vyhledávání v rámci podnikové nebo jiné autonomní sítě. A i když YaCy není v každodenním životě příliš užitečný, je z hlediska procesu vyhledávání důstojnou alternativou ke Googlu.

4. Pipl

co to je

Pipl je systém určený k vyhledávání informací o konkrétní osobě.

Ten lepší

Autoři Pipl tvrdí, že jejich specializované algoritmy vyhledávají efektivněji než „běžné“ vyhledávače. Přednost mají zejména profily na sociálních sítích, komentáře, seznamy členů a různé databáze, které zveřejňují informace o lidech, jako jsou databáze soudních rozhodnutí. Vedení Pipl v této oblasti potvrzují hodnocení z Lifehacker.com, TechCrunch a dalších publikací.

Proč to potřebuješ?

Pokud potřebujete najít informace o osobě žijící v USA, pak bude Pipl mnohem efektivnější než Google. Databáze ruských soudů jsou zřejmě pro vyhledávač nepřístupné. S ruskými občany si proto tak dobře neporadí.

co to je

FindSounds je další specializovaný vyhledávač. Vyhledává různé zvuky v otevřených zdrojích: dům, příroda, auta, lidé atd. Služba nepodporuje dotazy v ruštině, ale existuje působivý seznam značek v ruském jazyce, které můžete použít k vyhledávání.

Ten lepší

Výstup obsahuje pouze zvuky a nic navíc. V nastavení si můžete nastavit požadovaný formát a kvalitu zvuku. Všechny nalezené zvuky jsou k dispozici ke stažení. Existuje vyhledávání podle vzoru.

Proč to potřebuješ?

Pokud potřebujete rychle najít zvuk výstřelu z muškety, údery kojícího datla nebo pláč Homera Simpsona, pak je tato služba určena právě vám. A to jsme vybrali pouze z dostupných ruskojazyčných dotazů. V angličtině je spektrum ještě širší.

Vážně, specializovaná služba vyžaduje specializované publikum. Ale co když se to bude hodit i vám?

co to je

Wolfram|Alpha je výpočetní vyhledávač. Místo odkazů na články obsahující klíčová slova poskytuje hotovou odpověď na požadavek uživatele. Pokud například zadáte do vyhledávacího formuláře „porovnat populace New Yorku a San Francisca“ v angličtině, Wolfram|Alpha okamžitě zobrazí tabulky a grafy s porovnáním.

Ten lepší

Tato služba je lepší než ostatní pro vyhledávání faktů a výpočet dat. Wolfram|Alpha shromažďuje a organizuje znalosti dostupné na webu z různých oblastí, včetně vědy, kultury a zábavy. Pokud tato databáze obsahuje hotovou odpověď na vyhledávací dotaz, systém ji zobrazí, pokud ne, spočítá a zobrazí výsledek. V tomto případě uživatel nevidí nic zbytečného.

Proč to potřebuješ?

Pokud jste například student, analytik, novinář nebo výzkumník, můžete použít Wolfram|Alpha k vyhledání a výpočtu dat souvisejících s vaší prací. Služba nerozumí všem požadavkům, ale neustále se vyvíjí a je chytřejší.

co to je

Metasearch engine Dogpile zobrazuje kombinovaný seznam výsledků z výsledků vyhledávání z Google, Yahoo a dalších populárních systémů.

Ten lepší

Za prvé, Dogpile zobrazuje méně reklam. Za druhé, služba používá speciální algoritmus k nalezení a zobrazení nejlepších výsledků z různých vyhledávačů. Podle vývojářů Dogpile jejich systémy generují nejúplnější výsledky vyhledávání na celém internetu.

Proč to potřebuješ?

Pokud nemůžete najít informace na Googlu nebo jiném standardním vyhledávači, hledejte je v několika vyhledávačích najednou pomocí Dogpile.

co to je

BoardReader je systém pro textové vyhledávání ve fórech, službách pro otázky a odpovědi a dalších komunitách.

Ten lepší

Služba vám umožňuje zúžit vyhledávací pole na sociální platformy. Díky speciálním filtrům můžete rychle najít příspěvky a komentáře, které odpovídají vašim kritériím: jazyk, datum publikace a název webu.

Proč to potřebuješ?

BoardReader může být užitečný pro PR specialisty a další mediální specialisty, kteří se zajímají o názor mas na určité otázky.

Konečně

Život alternativních vyhledávačů je často pomíjivý. Lifehacker se zeptal bývalého generálního ředitele ukrajinské pobočky Yandexu Sergeje Petrenka na dlouhodobé vyhlídky takových projektů.

Sergej Petrenko

Bývalý generální ředitel Yandex.Ukraine.

Osud alternativních vyhledávačů je jednoduchý: být velmi úzce specializovanými projekty s malým publikem, tedy bez jasných komerčních vyhlídek nebo naopak s naprostou jasností jejich absence.

Pokud se podíváte na příklady v článku, můžete vidět, že takové vyhledávače se buď specializují na úzký, ale oblíbený výklenek, který možná ještě nevyrostl natolik, aby byl patrný na radarech Google nebo Yandex, nebo testují původní hypotéza v hodnocení, která zatím není použitelná v běžném vyhledávání.

Pokud se například vyhledávání na Tor náhle ukáže jako žádané, to znamená, že výsledky odtamtud potřebuje alespoň procento publika Google, pak samozřejmě běžné vyhledávače začnou řešit problém, jak najděte je a ukažte je uživateli. Pokud chování publika ukazuje, že pro významnou část uživatelů ve značném počtu dotazů se výsledky zadané bez zohlednění faktorů závislých na uživateli zdají relevantnější, pak Yandex nebo Google začnou takové výsledky produkovat.

„Být lepší“ v kontextu tohoto článku neznamená „být lepší ve všem“. Ano, v mnoha ohledech jsou naši hrdinové daleko od Yandexu (dokonce daleko od Bingu). Ale každá z těchto služeb dává uživateli něco, co giganti ve vyhledávacím průmyslu nemohou nabídnout. Určitě také znáte podobné projekty. Podělte se s námi - pojďme diskutovat.

Vyhledávač je databáze konkrétních informací na internetu. Mnoho uživatelů se domnívá, že jakmile zadají dotaz do vyhledávače, okamžitě je prolezen celý internet, ale není to vůbec pravda. Internet je neustále skenován mnoha programy, údaje o stránkách jsou zapisovány do databáze, kde jsou podle určitých kritérií všechny stránky a všechny jejich stránky distribuovány do různých typů seznamů a databází. To znamená, že jde o jakousi kartotéku dat a vyhledávání neprobíhá na internetu, ale na této kartotéce.

Google je nejpopulárnější vyhledávač na světě.

Kromě vyhledávače nabízí Google mnoho doplňkových služeb, programů a hardwaru, včetně e-mailové služby, prohlížeče Google Chrome, největší videotéky YouTube a mnoha dalších projektů. Google sebevědomě skupuje mnoho projektů, které přinášejí velké zisky. Většina služeb není zaměřena na přímého uživatele, ale na vydělávání peněz na internetu a je integrována se zaměřením na zájmy evropských a amerických uživatelů.

Mail je vyhledávač, který je oblíbený především díky své emailové službě.

Existuje mnoho dalších služeb, jejichž klíčem je Mail, v současné době společnost Mail vlastní sociální síť Odnoklassniki, vlastní síť „Můj svět“, službu Money-mail, mnoho online her, tři téměř identické prohlížeče s různými názvy . Všechny aplikace a služby obsahují velké množství reklamního obsahu. Sociální síť VKonatkte blokuje přímé přechody na poštovní služby a ospravedlňuje je velkým množstvím virů.

Wikipedie.

Wikipedie je vyhledávací referenční systém.

Neziskový vyhledávač, který funguje na základě soukromých darů, tedy své stránky neplní reklamou. Vícejazyčný projekt, jehož cílem je vytvořit kompletní referenční encyklopedii ve všech jazycích světa. Nemá žádné konkrétní autory a je obývána a provozována dobrovolníky z celého světa. Každý uživatel může psát i upravovat článek.

Oficiální stránka - www.wikipedia.org.

Youtube je největší knihovna video souborů.

Videohosting s prvky sociální sítě, kde každý uživatel může přidat video. Od jejich akvizice společností Google Ink není vyžadována samostatná registrace pro YouTube, stačí se zaregistrovat v e-mailové službě Google.

Oficiální stránka - youtube.com.

Yahoo! je druhý nejdůležitější vyhledávač na světě.

Existují doplňkové služby, z nichž nejznámější je Yahoo mail. Yahoo v rámci zlepšování kvality vyhledávače přenáší data o uživatelích a jejich dotazech do Microsoftu. Z těchto dat se vytváří představa o zájmech uživatelů a vytváří se trh s reklamním obsahem. Vyhledávač Yahoo, stejně jako , se zabývá akvizicemi dalších společností, například Yahoo vlastní vyhledávací službu Altavista a e-shop Alibaba.

Oficiální stránka - www.yahoo.com.

WDL je digitální knihovna.

Knihovna shromažďuje knihy, které poskytují kulturní hodnotu v digitální podobě. Hlavním cílem je zvýšit úroveň kulturního obsahu internetu. Vstup do knihovny je zdarma.

Oficiální stránka - www.wdl.org/ru/.

Bing je vyhledávač od společnosti Microsoft.

Oficiální stránka - www.baidu.com.

Vyhledávače v Rusku

Rambler je „proamerický“ vyhledávač.

Původně byl vytvořen jako internetový mediální portál. Stejně jako mnoho jiných vyhledávačů má vyhledávací služby pro obrázky, video soubory, mapy, předpověď počasí, sekci zpráv a mnoho dalšího. Vydavatelé také nabízejí bezplatný prohlížeč Rambler-Nichrome.

Oficiální stránka - www.rambler.ru.

Nigma je inteligentní vyhledávač.

Pohodlnější vyhledávač díky přítomnosti mnoha filtrů a nastavení. Rozhraní vám umožňuje zahrnout nebo vyloučit navrhované podobné hodnoty do vyhledávání, abyste získali lepší výsledky. Při příjmu výsledku vyhledávání vám také umožňuje používat informace z jiných velkých vyhledávačů.

Oficiální stránka - www.nigma.ru.

Aport - online katalog produktů.

V minulosti vyhledávač, ale po zastavení vývoje a inovací rychle ztratil půdu pod nohama a . V současné době je Aport obchodní platformou, kde jsou prezentovány produkty více než 1500 společností.

Oficiální stránka - www.aport.ru.

Sputnik je národní vyhledávač a internetový portál.

Vytvořil Rostelecom. Momentálně ve fázi testování.

Oficiální stránka - www.sputnik.ru.

Metabot je rostoucí vyhledávač.

Úkolem Metabota je vytvořit vyhledávač pro všechny ostatní vyhledávače, vytvářet pozice ve výsledcích s ohledem na data z celého seznamu vyhledávačů. To znamená, že je to vyhledávač pro vyhledávače.

Oficiální stránka - www.metabot.ru.

Vyhledávač byl pozastaven.

Oficiální stránka - www.turtle.ru.

KM je multiportál.

Zpočátku byly stránky multiportálem s následným zavedením vyhledávače. Vyhledávání lze provádět jak v rámci webu, tak napříč všemi monitorovanými weby RuNet.

Oficiální stránka - www.km.ru.

Gogo - nefunguje, přesměruje na vyhledávač.

Oficiální stránka - www.gogo.ru.

Ruský multiportál, nepříliš populární, vyžaduje vylepšení. Vyhledávač obsahuje zprávy, televizi, hry a mapu.

Oficiální stránka - www.zoneru.org.

Vyhledávač nefunguje, vývojáři navrhují použít vyhledávač.