Principii ale motoarelor de căutare. Motoarele de căutare pe internet

Cuprins:

Principii ale motoarelor de căutare. Motoarele de căutare pe internet
Principii ale motoarelor de căutare. Motoarele de căutare pe internet
Anonim

Pe Internet, pe diverse site-uri, utilizatorului i se oferă o cantitate mare de informații diferite. Motoarele de căutare au fost create pentru a obține informațiile necesare, a căuta răspunsuri la întrebări. Auzind această frază, mulți oameni se gândesc la Google, Yandex. Cu toate acestea, există multe mai multe motoare de căutare pe internet.

Ce este un motor de căutare

Un motor de căutare este considerat software care constă dintr-o bază de date de documente. Utilizatorilor li se oferă o interfață specială care le permite să introducă interogările necesare și să primească link-uri cu informații relevante. Documentele care se potrivesc cel mai bine cu ceea ce caută o anumită persoană sunt întotdeauna în partea de sus a rezultatelor căutării.

Rezultatele căutării, care sunt generate în conformitate cu interogarea introdusă, conțin de obicei diferite tipuri de rezultate. Poate conține pagini web, fișiere video și audio, imagini, fișiere pdf, produse specifice (dacă căutarea este efectuată într-un magazin online).

Clasamentul motoarelor de căutare în lume
Clasamentul motoarelor de căutare în lume

Clasificarea motoarelor de căutare

Motoarele de căutare existente sunt clasificate în mai multe tipuri. În primul rând, merită menționat motoarele de căutare tradiționale. Pentru astfel de motoare de căutare, principiile de lucru sunt axate pe găsirea de informații pe un număr mare de site-uri existente. Motoarele de căutare sunt încă disponibile pe resurse de internet separate:

  • în magazinele online (pentru a căuta produsele potrivite);
  • pe forumuri și bloguri (pentru a căuta postări);
  • pe site-uri de informare (pentru a căuta articole pe tema sau știrile dorite), etc.

Motoarele de căutare sunt, de asemenea, subdivizate în funcție de caracteristicile geografice. În această clasificare, există 3 grupuri de motoare de căutare:

  1. Global. Căutarea se desfășoară în toată lumea. Liderul în acest grup este motorul de căutare Google. Anterior, existau motoare de căutare precum Inktomi, AltaVista etc.
  2. Regional. Căutarea se efectuează pe țară sau grup de țări, care sunt unite printr-o singură limbă. Motoarele de căutare regionale sunt răspândite. Exemplul lor în Rusia este Yandex, Rambler.
  3. Local. Căutarea se face într-un anumit oraș. Un exemplu de astfel de motor de căutare este Tomsk.ru.

Componentele motoarelor de căutare

În orice motor de căutare, există 3 elemente constitutive care determină principiile motorului de căutare:

  • robot (indexator, spider, crawler);
  • bază de date;
  • handler de solicitări.

Robot este un program special al cărui scop este formarea unei baze de date. Baza de date stochează și sorteazătoate informațiile colectate. Managerul de cereri, numit și client, funcționează cu cererile utilizatorului. Are acces la baza de date. Clientul nu este întotdeauna localizat pe același computer. Operatorul de gestionare a cererilor poate fi răspândit pe mai multe computere electronice care nu au legătură fizic.

Munca motorului de cautare
Munca motorului de cautare

Principii ale motoarelor de căutare

Toate sistemele existente funcționează pe același principiu. Luați în considerare, de exemplu, funcționarea motoarelor de căutare tradiționale concepute pentru Internet. Funcționarea robotului este similară cu acțiunile unui utilizator normal. Acest program ocolește periodic toate site-urile, adaugă pagini noi și resurse de Internet în baza de date. Acest proces se numește indexare.

Când un utilizator de pe Internet introduce o anumită interogare în caseta de căutare, clientul începe să lucreze. Programul accesează baza de date existentă și generează rezultate pe baza cuvintelor cheie. Motorul de căutare oferă link-uri către utilizator într-o anumită secvență. Sunt sortate pe măsură ce se potrivesc cu interogarea, adică se ia în considerare relevanța.

Fiecare motor de căutare are propriul mod de a determina relevanța. Dacă utilizatorul trimite o cerere specifică către sisteme diferite, atunci el nu va primi exact aceleași rezultate. Algoritmul pentru determinarea relevanței este ținut secret.

Motoare de căutare populare în Rusia
Motoare de căutare populare în Rusia

Detalii despre relevanță

În cuvinte simple, relevanța este corespondența cuvântului sau a combinației de cuvinte introduse în căutarelink-uri specifice în SERP. Mai multe nuanțe afectează poziția documentelor în listă:

  1. Prezența cuvintelor de căutare în documente. Această nuanță este evidentă. Dacă documentul conține cuvinte din interogarea introdusă de utilizator, atunci aceasta înseamnă că acest document corespunde condițiilor de căutare.
  2. Frecvența de apariție a cuvintelor. Cu cât cuvintele cheie sunt folosite mai des într-un document, cu atât acestea vor fi mai sus în lista SERP. Cu toate acestea, nu toate sunt atât de simple. Utilizarea prea mare a cuvintelor poate fi un semn al conținutului de calitate scăzută pentru motorul de căutare.

Algoritmul pentru determinarea relevanței este destul de complicat. În urmă cu câțiva ani, linkurile care conțin cuvintele cheie necesare, dar care nu le corespund în conținut, puteau intra în rezultatele căutării. În prezent, principiile de funcționare a motoarelor de căutare sunt complicate. Acum roboții pot analiza întregul text. Motoarele de căutare iau în considerare un număr mare de factori diferiți. Datorită acestui fapt, problema este formată din linkuri relevante de cea mai în altă calitate.

Cum se formulează corect cererile

Chiar și la școală, am fost învățați să punem întrebări corect. Depinde de ce fel de răspunsuri vom primi. Cu toate acestea, această regulă nu trebuie respectată atunci când utilizați motoarele de căutare. Pentru motoarele de căutare moderne, nu contează în ce număr sau caz o persoană își scrie cererea. În orice caz, rezultatul va include aceleași rezultate.

Motoarele de căutare nu au nevoie de o formulare clară a întrebării. Utilizatorul trebuie doar să aleagă cuvintele cheie potrivite. Luați în considerare un exemplu. Trebuie să găsimtextul piesei „A Day Without You”, care este interpretată de celebrul grup pop feminin „Via-Gra”. Când contactați un motor de căutare, nu este necesar să denumiți grupul, indicați că acesta este un cântec. Este suficient să scrieți „o zi fără mesaj text”. Păstrați majuscule, punctuația nu este necesară. Aceste nuanțe nu sunt luate în considerare de motoarele de căutare.

Formularea corectă a întrebărilor
Formularea corectă a întrebărilor

Clasamentul motoarelor de căutare din lume

Cel mai mare motor de căutare din lume este Google. A fost fondată în 1998. Sistemul este foarte popular, ceea ce este confirmat de informații analitice. Aproximativ 70% din cererile care vin pe internet sunt gestionate de Google. Baza de date a motorului de căutare este imensă. Au fost indexate peste 60 de trilioane de documente diferite. Google atrage utilizatorii cu o interfață simplă. Pagina principală are un logo și o bară de căutare. Această funcție ne permite să numim Google unul dintre cele mai minimaliste motoare de căutare.

Bing este al doilea cel mai popular motor de căutare. A apărut în același an cu Google. Creatorul acestui motor de căutare este cunoscuta corporație internațională Microsoft. Pozițiile inferioare în clasament sunt ocupate de Baidu, Yahoo!, AOL, Excite, Ask.

Principiile motoarelor de căutare
Principiile motoarelor de căutare

Ce este popular în Rusia

Yandex este cel mai popular motor de căutare din Rusia. Acest serviciu a apărut în 1997. La început, compania rusă CompTek International a fost angajată în ea. Puțin mai târziu, a apărut compania Yandex, care a continuat să se angajeze într-un motor de căutare. Motor de cautare pentruani de existență a câștigat o popularitate imensă. Poate fi căutat în mai multe limbi - rusă, belarusă, ucraineană, tătără, kazah, engleză, germană, franceză, turcă.

Din datele statistice se știe că „Yandex” prezintă interes pentru mai mult de 50% dintre utilizatorii Runet. Peste 40% dintre oameni preferă Google. Aproximativ 3% dintre utilizatori au optat pentru Mail.ru, un portal de internet în limba rusă.

motor de căutare Google
motor de căutare Google

Motoare de căutare protejate

Motoarele de căutare obișnuite care ne sunt familiare nu sunt tocmai potrivite pentru copii. Tinerii internauți pot găsi accidental niște materiale pentru adulți, informații care pot dăuna psihicului. Din acest motiv, au fost create motoare de căutare speciale securizate. Bazele lor de date conțin numai conținut sigur pentru copii.

Un exemplu de astfel de motor de căutare este Sputnik. Children. Acest serviciu este destul de tânăr. A fost creat de Rostelecom în 2014. Pagina principală a motorului de căutare este strălucitoare și proiectată interesant. Prezintă o gamă largă de desene animate interne și străine pentru copii de diferite vârste. În plus, pe pagina principală există link-uri informative legate de mai multe rubrici - „Sport”, „Vreau să știu totul”, „Fă-o singur”, „Jocuri”, „Tehnologie”, „Școală”, „Natura”.

Un alt exemplu de motor de căutare sigur pentru copii este Agakids.ru. Aceasta este o resursă absolut sigură. Cum funcționează un motor de căutare? Robotul este configurat în așa fel încât să ocolească doar acele site-uri care au legătură cu subiectele copiilor sausunt utile pentru părinți. Baza de date a motorului de căutare include resurse cu desene animate, cărți, literatură educațională, jocuri, cărți de colorat. Părinții, folosind Agakids.ru, pot găsi pentru ei înșiși site-uri despre creșterea și sănătatea copiilor.

Motoare de căutare protejate pentru copii
Motoare de căutare protejate pentru copii

În concluzie, este de remarcat faptul că motoarele de căutare sunt sisteme complexe. Ei se confruntă cu o mulțime de probleme - problemele de spam, determinarea relevanței documentelor, eliminarea conținutului de calitate scăzută, analiza documentelor care nu conțin informații textuale. Din acest motiv, dezvoltatorii introduc noi abordări și algoritmi care sunt secrete comerciale în activitatea motoarelor de căutare de pe Internet.

Recomandat: