Otsingumootorite põhimõtted. Interneti otsingumootorid

Sisukord:

Otsingumootorite põhimõtted. Interneti otsingumootorid
Otsingumootorite põhimõtted. Interneti otsingumootorid
Anonim

Internetis ja erinevatel saitidel pakutakse kasutajale suurel hulgal erinevat teavet. Vajaliku info hankimiseks, küsimustele vastuste otsimiseks on loodud otsingumootorid. Seda fraasi kuuldes mõtlevad paljud inimesed Google'ist, Yandexist. Siiski on Internetis palju rohkem otsingumootoreid.

Mis on otsingumootor

Otsingumootoriks loetakse tarkvara, mis koosneb dokumentide andmebaasist. Kasutajad on varustatud spetsiaalse liidesega, mis võimaldab sisestada vajalikke päringuid ja saada linke asjakohase teabega. Dokumendid, mis vastavad kõige paremini konkreetse inimese otsitule, on alati otsingutulemuste ülaosas.

Otsingutulemused, mis luuakse vastav alt sisestatud päringule, sisaldavad tavaliselt erinevat tüüpi tulemusi. See võib sisaldada veebilehti, video- ja helifaile, pilte, pdf-faile, konkreetseid tooteid (kui otsing toimub veebipoes).

Otsingumootori edetabel maailmas
Otsingumootori edetabel maailmas

Otsingumootorite klassifikatsioon

Olemasolevad otsingumootorid liigitatakse mitut tüüpi. Kõigepe alt tasub mainida traditsioonilisi otsingumootoreid. Selliste otsingumootorite puhul on tööpõhimõtted keskendunud teabe leidmisele tohutul hulgal olemasolevatel saitidel. Otsingumootorid on endiselt saadaval eraldi Interneti-ressurssides:

  • veebipoodides (õigete toodete otsimiseks);
  • foorumites ja ajaveebides (postituste otsimiseks);
  • teabe saitidel (soovitud teemade või uudiste artiklite otsimiseks) jne.

Otsingumootorid jagunevad ka geograafiliste tunnuste alusel. Selles klassifikatsioonis on 3 otsingumootorite rühma:

  1. Globaalne. Otsingut tehakse üle kogu maailma. Selle grupi liider on Google'i otsingumootor. Varem olid sellised otsingumootorid nagu Inktomi, AltaVista jne.
  2. Regionaalne. Otsing toimub riigi või riikide rühma kaupa, mida ühendab üks keel. Piirkondlikud otsingumootorid on lai alt levinud. Nende näide Venemaal on Yandex, Rambler.
  3. Kohalik. Otsing viiakse läbi kindlas linnas. Sellise otsingumootori näide on Tomsk.ru.

Otsingumootorite komponendid

Igas otsingumootoris on 3 koostisosa, mis määravad otsingumootori põhimõtted:

  • robot (indekser, ämblik, roomik);
  • andmebaas;
  • päringu töötleja.

Robot on spetsiaalne programm, mille eesmärk on andmebaasi moodustamine. Andmebaas salvestab ja sorteeribkogu kogutud teave. Taotluste töötleja, mida nimetatakse ka kliendiks, töötab kasutaja päringutega. Sellel on juurdepääs andmebaasile. Klient ei asu alati samas arvutis. Päringutöötleja saab jaotada mitme füüsiliselt mitteseotud elektroonilise arvuti vahel.

Otsingumootori töö
Otsingumootori töö

Otsingumootorite põhimõtted

Kõik olemasolevad süsteemid töötavad samal põhimõttel. Mõelge näiteks traditsiooniliste Interneti jaoks loodud otsingumootorite toimimisele. Roboti toimimine on sarnane tavakasutaja tegevusega. See programm möödub perioodiliselt kõigist saitidest, lisab andmebaasi uusi lehti ja Interneti-ressursse. Seda protsessi nimetatakse indekseerimiseks.

Kui kasutaja Internetis sisestab otsingukasti teatud päringu, hakkab klient tööle. Programm pääseb ligi olemasolevale andmebaasile ja genereerib tulemusi märksõnade alusel. Otsingumootor pakub kasutajale teatud järjestuses linke. Neid sorteeritakse nii, nagu need päringule vastavad, st asjakohasust võetakse arvesse.

Igal otsingumootoril on asjakohasuse määramiseks oma viis. Kui kasutaja saadab konkreetse päringu erinevatesse süsteemidesse, siis ei saa ta täpselt samu tulemusi. Asjakohasuse määramise algoritm hoitakse saladuses.

Populaarsed otsingumootorid Venemaal
Populaarsed otsingumootorid Venemaal

Asjakohasuse üksikasjad

Lihtsate sõnadega tähendab asjakohasus otsingusse sisestatud sõna või sõnade kombinatsiooni vastavustkonkreetsed lingid SERP-is. Dokumentide asukohta loendis mõjutavad mitmed nüansid:

  1. Otsingusõnade olemasolu dokumentides. See nüanss on ilmne. Kui dokument sisaldab sõnu kasutaja sisestatud päringust, tähendab see, et see dokument vastab otsingutingimustele.
  2. Sõnade esinemissagedus. Mida sagedamini märksõnu dokumendis kasutatakse, seda kõrgemal on see SERP loendis. Siiski pole kõik nii lihtne. Liigne sõnade kasutamine võib olla märk madala kvaliteediga sisust otsingumootori jaoks.

Asjakohasuse määramise algoritm on üsna keeruline. Mõned aastad tagasi võisid otsingutulemustesse sattuda vajalikke märksõnu sisaldavad, kuid sisult mittevastavad lingid. Praegu on otsingumootorite tööpõhimõtted keerulised. Nüüd saavad robotid analüüsida kogu teksti. Otsingumootorid võtavad arvesse tohutul hulgal erinevaid tegureid. Tänu sellele moodustatakse probleem kõrgeima kvaliteediga asjakohastest linkidest.

Kuidas taotlusi õigesti sõnastada

Isegi koolis õpetati meid õigesti küsimusi esitama. See sõltub sellest, milliseid vastuseid me saame. Seda reeglit ei pea aga otsingumootorite kasutamisel järgima. Kaasaegsete otsingumootorite jaoks pole vahet, millises numbris või käändes inimene oma päringu kirjutab. Mõlemal juhul sisaldab väljund samu tulemusi.

Otsingumootorid ei vaja küsimuse selget sõnastust. Kasutajal tuleb vaid valida õiged märksõnad. Kaaluge näidet. Me peame leidmalaulu "Päev ilma sinuta" teksti, mida esitab kuulus naispoppgrupp "Via-Gra". Otsingumootoriga ühendust võttes ei pea grupile nime panema, märkige, et tegemist on lauluga. Piisab, kui kirjutada "Päev ilma sinuta teksti". Säilita suurtähti, kirjavahemärke pole vaja. Otsingumootorid ei võta neid nüansse arvesse.

Päringute õige sõnastus
Päringute õige sõnastus

Otsingumootorite edetabel maailmas

Maailma juhtiv otsingumootor on Google. See asutati 1998. aastal. Süsteem on väga populaarne, mida kinnitab analüütiline teave. Umbes 70% Internetti saabuvatest päringutest käsitleb Google. Otsingumootori andmebaas on tohutu. Indekseeritud on üle 60 triljoni erineva dokumendi. Google meelitab kasutajaid lihtsa liidesega. Avalehel on logo ja otsinguriba. See funktsioon võimaldab meil nimetada Google'it üheks kõige minimalistlikumaks otsingumootoriks.

Bing on populaarsuselt teine otsingumootor. See ilmus samal aastal kui Google. Selle otsingumootori loojaks on tuntud rahvusvaheline korporatsioon Microsoft. Edetabeli madalamad positsioonid on Baidu, Yahoo!, AOL, Excite, Ask.

Otsingumootori põhimõtted
Otsingumootori põhimõtted

Mis on Venemaal populaarne

Yandex on Venemaa populaarseim otsingumootor. See teenus ilmus 1997. aastal. Alguses tegeles sellega Venemaa ettevõte CompTek International. Veidi hiljem ilmus ettevõte Yandex, mis jätkas otsingumootoriga tegelemist. Otsingumootori jaoksaastat eksisteerinud on saavutanud tohutu populaarsuse. Seda saab otsida mitmes keeles – vene, valgevene, ukraina, tatari, kasahhi, inglise, saksa, prantsuse, türgi keeles.

Statistilistest andmetest on teada, et "Yandex" pakub huvi enam kui 50% Runeti kasutajatest. Üle 40% inimestest eelistab Google'it. Ligikaudu 3% kasutajatest valis venekeelse Interneti-portaali Mail.ru.

Google'i otsingumootor
Google'i otsingumootor

Kaitstud otsingumootorid

Tavalised meile tuttavad otsingumootorid ei sobi just lastele. Noored Interneti-kasutajad võivad kogemata leida täiskasvanutele mõeldud materjale, teavet, mis võib psüühikat kahjustada. Sel põhjusel on loodud spetsiaalsed turvalised otsingumootorid. Nende andmebaasid sisaldavad ainult lastele ohutut sisu.

Ühe sellise otsingumootori näide on Sputnik. Children. See teenus on üsna noor. Selle lõi Rostelecom 2014. aastal. Otsingumootori avaleht on särav ja huvitava kujundusega. See esitleb laias valikus kodu- ja välismaiseid koomikseid erinevas vanuses lastele. Lisaks on avalehel informatiivsed lingid seotud mitme rubriigiga - "Sport", "Tahan kõike teada", "Tee ise", "Mängud", "Tehnoloogia", "Kool", "Loodus".

Teine näide turvalisest laste otsingumootorist on Agakids.ru. See on täiesti ohutu ressurss. Kuidas otsingumootor töötab? Robot on konfigureeritud nii, et see läheb mööda ainult nendest saitidest, mis on seotud lasteteemadega võion abiks vanematele. Otsingumootori andmebaas sisaldab ressursse multikate, raamatute, õppekirjanduse, mängude, värvimisraamatutega. Vanemad saavad Agakids.ru kaudu ise leida saite laste kasvatamise ja tervise kohta.

Kaitstud otsingumootorid lastele
Kaitstud otsingumootorid lastele

Kokkuvõttes väärib märkimist, et otsingumootorid on keerulised süsteemid. Nad seisavad silmitsi paljude probleemidega - rämpsposti probleemid, dokumentide asjakohasuse määramine, madala kvaliteediga sisu väljasõelumine, tekstilist teavet mitte sisaldavate dokumentide analüüsimine. Sel põhjusel juurutavad arendajad Interneti otsingumootorite töösse uusi lähenemisviise ja algoritme, mis on ärisaladused.

Soovitan: