Internetis ja erinevatel saitidel pakutakse kasutajale suurel hulgal erinevat teavet. Vajaliku info hankimiseks, küsimustele vastuste otsimiseks on loodud otsingumootorid. Seda fraasi kuuldes mõtlevad paljud inimesed Google'ist, Yandexist. Siiski on Internetis palju rohkem otsingumootoreid.
Mis on otsingumootor
Otsingumootoriks loetakse tarkvara, mis koosneb dokumentide andmebaasist. Kasutajad on varustatud spetsiaalse liidesega, mis võimaldab sisestada vajalikke päringuid ja saada linke asjakohase teabega. Dokumendid, mis vastavad kõige paremini konkreetse inimese otsitule, on alati otsingutulemuste ülaosas.
Otsingutulemused, mis luuakse vastav alt sisestatud päringule, sisaldavad tavaliselt erinevat tüüpi tulemusi. See võib sisaldada veebilehti, video- ja helifaile, pilte, pdf-faile, konkreetseid tooteid (kui otsing toimub veebipoes).
Otsingumootorite klassifikatsioon
Olemasolevad otsingumootorid liigitatakse mitut tüüpi. Kõigepe alt tasub mainida traditsioonilisi otsingumootoreid. Selliste otsingumootorite puhul on tööpõhimõtted keskendunud teabe leidmisele tohutul hulgal olemasolevatel saitidel. Otsingumootorid on endiselt saadaval eraldi Interneti-ressurssides:
- veebipoodides (õigete toodete otsimiseks);
- foorumites ja ajaveebides (postituste otsimiseks);
- teabe saitidel (soovitud teemade või uudiste artiklite otsimiseks) jne.
Otsingumootorid jagunevad ka geograafiliste tunnuste alusel. Selles klassifikatsioonis on 3 otsingumootorite rühma:
- Globaalne. Otsingut tehakse üle kogu maailma. Selle grupi liider on Google'i otsingumootor. Varem olid sellised otsingumootorid nagu Inktomi, AltaVista jne.
- Regionaalne. Otsing toimub riigi või riikide rühma kaupa, mida ühendab üks keel. Piirkondlikud otsingumootorid on lai alt levinud. Nende näide Venemaal on Yandex, Rambler.
- Kohalik. Otsing viiakse läbi kindlas linnas. Sellise otsingumootori näide on Tomsk.ru.
Otsingumootorite komponendid
Igas otsingumootoris on 3 koostisosa, mis määravad otsingumootori põhimõtted:
- robot (indekser, ämblik, roomik);
- andmebaas;
- päringu töötleja.
Robot on spetsiaalne programm, mille eesmärk on andmebaasi moodustamine. Andmebaas salvestab ja sorteeribkogu kogutud teave. Taotluste töötleja, mida nimetatakse ka kliendiks, töötab kasutaja päringutega. Sellel on juurdepääs andmebaasile. Klient ei asu alati samas arvutis. Päringutöötleja saab jaotada mitme füüsiliselt mitteseotud elektroonilise arvuti vahel.
Otsingumootorite põhimõtted
Kõik olemasolevad süsteemid töötavad samal põhimõttel. Mõelge näiteks traditsiooniliste Interneti jaoks loodud otsingumootorite toimimisele. Roboti toimimine on sarnane tavakasutaja tegevusega. See programm möödub perioodiliselt kõigist saitidest, lisab andmebaasi uusi lehti ja Interneti-ressursse. Seda protsessi nimetatakse indekseerimiseks.
Kui kasutaja Internetis sisestab otsingukasti teatud päringu, hakkab klient tööle. Programm pääseb ligi olemasolevale andmebaasile ja genereerib tulemusi märksõnade alusel. Otsingumootor pakub kasutajale teatud järjestuses linke. Neid sorteeritakse nii, nagu need päringule vastavad, st asjakohasust võetakse arvesse.
Igal otsingumootoril on asjakohasuse määramiseks oma viis. Kui kasutaja saadab konkreetse päringu erinevatesse süsteemidesse, siis ei saa ta täpselt samu tulemusi. Asjakohasuse määramise algoritm hoitakse saladuses.
Asjakohasuse üksikasjad
Lihtsate sõnadega tähendab asjakohasus otsingusse sisestatud sõna või sõnade kombinatsiooni vastavustkonkreetsed lingid SERP-is. Dokumentide asukohta loendis mõjutavad mitmed nüansid:
- Otsingusõnade olemasolu dokumentides. See nüanss on ilmne. Kui dokument sisaldab sõnu kasutaja sisestatud päringust, tähendab see, et see dokument vastab otsingutingimustele.
- Sõnade esinemissagedus. Mida sagedamini märksõnu dokumendis kasutatakse, seda kõrgemal on see SERP loendis. Siiski pole kõik nii lihtne. Liigne sõnade kasutamine võib olla märk madala kvaliteediga sisust otsingumootori jaoks.
Asjakohasuse määramise algoritm on üsna keeruline. Mõned aastad tagasi võisid otsingutulemustesse sattuda vajalikke märksõnu sisaldavad, kuid sisult mittevastavad lingid. Praegu on otsingumootorite tööpõhimõtted keerulised. Nüüd saavad robotid analüüsida kogu teksti. Otsingumootorid võtavad arvesse tohutul hulgal erinevaid tegureid. Tänu sellele moodustatakse probleem kõrgeima kvaliteediga asjakohastest linkidest.
Kuidas taotlusi õigesti sõnastada
Isegi koolis õpetati meid õigesti küsimusi esitama. See sõltub sellest, milliseid vastuseid me saame. Seda reeglit ei pea aga otsingumootorite kasutamisel järgima. Kaasaegsete otsingumootorite jaoks pole vahet, millises numbris või käändes inimene oma päringu kirjutab. Mõlemal juhul sisaldab väljund samu tulemusi.
Otsingumootorid ei vaja küsimuse selget sõnastust. Kasutajal tuleb vaid valida õiged märksõnad. Kaaluge näidet. Me peame leidmalaulu "Päev ilma sinuta" teksti, mida esitab kuulus naispoppgrupp "Via-Gra". Otsingumootoriga ühendust võttes ei pea grupile nime panema, märkige, et tegemist on lauluga. Piisab, kui kirjutada "Päev ilma sinuta teksti". Säilita suurtähti, kirjavahemärke pole vaja. Otsingumootorid ei võta neid nüansse arvesse.
Otsingumootorite edetabel maailmas
Maailma juhtiv otsingumootor on Google. See asutati 1998. aastal. Süsteem on väga populaarne, mida kinnitab analüütiline teave. Umbes 70% Internetti saabuvatest päringutest käsitleb Google. Otsingumootori andmebaas on tohutu. Indekseeritud on üle 60 triljoni erineva dokumendi. Google meelitab kasutajaid lihtsa liidesega. Avalehel on logo ja otsinguriba. See funktsioon võimaldab meil nimetada Google'it üheks kõige minimalistlikumaks otsingumootoriks.
Bing on populaarsuselt teine otsingumootor. See ilmus samal aastal kui Google. Selle otsingumootori loojaks on tuntud rahvusvaheline korporatsioon Microsoft. Edetabeli madalamad positsioonid on Baidu, Yahoo!, AOL, Excite, Ask.
Mis on Venemaal populaarne
Yandex on Venemaa populaarseim otsingumootor. See teenus ilmus 1997. aastal. Alguses tegeles sellega Venemaa ettevõte CompTek International. Veidi hiljem ilmus ettevõte Yandex, mis jätkas otsingumootoriga tegelemist. Otsingumootori jaoksaastat eksisteerinud on saavutanud tohutu populaarsuse. Seda saab otsida mitmes keeles – vene, valgevene, ukraina, tatari, kasahhi, inglise, saksa, prantsuse, türgi keeles.
Statistilistest andmetest on teada, et "Yandex" pakub huvi enam kui 50% Runeti kasutajatest. Üle 40% inimestest eelistab Google'it. Ligikaudu 3% kasutajatest valis venekeelse Interneti-portaali Mail.ru.
Kaitstud otsingumootorid
Tavalised meile tuttavad otsingumootorid ei sobi just lastele. Noored Interneti-kasutajad võivad kogemata leida täiskasvanutele mõeldud materjale, teavet, mis võib psüühikat kahjustada. Sel põhjusel on loodud spetsiaalsed turvalised otsingumootorid. Nende andmebaasid sisaldavad ainult lastele ohutut sisu.
Ühe sellise otsingumootori näide on Sputnik. Children. See teenus on üsna noor. Selle lõi Rostelecom 2014. aastal. Otsingumootori avaleht on särav ja huvitava kujundusega. See esitleb laias valikus kodu- ja välismaiseid koomikseid erinevas vanuses lastele. Lisaks on avalehel informatiivsed lingid seotud mitme rubriigiga - "Sport", "Tahan kõike teada", "Tee ise", "Mängud", "Tehnoloogia", "Kool", "Loodus".
Teine näide turvalisest laste otsingumootorist on Agakids.ru. See on täiesti ohutu ressurss. Kuidas otsingumootor töötab? Robot on konfigureeritud nii, et see läheb mööda ainult nendest saitidest, mis on seotud lasteteemadega võion abiks vanematele. Otsingumootori andmebaas sisaldab ressursse multikate, raamatute, õppekirjanduse, mängude, värvimisraamatutega. Vanemad saavad Agakids.ru kaudu ise leida saite laste kasvatamise ja tervise kohta.
Kokkuvõttes väärib märkimist, et otsingumootorid on keerulised süsteemid. Nad seisavad silmitsi paljude probleemidega - rämpsposti probleemid, dokumentide asjakohasuse määramine, madala kvaliteediga sisu väljasõelumine, tekstilist teavet mitte sisaldavate dokumentide analüüsimine. Sel põhjusel juurutavad arendajad Interneti otsingumootorite töösse uusi lähenemisviise ja algoritme, mis on ärisaladused.