Mis on veebisaidi indekseerimine? Kuidas see juhtub? Nendele ja teistele küsimustele leiate vastused artiklist. Veebi indekseerimine (otsingumootorites indekseerimine) on protsess, mille käigus otsingumootori robot lisab saidi kohta teavet andmebaasi, mida seejärel kasutatakse sellise protseduuri läbinud veebiprojektide kohta teabe otsimiseks.
Andmed veebiressursside kohta koosnevad enamasti märksõnadest, artiklitest, linkidest, dokumentidest. Indekseerida saab ka heli, pilte ja nii edasi. On teada, et märksõna tuvastamise algoritm sõltub otsingumootorist.
Indekseeritud teabe tüüpidele (flash-failid, javascript) on teatud piirangud.
Algatamise haldus
Saidi indekseerimine on keeruline protsess. Selle haldamiseks (näiteks teatud lehe manustamise keelamiseks) peate kasutama faili robots.txt ja selliseid juhiseid nagu Luba, Keela, Roomamise viivitus, Kasutajaagent ja teised.
Samuti kasutatakse silte ja rekvisiite indekseerimiseks, mis varjab ressursi sisu Google'i ja Yandexi robotite eest (Yahoo kasutab silti).
Goglle otsingumootoris indekseeritakse uusi saite paarist päevast ühe nädalani ja Yandexis ühest kuni nelja nädalani.
Kas soovite, et teie sait kuvataks otsingumootori tulemuste päringutes? Seejärel peavad seda töötlema Rambler, Yandex, Google, Yahoo ja nii edasi. Peate teavitama otsingumootoreid (ämblikud, süsteemid) oma veebisaidi olemasolust ja seejärel roomavad nad sellel täielikult või osaliselt üles.
Paljusid saite pole aastaid indekseeritud. Neil olevat teavet ei näe keegi peale nende omanike.
Töötlemismeetodid
Saidi indekseerimist saab teha mitmel viisil:
- Esimene valik on käsitsi lisamine. Peate oma saidi andmed sisestama otsingumootorite pakutavate spetsiaalsete vormide kaudu.
- Teisel juhul leiab otsingumootori robot ise teie veebisaidi linkide järgi ja indekseerib selle. Ta leiab teie saidi linkide kaudu muudest ressurssidest, mis viivad teie projektini. See meetod on kõige tõhusam. Kui otsingumootor leiab saidi sel viisil, peab ta seda oluliseks.
Ajastus
Saidi indekseerimine ei ole liiga kiire. Tingimused on erinevad, 1-2 nädalat. Lingid autoriteetsetest ressurssidest (suurepärase PR ja Titziga) kiirendavad oluliselt saidi paigutamist otsingumootori andmebaasi. Tänapäeval peetakse Google’it kõige aeglasemaks, kuigi kuni 2012. aastani suutis ta selle töö ära teha nädalaga. ToKahjuks muutuvad asjad väga kiiresti. On teada, et Mail.ru on selle valdkonna veebisaitidega töötanud umbes kuus kuud.
Saidi indekseerimine otsingumootorites ei ole iga spetsialisti jaoks võimalik. Otsingumootorites juba töödeldud saidi andmebaasi uute lehtede lisamise ajastust mõjutab selle sisu uuendamise sagedus. Kui ressursile ilmub pidev alt värsket teavet, loeb süsteem seda sageli uuendatuks ja inimestele kasulikuks. Sel juhul tema tööd kiirendatakse.
Saate jälgida veebisaidi indekseerimise edenemist veebihalduritele või otsingumootoritele mõeldud spetsiaalsetes jaotistes.
Muudatused
Nii, oleme juba välja mõelnud, kuidas saiti indekseeritakse. Tuleb märkida, et otsingumootorite andmebaase uuendatakse sageli. Seetõttu võib teie projekti neile lisatud lehtede arv muutuda (nii väheneda kui ka suureneda) järgmistel põhjustel:
- otsingumootori sanktsioonid veebisaidi vastu;
- vigade olemasolu saidil;
- otsingumootori algoritmide muutmine;
- vastiku hostimine (projekti asukoha serverile ligipääsmatus) ja nii edasi.
Yandexi vastused levinud küsimustele
"Yandex" on paljude kasutajate kasutatav otsingumootor. See on töödeldud uurimistaotluste arvu poolest maailma otsingusüsteemide seas viiendal kohal. Kui lisasite sellele saidi, võib andmebaasi lisamine võtta liiga kaua aega.
URL-i lisamine ei garanteeri selle indekseerimist. See on vaid üks meetoditest, mille abil süsteemirobotile seda öeldakseuue ressursi kohta. Kui muude veebisaitide saidile on vähe linke või neid pole üldse, aitab selle lisamine selle kiiremini üles leida.
Kui indekseerimist ei toimunud, peate kontrollima, kas Yandexi robotist rakenduse loomise ajal ei esinenud serveris tõrkeid. Kui server teatab veast, lõpetab robot oma töö ja proovib seda sooritada edasi-tagasi tellimuses. Yandexi töötajad ei saa otsingumootori andmebaasi lehtede lisamise kiirust suurendada.
Saidi indekseerimine Yandexis on üsna keeruline ülesanne. Kas te ei tea, kuidas otsingumootorisse ressurssi lisada? Kui sellele on lingid teistelt veebisaitidelt, siis pole vaja spetsiaalset saiti lisada – robot leiab selle automaatselt üles ja indekseerib. Kui teil selliseid linke pole, saate saidi olemasolust otsingumootorile teatamiseks kasutada vormi "Lisa URL".
Pidage meeles, et URL-i lisamine ei taga teie loomingu indekseerimist (või indekseerimist).
Paljud inimesed mõtlevad, kui kaua võtab saidi indekseerimine Yandexis aega. Selle ettevõtte töötajad ei anna garantiisid ega ennusta tingimusi. Pärast seda, kui robot saidi teada sai, ilmuvad tema lehed otsingusse reeglina kahe päeva, mõnikord paari nädala pärast.
Töötle
"Yandex" on otsingumootor, mis nõuab täpsust ja tähelepanu. Saidi indekseerimine koosneb kolmest osast:
- Otsingurobot roomab ressursilehtedel.
- Sisusaidi (sisu) salvestatakse otsingusüsteemi andmebaasi (indeksisse).
- 2-4 nädala pärast, pärast andmebaasi värskendamist, näete tulemusi. Teie saiti kuvatakse (või ei kuvata) otsingutulemustes.
Indekseerimise kontroll
Kuidas kontrollida veebisaidi indekseerimist? Selleks on kolm võimalust:
- Sisestage otsinguribale oma ettevõtte nimi (nt "Yandex") ja kontrollige kõiki linke esimesel ja teisel lehel. Kui leiate se alt oma vaimusünnituse URL-i, siis on robot oma ülesande täitnud.
- Saate sisestada oma veebisaidi URL-i otsinguribale. Näete, kui palju Interneti-lehti kuvatakse, st indekseeritud.
- Registreeruge Mail.ru, Google'i, Yandexi veebihaldurite lehtedel. Pärast saidi kinnitamise läbimist näete indekseerimise tulemusi ja muid otsingumootori teenuseid, mis on loodud teie ressursi toimivuse parandamiseks.
Miks Yandex ebaõnnestub?
Saidi indekseerimine Google'is toimub järgmiselt: robot sisestab andmebaasi kõik saidi madala kvaliteediga ja kvaliteetsed lehed, valimata. Kuid pingereas on ainult kasulikud dokumendid. Ja "Yandex" välistab kohe kogu veebiprügi. See võib indekseerida mis tahes lehekülge, kuid otsingumootor eemaldab lõpuks kogu prügi.
Mõlemal süsteemil on inkrementaalne indeks. Mõlemad madala kvaliteediga lehed mõjutavad veebisaidi kui terviku asetust. Siin toimib lihtne filosoofia. Konkreetse inimese lemmikressursidkasutaja hõivab oma emissioonis kõrgemaid positsioone. Kuid sellel samal isikul on raske leida saiti, mis talle eelmisel korral ei meeldinud.
Seetõttu tuleb esiteks katta veebidokumentide koopiad indekseerimisest, kontrollida, kas pole tühjasid lehti ja vältida madala kvaliteediga sisu indekseerimist.
Yandexi kiirendamine
Kuidas saan Yandexis saidi indekseerimist kiirendada? Järgige neid samme:
- Installige arvutisse Yandexi brauser ja kasutage seda saidi lehtede sirvimiseks.
- Kinnitage ressursi haldamise õigused saidil Yandex. Webmaster.
- Postitage Twitteris artikli link. On teada, et Yandex on selle ettevõttega koostööd teinud alates 2012. aastast.
- Lisage saidi otsing Yandexist. Jaotises "Indekseerimine" saate sisestada oma URL-id.
- Sisestage kood "Yandex. Metrica" ilma linnukeseta "Lehekülgede esitamine indekseerimiseks on keelatud".
- Looge saidiplaan, mis on olemas ainult roboti jaoks ja pole publikule nähtav. Kontrollimine algab temaga. Saidiplaani aadress sisestatakse faili robots.txt või sobival kujul jaotises "Veebihaldur" - "Indekseerimisseaded" - "Saidiplaani failid".
Vahetoimingud
Mida tuleb teha, kuni veebileht on Yandexi poolt indekseeritud? Kodumaine otsingumootor peaks seda saiti pidama peamiseks allikaks. Sellepärast on juba enne artikli avaldamist hädavajalik lisada selle sisu vormile "Konkreetsed tekstid". Muiduplagiaatorid kopeerivad kirje oma ressurssi ja on andmebaasis esimesed. Selle tulemusel tunnustatakse neid autoritena.
Google'i andmebaas
Google'i jaoks sobivad samad soovitused, mida eespool kirjeldasime, ainult teenused on erinevad:
- Google+ (asendab Twitteri);
- Google Chrome;
- Google'i tööriistad programmeerijatele – "Skannimine" - "Väljanägemine nagu Googlebot" - valik "Skannimine" - valik "Indeks";
- otsige Google'i ressursist;
- Google Analytics (Yandex. Metricsi asemel).
Keeld
Mis on saidi indekseerimise keeld? Saate seda üle kanda nii tervele lehele kui ka selle eraldi osale (link või tekstiosa). Tegelikult kehtib nii ülemaailmne indekseerimiskeeld kui ka kohalik. Kuidas seda rakendatakse?
Mõtleme veebisaidi Robots.txt otsingumootori andmebaasi lisamise keelamist. Faili robots.txt abil saate välistada ühe lehe või terve ressursi pealkirja indekseerimise järgmiselt:
- Kasutajaagent:
- Disallow: /kolobok.html
- Keela: /foto/
Esimene punkt ütleb, et juhised on defineeritud kõikidele PS-idele, teine näitab, et faili kolobok.html indekseerimine on keelatud ja kolmas ei luba kogu fotokausta täitmist kausta lisada. andmebaasi. Kui teil on vaja välistada mitu lehte või kausta, määrake need kõik jaotises Robots.
Konkreetse Interneti-lehe indekseerimise vältimiseks võite kasutada robotite metasilti. See erineb failist robots.txtasjaolu, et see annab juhiseid kõigile PS-le korraga. See metasilt järgib html-vormingu üldpõhimõtteid. See tuleks asetada lehe pealkirjasse siltide vahele. Näiteks keelu kirje võib olla kirjutatud järgmiselt:.
Ajax
Kuidas Yandex Ajaxi saite indekseerib? Tänapäeval kasutavad Ajaxi tehnoloogiat paljud veebisaitide arendajad. Muidugi on tal suur potentsiaal. Sellega saate luua kiireid ja produktiivseid interaktiivseid veebilehti.
Kuid otsingumootori robot "näeb" veebiloendit erinev alt kasutajast ja brauserist. Näiteks vaatab inimene mugavat liidest teisaldatav alt laetud Interneti-lehtedega. Roomaja puhul võib sama lehe sisu olla tühi või esitada ülejäänud staatilise HTML-i sisuna, mille puhul skriptid ei tööta.
Ajaxi saitide loomiseks võite kasutada URL-i koos -ga, kuid otsingumootor seda ei kasuta. Tavaliselt eraldatakse URL-i osa pärast. Seda tuleb arvestada. Seetõttu teeb ta URL-i (nt https://site.ru/example) asemel rakenduse aadressil https://site.ru asuva ressursi avalehele. See tähendab, et Interneti-lehe sisu ei pruugi andmebaasi sattuda. Seetõttu ei kuvata seda otsingutulemustes.
Ajaxi saitide indekseerimise parandamiseks toetas Yandex muudatusi otsingurobotis ja selliste veebisaitide URL-ide töötlemise reeglites. Täna saavad veebihaldurid Yandexi otsingumootorile näidata indekseerimise vajadust, luues ressursistruktuuris sobiva skeemi. Selleks vajate:
- Asendage sümbollehtede URL-iskohta !. Nüüd saab robot aru, et ta saab taotleda selle Interneti-lehe sisu HTML-versiooni.
- Sellise lehe sisu HTML-versioon tuleks paigutada URL-ile, kus ! asendatud ?_escaped_fragment_=.