Paieškos sistemos

Paieškos sistemos (angl. search engines) skirtos naršyti po internetą ir ieškoti vartotojo nurodytos informacijos. Paieškos sistemos informacijos šaltinių paieškai naudoja kompiuterines programas – paieškos serverius (angl. spiders, crawlers). Šios programos nuolat aplanko internete esančius tinklalapius, juos indeksuoja pagal paieškos sistemos sukurtą algoritmą ir automatiškai generuoja žiniatinklyje esančių informacijos išteklių duomenų bazę (indeksą). Vartotojui pateikus užklausą, paieškos sistema ieško informacijos išteklių ne tiesiogiai internete, o savo sukurtoje ir nuolat atnaujinamoje duomenų bazėje (Vaškevičienė, 2001). Paieškos sistemos gali ieškoti ne visame internete, o tik nedidelėje interneto dalyje. Paieškos sistemoms neprieinamos interneto sritys yra vadinamos nematoma interneto puse (angl. deep web, invisible web). Paieškos sistemos negali ieškoti registracijos reikalaujančiose srityse, mokamose duomenų bazėse, ribotos prieigos ištekliuose.

Paieškos sistemos sudėtinės dalys (Cohen, 2006):

  1. paieškos serveris (angl. crawler, spider);
  2. duomenų bazė (angl. index);
  3. paieškos sistemos programinė įranga (angl. Search engine mechanism), leidžianti atlikti paiešką ir pateikti rezultatus vartotojui.

  

Paieškos sistemos kompiuterinės programos nuolat naršo internetą, atlikdamos tinklalapių paiešką. Savo laikinoje duomenų bazėje saugo informaciją apie tinklalapyje surastų žodžių ar frazių rodyklę ir informaciją, kur tuos žodžius rado, kiek kartų ir pan. Vartotojui pateikus užklausą, informacijos ieško ne internete, o savo sukurtoje duomenų bazėje.

Paieškos sistemos skiriasi pagal rezultatų pateikimo greitį, rezultatų pateikimo būdą, vartotojo aplinkos dizainą, siūlomas papildomas paslaugas ir pagalbą.

Paieškos sistemos rezultatus rikiuoja pagal jų atitikimą užklausai. Tuo tikslu naudojama sudėtinga rikiavimo kriterijų sistema, kuri kiekvienai paieškos sistemai skiriasi ir yra viešai neskelbiama. Pagrindiniai rikiavimo kriterijai (Shapiro, n.d.; Sullivan, 2005; Searchengines.com, 2007 ):

  1. reikšminių žodžių vieta tinklalapyje ar dokumente;
  2. jų vieta pagrindiniuose metaduomenyse: pavadinime, autoriaus duomenyse, reikšminiuose žodžiuose;
  3. žodžių pasikartojimo dažnumas;
  4. tinklalapio populiarumas;
  5. tinklalapyje esantys saitai ir naudojamos nuorodos.

Didelis suindeksuotų tinklalapių skaičius ir didelis paieškos greitis yra pagrindinis paieškos sistemų privalumas. Trūkumas yra tas, kad paieškos rezultatuose pateikiama daug nenaudingos ir netikslios informacijos, t.y. „šiukšlių“. Be to kompiuterines programas, ieškančias informacijos šaltinių internete, lengva apgauti. Tinklalapių (ypatingai reklaminių) savininkai metaduomenyse, kurių nemato vartotojai, talpina informaciją nesusijusią su informacijos šaltinio turiniu, o taip pat  žodžius, kuriuos dažniausiai naudoja paiešką atliekantys žmonės. Todėl paieškos rezultatuose atsiranda tinklalapiai neturintys nieko bendro su ieškoma informacija.

Trūkumai:

  1. tarp rezultatų patenka paieškos klausimo neatitinkantys informacijos šaltiniai;
  2. pateikia labai daug rezultatų, tarp jų sunku rasti geriausiai atitinkančius poreikius;
  3. daug svarbių ir naudingų informacijos šaltinių nepatenka tarp paieškos rezultatų, kadangi paieškos sistemos neturi teisės naršyti uždarose ar registracijos reikalaujančiose srityse.

 Atliekant paiešką internete svarbiausia parinkti tinkamus reikšminius žodžius ir sukurti tinkamą paieškos algoritmą.

Paieškos sistemos gali pateikti įvairias paieškos tikslinimo galimybes, pvz., loginių operatorių naudojimas, išplėstinė paieška, paieškos siaurinimo filtrai.

Paieškos sistemas galima suskirstyti į universalias ir specializuotas paieškos sistemas.

Universalios paieškos sistemos:

AllTheWeb | AltaVista | Excite | Google | HotBot | Lycos |Ask

Specializuotos informacijos paieškos sistemos:

  1. Scholar Google | Scirus - (mokslinė informacija)
  2. Northernlight - (verslo informacija)
  3. Find Articles at BNET - (straipsnių paieška)

Naujienų paieškos sistemos:

AltaVista News | Yahoo News | RocketNews | Orange News

Paieškos sistemos vaikams:

Cybersleuth Kids | KidsClick | Yahoo Kids | Alfy | CyberKids

Multimedia paieškos sistemos:

Google Images | Altavista Image Search | AlltheWebLycos Images | Picsearch

Regioninės arba šalių paieškos sistemos:

Europos paieškos sistemos | Lietuvos paieškos sistema