Chat with us, powered by LiveChat

Sådan fungerer en søgemaskine

I denne artikel, får du en introduktion til hvordan søgemaskiner fungerer i praksis. Artiklen vil både behandle emnet crawling samt emnet indeksering, disse to elementer danner tilsammen grundlaget for hvordan en søgemaskine fungerer.

Video-resumé

Ønsker du ikke at læse, kan du blot se nedenstående video og få et resumé.

Sådan fungerer en søgemaskine

Hver gang en bruger søger, er der flere tusinde og nogle gange mange millioner af websider, med nyttige oplysninger. Udvælgelsen af de resultater som søgemaskinen viser dig, starter langt tidligere end det tidspunkt, hvor søgeforespørgslen indtastes i en søgemaskine.

Før en bruger søger, organiserer søgemaskiner oplysninger om websider i deres indeks, der kan sammenlignes med et bibliotek, verdens største bibliotek.

I løbet af brøkdele af et sekund gennemgår søgemaskinens algoritmer milliarder af websider, i deres indeks, for at finde det mest relevante resultat, til den indtastede forespørgsel.

Hele denne proces, starter igennem crawling af Internettet.

Crawling

Søgemaskiner fungerer ved at crawle milliarder af websider, med deres egne webcrawlere. Søgemaskinernes botter downloader hjemmesider og følger links på siderne, for at finde nye tilgængelige websider.

Selve processen for crawling, begynder med en liste over webadresser som er kendt fra tidligere crawls, samt sitemaps, der leveres af websiteejere. Websiteejere kan henvise til Deres sitemaps igennem robots.txt eller eksempelvis Googles Search Console.

Ud fra disse lister, finder søgemaskinebotten andre sider, igennem links. Søgemaskinebotter er særligt opmærksomme på nye websites og ændringer af eksisterende websites, samt døde links.

En algoritme afgør, hvilke websites der skal crawles, hvor ofte de skal crawles og hvor mange sider der skal hentes. Værdier der varierer alt efter hvilken type af website der er tale om, eksempelvis besøges nyhedswebsites langt oftere end andre typer af hjemmesider, da de har en tendens til at blive opdateret langt mere frekvent.

Internettet vokser konstant og hver dag kommer der endnu mere nyt til. Ved at crawle Internettet og følger hjemmesider, ligesom et menneske ville gøre det, igennem links, der forbinder hjemmesider, finder og lagrer søgemaskiner konstant ny information til deres indeks.

Vil du vide mere om crawling? Så læs følgende artikel om emnet.

Organiseres i et indeks

Efter at en crawler har fundet en webside, gengives indholdet på siden, på samme måde som en browser gør det og der tages forbehold for signaler som opdateringsfrekvens, søgeord mv. Alt dette håndteres i selve indekset.

Søgemaskinernes indekse er ikke overraskende meget store, Googles indeks består af hundrede milliarder af websider og fylder mere end 100.000.000 GB.

Hvert eneste ord på alle hjemmesider indekseres og pålægges forskellige poster, der kan respondere på søgeforespørgsler i søgemaskinen.

Vil du vide mere om indeksering? Så læs følgende artikel om emnet.