Hvordan fungerer crawling?
Søgemaskiner fungerer ved at crawle sider på Internettet med deres web crawlers, Googles webcrawlers hedder GoogleBot og der findes mange af dem, ikke kun en enkelt. Googlebot har travlt, den skal finde alle nye sider på Internettet og samtidig holde øje med sider der bliver opdateret med ny information.
Søgemaskinebotter navigerer Internettet ved at følge links på sider de crawler. Hver gang en søgemaskinebot falder over et link det ikke har set før, vil den prøve at følge det, for at finde ud af hvad der findes på den pågældende side. Når hjemmesideadressen først er registreret og crawlet, skal den efterfølgende indekseres.

Googlebot crawler
Det er vigtigt, at man forstår hvordan en webcrawler fungerer, hvis man ønsker at arbejde med og forbedre sine organiske placeringer i søgeresultaterne.
Google's forskellige crawlers
Googlebot Desktop
Crawling af desktop versioner af websites
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)Googlebot Smartphone
Mobile-first indexing og smartphone crawling
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)Googlebot Image
Crawling og indeksering af billeder
Googlebot-Image/1.0Googlebot Video
Video content discovery og indeksering
Googlebot-Video/1.0Googlebot News
Nyhedsindhold til Google News
Googlebot-NewsGoogle-InspectionTool
URL Inspection Tool i Search Console
Mozilla/5.0 (compatible; Google-InspectionTool/1.0)Hvad er crawling?
Når der indtastes en søgeforespørgsel i en søgemaskine, kunne man måske foranlediges til at tro, at søgemaskinen kiggede hele Internettet igennem for at levere svar.
Det gør de i princippet også, men de svar de leverer, kender de allerede til, de er allerede blevet crawlet og efterfølgende indekseret så de lynhurtigt kan gengives for søgemaskinens brugere.
Søgemaskiner er afhængige af store databaser over sider, og det er i de databaser du søger, ikke hele Internettet.
Databasen er fyldt op med sider, søgemaskinen allerede har godkendt som gode og brugbare svar, der kan bruges til at matche brugeres forespørgsler med.
Søgemaskinebotter (crawlere) har i princippet kun to opgaver de skal løse:
Herefter analyseres indholdet og sorteres, for dernæst at lande i søgemaskinernes indeks.
Botterne tager dog forbehold for hvad der sendes til indeksering, eksempelvis vil sider der bryder loven ikke blive sendt videre til indeksering, det kunne eksempelvis være sådan noget som salg af våben, narkotika eller andet illegalt.
💡 Næste skridt: Vil du vide mere om hvad der sker, efter crawlerne har leveret informationen tilbage til Google og indekseringsprocessen startes? Så læs videre om indeksering, i denne artikel.
Crawl budget faktorer
Crawl Demand
Høj indflydelseHvor meget Google ønsker at crawle dit site
Crawl Rate Limit
Medium-høj indflydelseMaksimum crawling hastighed uden at skade site performance
Crawl Health
Høj indflydelseSite sundhed og teknisk tilstand
Site arkitektur for optimal crawling
Flat Site Structure
KritiskReducer antallet af klik fra homepage til enhver side
Strategic Internal Linking
HøjIntelligent linking for at guide crawlers til vigtige sider
URL Optimization
Medium-højSEO-venlige og crawler-venlige URL strukturer
Mobile-First Architecture
KritiskDesign site struktur med mobile crawling som prioritet
Almindelige crawling problemer
Crawler Blocking
KritiskAccidental blocking af søgemaskine crawlers
Infinite Crawl Spaces
HøjFaceted navigation og parameterized URLs creating infinite paths
Slow Server Response
Medium-højHøje server response times impacting crawl efficiency
JavaScript Rendering Issues
MediumContent hidden behind JavaScript som crawlers kan ikke access
Robots.txt direktiver for crawling kontrol
User-agent
Specificer hvilken crawler reglerne gælder for
User-agent: *User-agent: * (alle crawlers)User-agent: Googlebot (kun Googlebot)User-agent: Bingbot (kun Bingbot)User-agent: Googlebot-Image (kun Google Image crawler)Disallow
Block crawlers fra at access specific paths
Disallow: /path/Disallow: /admin/ (block admin section)Disallow: /*?print=1 (block print versions)Disallow: /search (block search result pages)Disallow: / (block entire site)Allow
Explicit allow access til paths (overstyre Disallow)
Allow: /path/Allow: /admin/public/Allow: /*.cssAllow: /*.jsAllow: /wp-admin/admin-ajax.phpSitemap
Reference til XML sitemap location
Sitemap: https://domain.com/sitemap.xmlSitemap: https://site.com/sitemap.xmlSitemap: https://site.com/sitemap-index.xmlSitemap: https://site.com/news-sitemap.xmlSitemap: https://site.com/image-sitemap.xmlFå de nyeste SEO tips og tricks direkte i din indbakke.
Tilmeld nyhedsbrevOfte stillede spørgsmål
Hvad er crawling?
Crawling er processen hvor søgemaskiner bruger web crawlers (som Googlebot) til at opdage og besøge sider på internettet. Crawlerne følger links fra side til side for at finde nyt indhold og opdateringer, som derefter kan blive indekseret i søgemaskinens database.
Hvordan fungerer Googlebot?
Googlebot er Googles web crawler som navigerer internettet ved at følge links på sider den crawler. Den har forskellige versioner til desktop, mobile, billeder og video. Googlebot opdager nye sider gennem links, sitemaps og URL submissions i Search Console.
Hvad påvirker hvor ofte min side bliver crawlet?
Crawl frequency påvirkes af site authority, content freshness, site performance, internal linking struktur og crawl budget. Sites med højere autoritet og hyppige opdateringer crawles oftere end statiske sites med lav autoritet.
Hvordan kan jeg forbedre min sides crawlability?
Optimer site speed, fix crawl errors, implementer clear internal linking, brug XML sitemaps, optimer robots.txt, reducér duplicate content og sikr at vigtige sider er tilgængelige gennem interne links fra andre crawlede sider.
Hvad er crawl budget og hvorfor er det vigtigt?
Crawl budget er det antal sider Googlebot vil crawle på dit site indenfor en given periode. Det påvirkes af site performance, server capacity og content quality. Vigtige sider skal prioriteres for at sikre optimal usage af crawl budget.
Kan jeg kontrollere hvilke sider der crawles?
Ja, gennem robots.txt kan du guide crawlers til at undgå specifikke sider eller directories. Du kan også bruge noindex tags, canonical tags og strategic internal linking til at optimere hvilke sider der prioriteres for crawling og indexing.
Brug for hjælp til teknisk SEO og crawling?
Fra crawl budget optimering til avanceret site arkitektur - eksperthjælp til optimal crawling.