Du har helt sikkert hørt det: der er blevet lækket en stor mængde informationer fra Google, som også indeholder informationer fra det organiske Google. Her får vi et indblik i de mekanismer, der ligger bag PageRank og andre linkrelaterede faktorer, der påvirker et websites rangering i deres søgeresultater. I denne artikel vil jeg se nærmere på de detaljer, der er blevet lækket, med fokus på links og linkbuilding.
Det har taget tid at finde hoved og hale i det her læk, der består af over 1600 sider fyldt med tekniske dokumenter og et utal af regler og parametre. Jeg har nærstuderet alt, der har med links og linkbuilding at gøre, og vil på et senere tidspunkt behandle andre emner fra lækket.
Indholdsfortegnelse
1. PageRank: vægt og kvalitet
Som jeg har proklameret så mange gange før, så er PageRank selvfølgelig stadig en aktiv del af Google, og derfor kommer det heller ikke som nogen overraskelse, at PageRank nævnes adskillige gange i dokumentet. PageRank er den popularitetsalgoritme, der gjorde Google populær; den er fundamentet for hele deres søgemaskine. Du kan læse meget mere om PageRank-konceptet i denne artikel, hvor jeg går i dybden med emnet.
PagerankWeight: Denne parameter indikerer den vægt, der gemmes i linkmaps for PageRank. Denne vægt påvirker rangeringen af sider baseret på kvaliteten og relevansen af links. Jo højere pagerank, jo mere indflydelse har linket på en sides placeringer i søgeresultaterne.
Linkmap: Et linkmap er en detaljeret mapping, der gemmer forskellige attributter og målepunkter for links mellem sider. Udover PageRank-vægt indeholder et linkmap også link-attributter (f.eks. nofollow), ankertekster og meget mere. Linkmappet bruges til at beregne den konkrete PageRank-score for en given side (styrke). Ikke at forveksle linkmappet med Googles Linkgraf, der benyttes til at repræsentere den overordnede struktur af internettets link-mønstre. Du kan læse meget mere om linkgrafen i denne artikel.
SourceType: Angiver kvaliteten af ankerets kildeside (den side, der linker). Attributten sourceType registrerer altså kvaliteten af kilden til et link i forhold til det trin, indholdet befinder sig i. Kort sagt betyder dette, at jo højere indekseringstrin en side har, jo højere værdi forventes links fra den side at have. Samtidig klassificeres links som enten TYPE_HIGH_QUALITY, TYPE_MEDIUM_QUALITY eller TYPE_LOW_QUALITY, baseret på linkets indekseringstrin. Herudover fremgår det, at sourcetype kan bruges som en indikator for et links vigtighed; Google bruger altså denne information til at bestemme linkets relative betydning.
Quality og trafik: Baserer sig måske en smule overraskende på antallet af klik, en given side modtager fra de organiske resultater. Dette betyder, at et link fra et website, der modtager mange klik fra de organiske resultater, har en større effekt end et link fra en side, der har få eller ingen. Spørgsmålet er, om PageRank overhovedet flyder igennem links, der kommer fra sider, der ligger i typen low quality? Mit bud er, at det gør der ikke. Dette bekræfter altså tesen om, at links fra sider, der selv har trafik, er bedre links end links fra sider, der ikke har trafik. Måske ikke specielt overraskende, men alligevel et emne, der har været vidt debatteret de sidste 5-10 år.
2. Links i nye udgivelser (TYPE_FRESHDOCS)
Samtidig nævnes det også, at “TYPE_FRESHDOCS” er en særlig kategori, og at den kan sidestilles med typen TYPE_HIGH_QUALITY i forhold til linkets vigtighed. Så links fra friske dokumenter, altså nyudgivne artikler/sider, vægter højere end links i ældre indhold. Det dokumenteres ikke direkte i dokumenterne, men man kan næsten kun forestille sig, at de to elementer kombineret giver det bedste afsæt – altså et link fra en side, der klassificeres som high quality og som netop har udgivet nyt indhold, hvor dit link er at finde i selve udgivelsen.
3. Interne vs. eksterne links (isLocal)
Denne bit indikerer, om ankerets kilde- og målsider er på samme domæne, dvs. om der er tale om et internt eller et eksternt link. Interne links bruges til en sammenhængende struktur og distribuering af PageRank-værdi og navigering af brugere, hvorimod eksterne links er en stærkere indikator for en sides autoritet og troværdighed, da anbefalingerne kommer fra andre websites.
4. Scoring og rangering
AggregatedScore: Dette er en score, der er samlet fra alle kilder, hvilket sandsynligvis inkluderer forskellige signaler som PageRank, relevans, aktualitet og andre faktorer, der påvirker den samlede score af et link. Denne aggregerede score giver et omfattende billede af linkets værdi som helhed. Scoren vil altså differentiere sig, alt efter hvad der linkes til og på hvilket website.
TopicalityWeight: Den tematiske vægtning, der tildeles hvert link, påvirkes af både PageRank fra den linkende side og relevansen af ankerteksten. Dette betyder, at et link fra en relevant side med høj PageRank har større værdi. Det bekræfter også, at relevansen på ankerteksten påvirker vægtningen – så ja, ankertekster har selvfølgelig stadig stor betydning.
5. Anker og hyperlink data
Google benytter data om ankertekster og links til at afdække, hvordan links er struktureret og anvendt i det indhold, hvor linket findes. Altså, hvor det er placeret, hvad det står i nærheden af, om det er relevant for websitet, der linkes til m.v. I de lækkede informationer finder vi disse faktorer:
- ByteEnd og ByteStart: Indeks for den sidste og første byte, der er dækket af hyperlinket. Denne information bruges til at identificere starten og slutningen af linkets placering i det samlede indhold. Denne information er essentiel for at kunne afgrænse det nøjagtige område, som hyperlinket dækker. Dette kan være afgørende for analyser af, hvordan linket påvirker tekstens struktur og læsbarhed.
- Phrase: Indeks for den første og sidste token, der er dækket af hyperlinket. Tokens refererer til ord eller orddele i teksten, og ved at kende indeksene for disse kan man få en detaljeret forståelse af, hvilke specifikke ord eller fraser der er forbundet via hyperlinket. Dette gør det muligt at analysere linkets kontekst på en mere granulær måde.
- URL: Den absolutte URL, som linket peger på. Dette er den fulde webadresse, der specificerer destinationen for hyperlinket. At have den eksakte URL er afgørende for at kunne evaluere linkets mål og dets relevans i forhold til indholdet. URL’en giver ikke blot en destination, men kan også afsløre informationer om domænets autoritet, relevans for emnet, og bidrage til forståelsen af den samlede linkprofils værdi.
6. Hjemmesidetroværdighed (homePageInfo)
Attributten homePageInfo i AnchorsAnchorSource-modulet er afgørende for at vurdere værdien af et link baseret på troværdigheden af dets kilde, især hjemmesiden for kildewebstedet.
- Hvad er homePageInfo? Attributten giver oplysninger om, hvorvidt kildesiden for et link er en hjemmeside, og dens troværdighedsniveau. De mulige værdier for homePageInfo er:
- NOT_HOMEPAGE: Kildesiden er ikke en hjemmeside.
- NOT_TRUSTED: Hjemmesiden betragtes ikke som troværdig.
- PARTIALLY_TRUSTED: Hjemmesiden har et moderat niveau af troværdighed.
- FULLY_TRUSTED: Hjemmesiden er fuldt troværdig.
Rolle i linkvurdering
- Troværdighedsevaluering:
- Hjemmesideindflydelse: Hvis kildesiden er hjemmesiden, tildeler homePageInfo direkte en troværdighedsværdi (NOT_TRUSTED, PARTIALLY_TRUSTED, FULLY_TRUSTED).
- Vægtning Mekanisme:
- Fuld troværdighed: Links fra fuldt troværdige hjemmesider får sandsynligvis højere vægt.
- Delvist troværdig: Links fra delvist troværdige hjemmesider får moderat vægt.
- Ikke troværdig: Links fra ikke-troværdige hjemmesider får lavere vægt.
Betydning
- SEO-Implikationer:
- Tjene links: At få links fra fuldt troværdige websteder, især deres hjemmesider, kan markant øge et websites troværdighed og placering i Googles søgeresultater.
- Kildetroværdighed: Troværdigheden af kildesidens hjemmeside er afgørende for at bestemme den samlede kvalitet og vægt af dens udgående links.
- Indvirkning på målside: Selvom homePageInfo vedrører kilden til linket, påvirker det i sidste ende målsidens linkprofil og opfattede autoritet baseret på den troværdighed, der er arvet fra kildens hjemmeside.
- Evaluering af linkkilder:
- Højkvalitets nyhedssider: Typisk klassificeret som fuldt troværdige, hvilket giver meget værdifulde links.
- Lavkvalitets sider: De med NOT_TRUSTED hjemmesider giver mindre indflydelsesrige links.
7. Udgående link data
Udgående links: Indeholder data om udgående hreflang-links, der optræder i det dokument, der behandles. Disse links kan påvirke sidens synlighed i forskellige regionale søgeresultater.
- ByteLength: Længden i bytes af linkteksten, hvilket kan være relevant for at vurdere linkets prominens i indholdet.
- ByteOffset: Byte-offset for starten af et link i det annoterede dokuments indhold, hvilket er vigtigt for at lokalisere linket præcist.
- IsNofollow: Indikerer, om linket er et nofollow-link, hvilket betyder, at det ikke skal videregive PageRank.
8. Kvalitet og lokalitet af links
Locality: For rangordningsformål måles kvaliteten af et anker ved dets “locality” og “bucket”. Dette betyder, at linkets værdi kan variere afhængigt af dets placering og sammenhæng.
- PagerankWeight: Vægt, der skal gemmes i linkmaps for PageRankeren, hvilket påvirker sidens samlede ranking
- ParallelLinks: Antallet af yderligere links fra samme kildeside til samme måldomæne, hvilket kan indikere linkets betydning
Reference: GoogleApi.ContentWarehouse.V1.Model.IndexingDocjoinerAnchorSpamInfo i filen leak.json. Se afsnittene om locality, bucket, pagerankWeight, og parallelLinks.
9. Linkspam og vurdering
Linkspam: Systemet IndexingDocjoinerAnchorSpamInfo vurderer og nedvurderer spammy ankertekster. En model, der analyserer ankertekster for at identificere potentielle spamlinks, så de kan filtreres fra i udregningen af siders værdi målt i links.
- Systemet holder styr på, hvornår links opdages ved at registrere tidsrammen fra det første til det sidste link i dokumentet. Det sammenligner, hvor mange af disse links der fremstår spammy med det samlede antal af links og beregner et forhold, som afgør, om links skal nedvurderes eller ej.
Klassifikation og nedjustering af links effekt
Når IndexingDocjoinerAnchorSpamInfo opdager, at en høj andel af ankertekster indeholder spamfraser, kan det resultere i en nedvurdering af disse links. Nedvurderingen indebærer, at links fra sider, der vurderes som spammy, mister deres betydning i Googles søgeresultater. Det kan ske for enten alle links i en bestemt periode eller kun for de links, der er direkte identificeret som spam. Modellen anvender også en beregnet værdi, der angiver, hvor stor sandsynligheden er for, at et link er spam.
Desuden tager systemet højde for troværdige kilder. Selv om linket kommer fra en troværdig kilde, bliver det altså vurderet på sin egen tekst. Systemet analyserer også eksempler på links fra troværdige kilder og bruger denne information til at forbedre nøjagtigheden i at identificere spammy links.
Eksempel:
Lad os forestille os en situation, hvor en ellers troværdig side indeholder nogle links til lavkvalitets- eller spammy websites. IndexingDocjoinerAnchorSpamInfo vil evaluere linkteksterne for at afgøre, om de indeholder spammy fraser – det vil sige ord eller udtryk, der ofte er forbundet med spam, i Danmark er gode eksempler på dette billig, priser, køb mv. kombineret med det primære, oftest kommercielle søgeord.
Selvom siden normalt ikke linkspammer og generelt har et godt omdømme, kan systemet stadig nedvurdere de udgående links, hvis de anses for at være spammy. Særligt hvis det vurderes, at de også peger på dårlige eller mistænkelige websites. Det vil helt konkret sige, at du kunne købe links fra et meget troværdigt website, men hvis dit eget website ikke er troværdigt, og hvis ankerteksten virker spammy, så har linket nul værdi for dit website. Omvendt, kan der på samme side være et link til en anden side, som giver værdi – så længe modtagerwebsitet og ankerteksten ikke er spammy, vil værdi overføres og ellers ikke.
Reference: GoogleApi.ContentWarehouse.V1.Model.IndexingDocjoinerAnchorSpamInfo i filen leak.json. Se afsnittene om spamProbability, demoted, phraseFraq, og trustedMatching.
Opsummering
Google-lækket bekræfter, at PageRank stadig er en helt central del af Googles algoritme, hvor links med høj PageRank har stor indflydelse på en sides rangering. Samtidig dokumenterer det, at links fra trafikstærke sider, som modtager mange klik fra organiske søgeresultater, har større værdi. Kildens kvalitet er afgørende: links fra sider af høj kvalitet vejer tungere end links fra lavkvalitetssider. Desuden har friske links fra nyligt udgivne artikler mere vægt end links fra ældre indhold.
Google bruger linkmaps til at vurdere PageRank, hvor detaljer som linkvægt, link-attributter og ankertekster indgår. Interne links understøtter navigering og PageRank-distribution internt, mens eksterne links bidrager til et websites autoritet og troværdighed. Links vurderes ud fra en samlet score, der omfatter PageRank, relevans og topicalitet, hvor den tematiske vægtning af links afhænger af både PageRank og ankertekstens relevans.
Google analyserer desuden ankertekster og hyperlinkdata for at forstå deres sammenhæng. Linkspam identificeres og nedvurderes, hvilket kan reducere værdien af links fra troværdige kilder, hvis de anses for at være “spammy”.
Samlet set understreger lækket, at det er vigtigt at få links fra relevante, trafikstærke og troværdige kilder samt at sikre, at ankertekster og linkkontekst er af høj kvalitet og ikke manipulerende på nogen måder.