Hvad er maskinlæring?
Maskinlæring er nok det begreb inden for AI der har størst direkte indflydelse på mit arbejde som SEO-konsulent. Det er den teknologi der gør at Google kan vurdere om en side fortjener at ranke nummer 1 eller nummer 100, og den bruges i alt fra Netflix-anbefalinger til kreditvurderinger i banker. Grundidéen er simpel nok: giv en computer en masse data og lad den selv finde mønstrene, i stedet for at en programmør skal sidde og kode reglerne manuelt.
Indholdsfortegnelse
Grundlæggende om maskinlæring (machine learning)
Maskinlæring kan deles op i tre hovedkategorier, og det er værd at forstå forskellen fordi de bruges til vidt forskellige ting.
Overvåget læring
Det er den type de fleste støder på. Man giver modellen et datasæt hvor hvert eksempel har et korrekt svar, en label, og så lærer algoritmen at forudsige det rigtige svar ud fra inputdataene. Tænk på det som at vise et barn 1000 billeder af katte og hunde med etiketter, og så bede det genkende det 1001. eksempel. Det er overvåget læring.
Uovervåget læring
Her er der ingen labels. Algoritmen får et datasæt og skal selv finde mønstre og strukturer. Det er som at give nogen en bunke LEGO uden manual og sige ‘find ud af hvad der hører sammen’. I praksis bruger man det til kundesegmentering, anomalidetektion og den slags. Jeg har set det brugt i SEO til at clustere søgeord automatisk, og det virker faktisk overraskende godt.
Forstærkningslæring
Den her type er fascinerende. En agent prøver sig frem i et miljø, får belønning for gode beslutninger og straf for dårlige, og lærer den optimale strategi over tid. Det var forstærkningslæring DeepMind brugte da de trænede AlphaGo til at slå verdensmesteren i Go. Agenten spillede bogstaveligt talt millioner af spil mod sig selv.
Anvendelser
Maskinlæring har ændret spillereglerne i en lang række brancher. I finansverdenen bruger bankerne det til at fange svindel og vurdere kreditværdighed. I sundhedssektoren hjælper det med diagnosticering og personaliseret medicin. Detailhandlen bruger det til at forudsige hvad kunderne vil købe og optimere lagerbeholdning. Og i transport handler det om logistik og ruteplanlægning.
Synes du det er svært at finde relevante linkbuilding-medier? Så prøv Bazoom – en af verdens største handelspladser for linkbuilding. Her finder du relevante medier fra stort set alle lande, opdelt efter sprog, kategori og domæneautoritet. Brug koden Bondtofte1500 og få 1.500 kr. i sign-up bonus (mod normalt 750 kr.).
Jeg ser det mest tydeligt i søgemaskiner, men det er overalt.
Forskellen på maskinlæring og deep learning
Det her spørgsmål får jeg tit. Maskinlæring er det brede begreb, deep learning er en specifik del af det. Deep learning bruger neurale netværk med mange lag og er fantastisk til kompleks mønstergenkendelse, men det kræver store mængder data og heftig computerkraft. Klassisk maskinlæring er mere tilgængelig for mindre datasæt og simplere problemer.
Så det handler ikke om hvad der er bedst. Det handler om hvad der passer til opgaven. Nogle gange er en simpel maskinlæringsmodel det rigtige valg, andre gange har du brug for et dybt neuralt netværk med milliarder af parametre.
Machine learning i søgemaskiner
Det er her jeg for alvor har set maskinlæring gøre en forskel i mit daglige arbejde. Google og Bing har brugt maskinlæring i årevis til at forbedre deres søgeresultater, og det er en af de primære grunde til at Google er så dominerende. De har simpelthen mere data at træne på end alle andre, og mere data betyder bedre modeller.
Forbedring af søgealgoritmer
Maskinlæring i søgealgoritmer handler om at forstå hvad brugeren egentlig mener. Algoritmerne analyserer søgeord, brugeradfærd og interaktioner med søgeresultaterne for at finde ud af hvad der er mest relevant. Det er synonymer, kontekst og intentionen bag søgningen der er i fokus. Og Google bliver bedre til det hele tiden, det kan jeg se direkte i de data jeg arbejder med for mine kunder.
Personalisering af søgeoplevelsen
Maskinlæring gør også at du og jeg kan søge på præcis det samme og få forskellige resultater. Google kigger på din tidligere søgehistorik, dine klik, din lokation og en masse andre signaler for at skræddersy resultaterne til dig. Det er smart, men det gør mit arbejde som SEO-konsulent mere kompliceret, fordi jeg ikke bare kan antage at alle ser de samme resultater.
Bekæmpelse af spam og lavkvalitetsindhold
Og så er der spam. Google bruger maskinlæring, og specifikt deep learning i deres SpamBrain algoritme, til at fange sider der forsøger at manipulere systemet. Jeg ser jævnligt sider der bliver ramt af SpamBrain, og det er næsten altid velfortjent. Falske links, tyndt indhold, cloaking, alt det fanger de nu med maskinlæring. Det er godt for branchen som helhed, selvom det selvfølgelig kan ramme uskyldige engang imellem.
Kilder og referencer
- Google AI: Machine Learning Crash Course
Googles gratis introduktion til maskinlæring
developers.google.com/machine-learning - Stanford CS229: Machine Learning
Stanfords berømte kursus i maskinlæring
cs229.stanford.edu - Scikit-learn Documentation
Dokumentation for det populære ML-bibliotek
scikit-learn.org