Overvåget vs ikke-overvåget læring: Nøgleforskelle

Indholdsfortegnelse:

Anonim

Hvad er Supervised Machine Learning?

I Supervised learning træner du maskinen ved hjælp af data, der er godt "mærket ". Det betyder, at nogle data allerede er tagget med det rigtige svar. Det kan sammenlignes med læring, der finder sted i nærværelse af en vejleder eller en lærer.

En overvåget læringsalgoritme lærer af mærkede træningsdata, hjælper dig med at forudsige resultater for uforudsete data. Succesfuld opbygning, skalering og implementering af nøjagtig overvåget maskinindlæring Datavidenskabsmodel tager tid og teknisk ekspertise fra et team af højt kvalificerede dataforskere. Desuden skal datavidenskaberen genopbygge modeller for at sikre, at den givne indsigt forbliver sand, indtil dens data ændres.

I denne vejledning lærer du

  • Hvad er Supervised Machine Learning?
  • Hvad er tilsyn uden opsyn?
  • Hvorfor overvåget læring?
  • Hvorfor undervisning uden opsyn?
  • Hvordan fungerer Supervised Learning?
  • Hvordan fungerer ikke-overvåget læring?
  • Typer af tilsyn med maskinindlæringsteknikker
  • Typer af ikke-overvågede teknikker til maskinindlæring
  • Overvåget vs Uovervåget læring

Hvad er tilsyn uden opsyn?

Uovervåget læring er en maskinlæringsteknik, hvor du ikke behøver at overvåge modellen. I stedet skal du lade modellen arbejde alene for at finde information. Det beskæftiger sig primært med de umærkede data.

Uovervåget læringsalgoritmer giver dig mulighed for at udføre mere komplekse behandlingsopgaver sammenlignet med overvåget læring. Selvom ikke-overvåget læring kan være mere uforudsigelig sammenlignet med andre naturlige læringsmetoder til dyb læring og forstærkning.

Hvorfor overvåget læring?

  • Overvåget læring giver dig mulighed for at indsamle data eller producere en dataoutput fra den tidligere erfaring.
  • Hjælper dig med at optimere ydeevenskriterier ved hjælp af erfaring
  • Overvåget maskinindlæring hjælper dig med at løse forskellige typer af virkelige beregningsproblemer.

Hvorfor undervisning uden opsyn?

Her er de vigtigste grunde til at bruge Uovervåget læring:

  • Uovervåget maskinindlæring finder alle slags ukendte mønstre i data.
  • Uovervågede metoder hjælper dig med at finde funktioner, der kan være nyttige til kategorisering.
  • Det finder sted i realtid, så alle inputdata, der skal analyseres og mærkes i nærværelse af elever.
  • Det er lettere at få umærkede data fra en computer end mærkede data, som kræver manuel indgriben.

Hvordan fungerer Supervised Learning?

For eksempel vil du træne en maskine, der hjælper dig med at forudsige, hvor lang tid det tager at køre hjem fra din arbejdsplads. Her starter du med at oprette et sæt mærkede data. Disse data inkluderer

  • Vejrforhold
  • Tid på dagen
  • Helligdage

Alle disse detaljer er dine input. Outputtet er den tid, det tog at køre hjem den specifikke dag.

Du ved instinktivt, at hvis det regner udenfor, så tager det dig længere tid at køre hjem. Men maskinen har brug for data og statistik.

Lad os nu se, hvordan du kan udvikle en overvåget læringsmodel af dette eksempel, som hjælper brugeren med at bestemme pendeltiden. Det første du skal oprette er et træningsdatasæt. Dette træningssæt indeholder den samlede pendeltid og tilsvarende faktorer som vejr, tid osv. Baseret på dette træningssæt kan din maskine muligvis se, at der er et direkte forhold mellem mængden af ​​regn og den tid, det tager at komme hjem.

Så det konstaterer, at jo mere det regner, jo længere kører du for at komme tilbage til dit hjem. Det ser muligvis også forbindelsen mellem det tidspunkt, du forlader arbejdet, og den tid du er på farten.

Jo tættere du er på 18, jo længere tid tager det for dig at komme hjem. Din maskine finder muligvis nogle af forholdet til dine mærkede data.

Dette er starten på din datamodel. Det begynder at påvirke, hvordan regn påvirker den måde, folk kører på. Det begynder også at se, at flere mennesker rejser i løbet af en bestemt tid på dagen.

Hvordan fungerer ikke-overvåget læring?

Lad os tage sagen om en baby og hendes familiehund.

Hun kender og identificerer denne hund. Et par uger senere bringer en familieven en hund med og prøver at lege med babyen.

Baby har ikke set denne hund tidligere. Men det genkender mange funktioner (2 ører, øjne, gå på 4 ben) er som hendes hund. Hun identificerer et nyt dyr som en hund. Dette er læring uden opsyn, hvor du ikke bliver undervist, men du lærer af dataene (i dette tilfælde data om en hund.) Hvis dette var overvåget læring, ville familievenen have fortalt barnet, at det er en hund.

Typer af tilsyn med maskinindlæringsteknikker

Regression:

Regressionsteknik forudsiger en enkelt outputværdi ved hjælp af træningsdata.

Eksempel: Du kan bruge regression til at forudsige husprisen ud fra træningsdata. Inputvariablerne vil være lokalitet, størrelse på et hus osv.

Klassifikation:

Klassificering betyder at gruppere output i en klasse. Hvis algoritmen forsøger at mærke input i to forskellige klasser, kaldes det binær klassifikation. Valg mellem mere end to klasser kaldes multiklasseklassifikation.

Eksempel : Bestemmelse af, om nogen vil være misligholdelse af lånet.

Styrker : Outputs har altid en sandsynlig fortolkning, og algoritmen kan reguleres for at undgå overmontering.

Svagheder : Logistisk regression kan underpræstere, når der er flere eller ikke-lineære beslutningsgrænser. Denne metode er ikke fleksibel, så den fanger ikke mere komplekse forhold.

Typer af ikke-overvågede teknikker til maskinindlæring

Uovervåget læringsproblemer grupperet yderligere i klyngeproblemer og tilknytningsproblemer.

Klyngedannelse

Klyngedannelse er et vigtigt begreb, når det gælder læring uden opsyn. Det handler primært om at finde en struktur eller et mønster i en samling af ukategoriserede data. Klyngealgoritmer behandler dine data og finder naturlige klynger (grupper), hvis de findes i dataene. Du kan også ændre, hvor mange klynger dine algoritmer skal identificere. Det giver dig mulighed for at justere granulariteten for disse grupper.

Forening

Tilknytningsregler giver dig mulighed for at etablere tilknytninger mellem dataobjekter i store databaser. Denne ikke-overvågede teknik handler om at opdage spændende sammenhænge mellem variabler i store databaser. For eksempel er folk, der køber et nyt hjem, mest sandsynligt at købe nye møbler.

Andre eksempler:

  • En undergruppe af kræftpatienter grupperet efter deres genekspressionsmålinger
  • Grupper af shopper baseret på deres browser- og indkøbshistorik
  • Filmgruppe efter vurdering givet af film seere

Overvåget vs Uovervåget læring

Parametre Overvåget maskinindlæringsteknik Uovervåget maskinlæringsteknik
Behandle I en overvåget læringsmodel vil input- og outputvariabler blive givet. I ikke-overvåget læringsmodel gives kun inputdata
Indtastningsdata Algoritmer trænes ved hjælp af mærkede data. Algoritmer bruges mod data, der ikke er mærket
Brugte algoritmer Støtte vektor maskine, neuralt netværk, lineær og logistisk regression, tilfældig skov og klassifikation træer. Uovervågede algoritmer kan opdeles i forskellige kategorier: som klyngealgoritmer, K-middel, hierarkisk klyngedeling osv.
Computational Complexity Overvåget læring er en enklere metode. Uovervåget læring er beregningsmæssigt kompleks
Brug af data Den overvågede læringsmodel bruger træningsdata til at lære et link mellem input og output. Uovervåget læring bruger ikke outputdata.
Nøjagtighed af resultater Meget nøjagtig og pålidelig metode. Mindre nøjagtig og pålidelig metode.
Realtidslæring Læringsmetoden foregår offline. Læringsmetoden finder sted i realtid.
Antal klasser Antal klasser er kendt. Antal klasser er ikke kendt.
Vigtigste ulempe Klassificering af big data kan være en reel udfordring i Supervised Learning. Du kan ikke få nøjagtige oplysninger om datasortering, og output som data, der bruges i ikke-overvåget læring, er mærket og ikke kendt.

Resumé

  • I Supervised learning træner du maskinen ved hjælp af data, der er godt "mærket".
  • Uovervåget læring er en maskinlæringsteknik, hvor du ikke behøver at overvåge modellen.
  • Overvåget læring giver dig mulighed for at indsamle data eller producere en dataoutput fra den tidligere erfaring.
  • Uovervåget maskinindlæring hjælper dig med at finde alle slags ukendte mønstre i data.
  • For eksempel vil du være i stand til at bestemme den tid, det tager at komme tilbage, baseret på vejrforhold, tidspunkter på dagen og ferie.
  • For eksempel kan baby identificere andre hunde baseret på tidligere overvåget læring.
  • Regression og klassificering er to typer overvågede maskinlæringsteknikker.
  • Klyngedannelse og tilknytning er to typer ikke-overvåget læring.
  • I en overvåget læringsmodel vil input- og outputvariabler blive givet, mens der med ikke-overvåget læringsmodel kun er inputdata