Download PDF
1) Hvad er maskinindlæring?
Maskinindlæring er en gren af datalogi, der beskæftiger sig med systemprogrammering for automatisk at lære og forbedre med erfaring. For eksempel: Robotter er programmeret, så de kan udføre opgaven baseret på data, de indsamler fra sensorer. Det lærer automatisk programmer fra data.
2) Nævn forskellen mellem Data Mining og Machine Learning?
Maskinindlæring vedrører undersøgelse, design og udvikling af algoritmerne, der giver computere mulighed for at lære uden at være eksplicit programmeret. Mens data mining kan defineres som den proces, hvor de ustrukturerede data forsøger at udtrække viden eller ukendte interessante mønstre. I løbet af denne procesmaskine bruges læringsalgoritmer.
3) Hvad er 'overfitting' i maskinindlæring?
I maskinlæring, når en statistisk model beskriver tilfældig fejl eller støj i stedet for underliggende forhold, opstår der 'overmontering'. Når en model er for kompleks, observeres overfitting normalt på grund af at have for mange parametre med hensyn til antallet af træningsdatatyper. Modellen udviser dårlig præstation, som har været overfit.
4) Hvorfor overfitting sker?
Muligheden for overmontering eksisterer, da kriterierne, der anvendes til træning af modellen, ikke er de samme som kriterierne, der anvendes til at bedømme effektiviteten af en model.
5) Hvordan kan du undgå overmontering?
Ved at bruge en masse data kan overfitting undgås, overfitting sker relativt, da du har et lille datasæt, og du prøver at lære af det. Men hvis du har en lille database, og du er tvunget til at komme med en model baseret på det. I en sådan situation kan du bruge en teknik kendt som krydsvalidering . I denne metode opdeles datasættet i to sektioner, test og træningsdatasæt, testdatasættet tester kun modellen, mens datapunkterne i træningsdatasættet kommer op med modellen.
I denne teknik får en model normalt et datasæt med kendte data, hvorpå træning (træningsdatasæt) køres, og et datasæt med ukendte data, som modellen testes mod. Ideen med krydsvalidering er at definere et datasæt til at "teste" modellen i træningsfasen.
6) Hvad er induktiv maskinindlæring?
Den induktive maskinindlæring involverer processen med at lære ved eksempler, hvor et system fra et sæt observerede tilfælde forsøger at fremkalde en generel regel.
7) Hvad er de fem populære algoritmer inden for maskinlæring?
- Beslutningstræer
- Neurale netværk (spredning af ryggen)
- Probabilistiske netværk
- Nærmeste nabo
- Support vektor maskiner
8) Hvad er de forskellige algoritmeteknikker i maskinindlæring?
De forskellige typer teknikker inden for maskinlæring er
- Overvåget læring
- Uovervåget læring
- Semi-overvåget læring
- Forstærkningslæring
- Transduktion
- At lære at lære
9) Hvad er de tre faser, der bygger hypoteserne eller modellen i maskinindlæring?
- Modelbygning
- Model test
- Anvendelse af modellen
10) Hvad er standardmetoden til overvåget læring?
Standardmetoden til overvåget læring er at opdele eksemplet i træningssættet og testen.
11) Hvad er 'Træningssæt' og 'Testsæt'?
Inden for forskellige områder af informationsvidenskab som maskinindlæring bruges et sæt data til at opdage det potentielt forudsigelige forhold kendt som 'Training Set'. Træningssæt er eksempler, der gives til eleven, mens testsæt bruges til at teste nøjagtigheden af de hypoteser, der genereres af eleven, og det er eksemplet, der holdes tilbage fra eleven. Træningssættet adskiller sig fra testsættet.
12) Noter forskellige tilgange til maskinlæring?
De forskellige tilgange i maskinlæring er
- Koncept Vs klassifikationsindlæring
- Symbolisk mod statistisk læring
- Induktiv vs analytisk læring
13) Hvad er ikke maskinlæring?
- Kunstig intelligens
- Regelbaseret slutning
14) Forklar hvad er funktionen af 'Uovervåget læring'?
- Find klynger af dataene
- Find lavdimensionelle repræsentationer af dataene
- Find interessante anvisninger i data
- Interessante koordinater og korrelationer
- Find nye observationer / database rengøring
15) Forklar hvad er funktionen af 'Supervised Learning'?
- Klassifikationer
- Tale genkendelse
- Regression
- Forudsig tidsserier
- Kommenter strenge
16) Hvad er algoritmeuafhængig maskinindlæring?
Maskinindlæring hvor matematiske fundamenter er uafhængige af en bestemt klassifikator eller indlæringsalgoritme kaldes algoritmeuafhængig maskinindlæring?
17) Hvad er forskellen mellem kunstig læring og maskinindlæring?
Design og udvikling af algoritmer i henhold til adfærd baseret på empiriske data er kendt som Machine Learning. Mens kunstig intelligens ud over maskinindlæring dækker det også andre aspekter som videnrepræsentation, naturlig sprogbehandling, planlægning, robotik osv.
18) Hvad er klassifikator i maskinindlæring?
En klassifikator i en maskinindlæring er et system, der indlæser en vektor af diskrete eller kontinuerlige funktionsværdier og udsender en enkelt diskret værdi, klassen.
19) Hvad er fordelene ved Naive Bayes?
I Naïve Bayes vil klassifikator konvergere hurtigere end diskriminerende modeller som logistisk regression, så du har brug for færre træningsdata. Den største fordel er, at den ikke kan lære interaktioner mellem funktioner.
20) I hvilke områder anvendes mønstergenkendelse?
Mønstergenkendelse kan bruges i
- Computervision
- Tale genkendelse
- Data Mining
- Statistikker
- Uformel hentning
- Bioinformatik
21) Hvad er genetisk programmering?
Genetisk programmering er en af de to teknikker, der anvendes i maskinlæring. Modellen er baseret på testning og valg af det bedste valg blandt et sæt resultater.
22) Hvad er induktiv logisk programmering i maskinindlæring?
Induktiv logisk programmering (ILP) er et underfelt af maskinindlæring, der bruger logisk programmering, der repræsenterer baggrundsviden og eksempler.
23) Hvad er modelvalg i maskinindlæring?
Processen med at vælge modeller blandt forskellige matematiske modeller, der bruges til at beskrive det samme datasæt, er kendt som Model Selection. Modelvalg anvendes på områderne statistik, maskinindlæring og datamining.
24) Hvad er de to metoder, der anvendes til kalibrering i Supervised Learning?
De to metoder, der anvendes til at forudsige gode sandsynligheder i tilsynet læring er
- Platt kalibrering
- Isotonisk regression
Disse metoder er designet til binær klassificering, og det er ikke trivielt.
25) Hvilken metode bruges ofte til at forhindre overmontering?
Når der er tilstrækkelige data, anvendes 'Isotonisk regression' til at forhindre et problem med overmontering.
26) Hvad er forskellen mellem heuristisk for regelindlæring og heuristik for beslutningstræer?
Forskellen er, at heuristikkerne for beslutningstræer evaluerer den gennemsnitlige kvalitet af et antal usammenhængende sæt, mens regelelever kun vurderer kvaliteten af det sæt tilfælde, der er dækket af kandidatreglen.
27) Hvad er Perceptron i maskinlæring?
I Machine Learning er Perceptron en algoritme til overvåget klassificering af input i en af flere mulige ikke-binære output.
28) Forklar de to komponenter i det bayesiske logikprogram?
Bayesisk logikprogram består af to komponenter. Den første komponent er en logisk; den består af et sæt Bayesian-klausuler, der fanger domænets kvalitative struktur. Den anden komponent er kvantitativ, den koder for den kvantitative information om domænet.
29) Hvad er Bayesian Networks (BN)?
Bayesian Network bruges til at repræsentere den grafiske model for sandsynlighedsforhold blandt et sæt variabler.
30) Hvorfor instansbaseret læringsalgoritme undertiden kaldet Lazy learning algoritme?
Instansbaseret læringsalgoritme kaldes også Lazy learning-algoritme, da de forsinker induktions- eller generaliseringsprocessen, indtil klassificeringen udføres.
31) Hvad er de to klassificeringsmetoder, som SVM (Support Vector Machine) kan håndtere?
- Kombination af binære klassifikatorer
- Ændring af binær for at inkorporere multiklasselæring
32) Hvad er ensembleindlæring?
For at løse et bestemt beregningsprogram genereres og kombineres flere modeller, såsom klassifikatorer eller eksperter. Denne proces er kendt som ensembleindlæring.
33) Hvorfor bruges ensembleindlæring?
Ensembleindlæring bruges til at forbedre klassificeringen, forudsigelsen, funktionstilnærmelsen osv. Af en model.
34) Hvornår skal man bruge ensembleindlæring?
Ensembleindlæring bruges, når du bygger komponentklassifikatorer, der er mere nøjagtige og uafhængige af hinanden.
35) Hvad er de to paradigmer for ensemblemetoder?
De to paradigmer for ensemblemetoder er
- Sekventielle ensemble metoder
- Parallelle ensemblemetoder
36) Hvad er det generelle princip for en ensemblemetode, og hvad er bagging og boosting i ensemblemetoden?
Det generelle princip for en ensemblemetode er at kombinere forudsigelser af flere modeller bygget med en given indlæringsalgoritme for at forbedre robustheden over en enkelt model. Bagging er en metode i ensemblet til forbedring af ustabile skøn eller klassificeringsordninger. Mens boosting-metoden bruges sekventielt til at reducere bias i den kombinerede model. Boosting og Bagging begge kan reducere fejl ved at reducere variansperioden.
37) Hvad er bias-variansnedbrydning af klassifikationsfejl i ensemblemetoden?
Den forventede fejl i en læringsalgoritme kan nedbrydes til bias og varians. En bias-term måler, hvor tæt den gennemsnitlige klassifikator produceret af indlæringsalgoritmen matcher målfunktionen. Variansudtrykket måler, hvor meget forudsigelsen af indlæringsalgoritmen svinger for forskellige træningssæt.
38) Hvad er en inkrementel læringsalgoritme i ensemblet?
Inkrementel læringsmetode er en algoritmes evne til at lære af nye data, der muligvis er tilgængelige, efter at klassificering allerede er genereret fra allerede tilgængeligt datasæt.
39) Hvad bruges PCA, KPCA og ICA til?
PCA (Principal Components Analysis), KPCA (Kernel based Principal Component Analysis) og ICA (Independent Component Analysis) er vigtige trækekstraktionsteknikker, der anvendes til dimensioneringsreduktion.
40) Hvad er dimensionreduktion i maskinindlæring?
I maskinindlæring og statistik er dimensionreduktion processen med at reducere antallet af tilfældige variabler under overvejelser og kan opdeles i funktionsvalg og funktionsekstraktion.
41) Hvad er supportvektormaskiner?
Supportvektormaskiner er overvågede læringsalgoritmer, der bruges til klassificering og regressionsanalyse.
42) Hvad er komponenterne i relationelle evalueringsteknikker?
De vigtige komponenter i relationelle evalueringsteknikker er
- Dataindsamling
- Ground Truth Acquisition
- Krydsvalideringsteknik
- Forespørgselstype
- Scoringsmåling
- Betydningstest
43) Hvad er de forskellige metoder til sekventiel overvåget læring?
De forskellige metoder til at løse problemer med sekventiel overvåget læring er
- Metoder til skydevindue
- Tilbagevendende skydevinduer
- Skjulte Markow-modeller
- Maksimal entropi Markow-modeller
- Betingede tilfældige felter
- Graftransformator netværk
44) Hvad er de områder inden for robotteknologi og informationsbehandling, hvor der opstår sekventielt forudsigelsesproblem?
Områderne inden for robotteknologi og informationsbehandling, hvor der opstår et sekventielt forudsigelsesproblem
- Efterligningslæring
- Struktureret forudsigelse
- Modelbaseret forstærkningslæring
45) Hvad er batch statistisk læring?
Statistiske læringsteknikker gør det muligt at lære en funktion eller en forudsigelse fra et sæt observerede data, der kan forudsige usete eller fremtidige data. Disse teknikker giver garantier for ydeevnen for den indlærede forudsigelse for fremtidige usynlige data baseret på en statistisk antagelse om data genereringsprocessen.
46) Hvad er PAC-læring?
PAC (sandsynligvis ca. korrekt) læring er en læringsramme, der er blevet introduceret til at analysere indlæringsalgoritmer og deres statistiske effektivitet.
47) Hvad er de forskellige kategorier, du kan kategorisere sekvensindlæringsprocessen?
- Forudsigelse af sekvensen
- Sekvensgenerering
- Sekvensgenkendelse
- Sekventiel beslutning
48) Hvad er sekvenslæring?
Sekvenslæring er en metode til undervisning og læring på en logisk måde.
49) Hvad er to teknikker til maskinindlæring?
De to teknikker til maskinindlæring er
- Genetisk programmering
- Induktiv læring
Anbefalingsmotoren implementeret af større e-handelswebsteder bruger Machine Learning.