Hvad er OLAP? Terning, operationer & Typer i datavarehus

Hvad er OLAP?

Online Analytical Processing (OLAP) er en kategori af software, der giver brugerne mulighed for at analysere information fra flere databasesystemer på samme tid. Det er en teknologi, der gør det muligt for analytikere at udtrække og se forretningsdata fra forskellige synsvinkler.

Analytikere har ofte brug for at gruppere, samle og sammenføje data. Disse operationer i relationsdatabaser er ressourceintensive. Med OLAP kan data beregnes og aggregeres på forhånd, hvilket gør analysen hurtigere.

OLAP-databaser er opdelt i en eller flere terninger. Terningerne er designet på en sådan måde, at det er let at oprette og se rapporter. OLAP står for Online Analytical Processing.

I denne vejledning lærer du-

  • OLAP-terning
  • Grundlæggende analytiske operationer af OLAP
  • Typer af OLAP-systemer
  • ROLAP
  • MOLAP
  • Hybrid OLAP
  • Fordele ved OLAP
  • Ulemper ved OLAP

OLAP-terning:

Kernen i OLAP-konceptet er en OLAP-terning. OLAP-terningen er en datastruktur optimeret til meget hurtig dataanalyse.

OLAP Cube består af numeriske fakta kaldet målinger, der er kategoriseret efter dimensioner. OLAP Cube kaldes også hypercube .

Normalt udføres datahandlinger og analyser ved hjælp af det enkle regneark, hvor dataværdier er arrangeret i række- og søjleformat. Dette er ideelt til to-dimensionelle data. OLAP indeholder dog flerdimensionelle data, hvor data normalt hentes fra en anden og ikke-relateret kilde. Brug af et regneark er ikke en optimal mulighed. Kuben kan gemme og analysere flerdimensionelle data på en logisk og ordnet måde.

Hvordan virker det?

Et datalager ville udtrække information fra flere datakilder og formater som tekstfiler, excel-ark, multimediefiler osv.

De ekstraherede data renses og transformeres. Data indlæses i en OLAP-server (eller OLAP-terning), hvor oplysningerne på forhånd beregnes på forhånd til yderligere analyse.

Grundlæggende analytiske operationer af OLAP

Fire typer analytiske operationer i OLAP er:

  1. Rul op
  2. Bore ned
  3. Skive og terninger
  4. Drej (drej)

1) Roll-up:

Roll-up er også kendt som "konsolidering" eller "sammenlægning." Oprulningsoperationen kan udføres på 2 måder

  1. Reducerende dimensioner
  2. Klatring op koncepthierarki. Koncepthierarki er et system til gruppering af ting baseret på deres rækkefølge eller niveau.

Overvej følgende diagram

  • I dette eksempel rullede byerne New jersey og Lost Angles sammen til land USA
  • Salget i New Jersey og Los Angeles er henholdsvis 440 og 1560. De bliver 2000 efter oprulning
  • I denne sammenlægningsproces flytter data sig til stedhierarki fra by til land.
  • Under oprulningsprocessen skal mindst en eller flere dimensioner fjernes. I dette eksempel fjernes kvaterdimension.

2) Udboring

I drill-down data er fragmenteret i mindre dele. Det er det modsatte af rollup-processen. Det kan gøres via

  • Bevæger os ned i begrebshierarkiet
  • Forøgelse af en dimension

Overvej diagrammet ovenfor

  • Quater Q1 bores ned til månederne januar, februar og marts. Tilsvarende salg er også registre.
  • I dette eksempel tilføjes dimensionmåneder.

3) Skive:

Her vælges en dimension, og der oprettes en ny underterning.

Følgende diagram forklarer, hvordan skiveoperationen udførte:

  • Dimensionstid opdeles med Q1 som filter.
  • En ny terning oprettes helt.

Terninger:

Denne operation svarer til et udsnit. Forskellen i terninger er, at du vælger 2 eller flere dimensioner, der resulterer i oprettelsen af ​​en underterning.

4) Drej

I Pivot roterer du dataakserne for at give en erstatning for præsentation af data.

I det følgende eksempel er drejningen baseret på varetyper.

Typer af OLAP-systemer

OLAP Hierarkisk struktur

Type OLAP Forklaring
Relationel OLAP (ROLAP): ROLAP er en udvidet RDBMS sammen med flerdimensionel datakortlægning for at udføre standard relationel operation.
Multidimensionel OLAP (MOLAP) MOLAP Implementerer operation i flerdimensionelle data.
Hybrid onlineanalytisk behandling (HOLAP) I HOLAP-tilgang lagres de samlede summer i en flerdimensionel database, mens de detaljerede data er gemt i den relationsdatabase. Dette giver både dataeffektivitet i ROLAP-modellen og ydeevnen i MOLAP-modellen.
Desktop OLAP (DOLAP) I Desktop OLAP downloader en bruger en del af dataene lokalt fra databasen eller på deres skrivebord og analyserer dem. DOLAP er relativt billigere at implementere, da det tilbyder meget få funktioner sammenlignet med andre OLAP-systemer.
Web OLAP (WOLAP) Web OLAP, som er OLAP-system tilgængeligt via webbrowseren. WOLAP er en tredelt arkitektur. Den består af tre komponenter: klient, middleware og en databaseserver.
Mobil OLAP: Mobile OLAP hjælper brugere med at få adgang til og analysere OLAP-data ved hjælp af deres mobile enheder
Rumlig OLAP: SOLAP er oprettet for at lette styring af både geografiske og ikke-geografiske data i et geografisk informationssystem (GIS)

ROLAP

ROLAP arbejder med data, der findes i en relationsdatabase. Fakta og dimensionstabeller gemmes som relationstabeller. Det tillader også flerdimensionel analyse af data og er den hurtigst voksende OLAP.

Fordele ved ROLAP-modellen:

  • Høj dataeffektivitet. Det giver høj dataeffektivitet, fordi forespørgselens ydeevne og adgangssprog er optimeret især til den flerdimensionale dataanalyse.
  • Skalerbarhed. Denne type OLAP-system tilbyder skalerbarhed til styring af store datamængder, og selv når dataene stiger konstant.

Ulemper ved ROLAP-modellen:

  • Efterspørgsel efter højere ressourcer: ROLAP har brug for høj udnyttelse af arbejdskraft, software og hardware ressourcer.
  • Samlet databegrænsninger. ROLAP-værktøjer bruger SQL til al beregning af samlede data. Der er dog ingen faste grænser for håndtering af beregninger.
  • Langsom forespørgsel. Forespørgselsydelse i denne model er langsom sammenlignet med MOLAP

MOLAP

MOLAP bruger array-baserede flerdimensionelle lagermotorer til at vise flerdimensionelle visninger af data. Dybest set bruger de en OLAP-terning.

Lær mere om OLAP her

Hybrid OLAP

Hybrid OLAP er en blanding af både ROLAP og MOLAP. Det giver hurtig beregning af MOLAP og højere skalerbarhed af ROLAP. HOLAP bruger to databaser.

  1. Samlede eller beregnede data lagres i en flerdimensionel OLAP-terning
  2. Detaljerede oplysninger gemmes i en relationsdatabase.

Fordele ved hybrid OLAP:

  • Denne form for OLAP hjælper med at spare diskplads, og den forbliver også kompakt, hvilket hjælper med at undgå problemer relateret til adgangshastighed og bekvemmelighed.
  • Hybrid HOLAP bruger kubeteknologi, som giver hurtigere ydeevne for alle typer data.
  • ROLAP opdateres øjeblikkeligt, og HOLAP-brugere har adgang til disse øjeblikkeligt opdaterede data i realtid. MOLAP bringer rengøring og konvertering af data og forbedrer dermed dateres relevans. Dette bringer det bedste fra begge verdener.

Ulemper ved hybrid OLAP:

  • Større kompleksitetsniveau : Den største ulempe ved HOLAP-systemer er, at den understøtter både ROLAP- og MOLAP-værktøjer og applikationer. Således er det meget kompliceret.
  • Potentielle overlapninger : Der er større chancer for at overlappe især deres funktionalitet.

Fordele ved OLAP

  • OLAP er en platform til alle former for forretning, herunder planlægning, budgettering, rapportering og analyse.
  • Oplysninger og beregninger er ensartede i en OLAP-terning. Dette er en afgørende fordel.
  • Opret og analyser hurtigt "Hvad hvis" -scenarier
  • Søg let i OLAP-database efter brede eller specifikke termer.
  • OLAP leverer byggestenene til forretningsmodelleringsværktøjer, Data mining-værktøjer, performance rapporteringsværktøjer.
  • Gør det muligt for brugere at udføre data i skive- og terningsterning efter forskellige dimensioner, mål og filtre.
  • Det er godt til analyse af tidsserier.
  • Det er nemt at finde nogle klynger og outliers med OLAP.
  • Det er et kraftfuldt visualiseringsanalysesystem, der giver hurtigere svartider

Ulemper ved OLAP

  • OLAP kræver organisering af data i et stjerne- eller snefnugskema. Disse skemaer er komplicerede at implementere og administrere
  • Du kan ikke have et stort antal dimensioner i en enkelt OLAP-terning
  • Transaktionsdata kan ikke tilgås med OLAP-systemet.
  • Enhver ændring i en OLAP-terning kræver en fuld opdatering af terningen. Dette er en tidskrævende proces

Resumé:

  • OLAP er en teknologi, der gør det muligt for analytikere at udtrække og se forretningsdata fra forskellige synsvinkler.
  • Kernen i OLAP-konceptet er en OLAP-terning.
  • Forskellige forretningsapplikationer og andre datafunktioner kræver brug af OLAP Cube.
  • Der er primære fem typer analytiske operationer i OLAP 1) Roll-up 2) Drill-down 3) Skive 4) Terninger og 5) Pivot
  • Tre typer af udbredte OLAP-systemer er MOLAP, ROLAP og Hybrid OLAP.
  • Desktop OLAP, Web OLAP og Mobile OLAP er nogle andre typer OLAP-systemer.

Interessante artikler...