Top 30 Hbase Interview Spørgsmål & Svar

Anonim

Download PDF

Følgende er ofte stillede spørgsmål i interviews for nybegyndere såvel som erfaren HBase-udvikler.

1) Forklar hvad der er Hbase?

Hbase er et kolonneorienteret databasestyringssystem, der kører oven på HDFS (Hadoop Distribute File System). Hbase er ikke en relationel datalager, og den understøtter ikke struktureret forespørgselssprog som SQL.

I Hbase regulerer en masternode klyngen og regionserverne til at gemme dele af tabellerne og styrer arbejdet med dataene.

2) Forklar hvorfor man bruger Hbase?

  • Højkapacitetslagringssystem
  • Distribueret design til at imødekomme store borde
  • Søjleorienterede butikker
  • Vandret skalerbar
  • Høj ydeevne og tilgængelighed
  • Hbase's grundlæggende mål er millioner af kolonner, tusinder af versioner og milliarder af rækker
  • I modsætning til HDFS (Hadoop Distribute File System) understøtter det tilfældige CRUD-operationer i realtid

3) Nævn, hvad er nøglekomponenterne i Hbase?

  • Zookeeper: Det udfører koordineringsarbejdet mellem klient og Hbase Maser
  • Hbase Master: Hbase Master overvåger regionserveren
  • RegionServer: RegionServer overvåger regionen
  • Region: Den indeholder i hukommelsesdatalager (MemStore) og Hfile.
  • Katalogtabeller: Katalogtabeller består af ROOT og META

4) Forklar, hvad består Hbase af?

  • Hbase består af et sæt tabeller
  • Og hver tabel indeholder rækker og kolonner som traditionel database
  • Hver tabel skal indeholde et element defineret som en primær nøgle
  • Hbase-kolonne angiver en attribut for et objekt

5) Nævn, hvor mange operationelle kommandoer i Hbase?

Operationel kommando i Hbases handler om fem typer

  • Sætte
  • Slet
  • Scan
  • Forøgelse

6) Forklar hvad der er WAL og Hlog i Hbase?

WAL (Write Ahead Log) svarer til MySQL BIN-log; det registrerer alle ændringer, der forekommer i data. Det er en standard sekvensfil af Hadoop, og den gemmer HLogkey's. Disse nøgler består af et fortløbende nummer såvel som faktiske data og bruges til at afspille endnu ikke vedvarende data efter et servernedbrud. Så kontant for serverfejl fungerer WAL som en livslinje og henter de mistede data.

7) Hvornår skal du bruge Hbase?

  • Datastørrelsen er enorm: Når du har tonsvis af og millioner af poster at køre
  • Komplet redesign: Når du flytter RDBMS til Hbase, betragter du det som et komplet re-design, så du bare skifter porte
  • SQL-Less kommandoer: Du har flere funktioner som transaktioner; indre sammenføjninger, indtastede kolonner osv.
  • Infrastrukturinvestering: Du skal have klynger nok til, at Hbase kan være virkelig nyttig

8) Hvad er kolonnefamilier i Hbase?

Søjlefamilier udgør den grundlæggende enhed til fysisk opbevaring i Hbase, som funktioner som kompression anvendes.

9) Forklar hvad er række-tasten?

Rækketast defineres af applikationen. Da den kombinerede nøgle er forudfastsat af rækkevælgeren, gør det applikationen i stand til at definere den ønskede sorteringsrækkefølge. Det tillader også logisk gruppering af celler og sørg for, at alle celler med den samme rækkeknap er co-placeret på den samme server.

10) Forklar sletning i Hbase? Nævn, hvad er de tre typer gravstenmarkører i Hbase?

Når du sletter cellen i Hbase, slettes dataene faktisk ikke, men der sættes en gravstenmarkør, hvilket gør de slettede celler usynlige. Hbase slettet fjernes faktisk under komprimering.

Tre typer gravstensmarkører er der:

  • Version sletningsmarkør: Til sletning markerer den en enkelt version af en kolonne
  • Markering af kolonnesletning: Til sletning markerer det alle versionerne af en kolonne
  • Markør for sletning af familie: Til sletning markerer det alle kolonner for en kolonnefamilie

11) Forklar, hvordan sletter Hbase faktisk en række?

I Hbase, uanset hvad du skriver, gemmes fra RAM til disk, er disse diskskrivninger uforanderlig spærringskompaktering. Under sletningsprocessen i Hbase sletter større komprimeringsprocesser markør, mens mindre komprimeringer ikke gør det. I normale sletninger resulterer det i en sletning af gravstenmarkør - disse sletningsdata, de repræsenterer, fjernes under komprimering.

Hvis du sletter data og tilføjer flere data, men med et tidligere tidsstempel end gravstenens tidsstempel, kan yderligere Gets blive maskeret af sletnings- / gravstenmarkøren, og du vil derfor ikke modtage den indsatte værdi før efter den store komprimering.

12) Forklar hvad der sker, hvis du ændrer blokstørrelsen for en kolonnefamilie i en allerede optaget database?

Når du ændrer blokstørrelsen for kolonnefamilien, optager de nye data den nye blokstørrelse, mens de gamle data forbliver inden for den gamle blokstørrelse. Under datakomprimering tager gamle data den nye blokstørrelse. Nye filer, når de skylles, har en ny blokstørrelse, mens eksisterende data fortsat læses korrekt. Alle data skal omdannes til den nye blokstørrelse efter den næste store komprimering.

13) Nævn forskellen mellem Hbase og Relational Database?

Hbase Relationel database
  • Det er skemafri
  • Det er en kolonneorienteret datalager
  • Det bruges til at gemme de-normaliserede data
  • Den indeholder tyndt befolkede tabeller
  • Automatiseret partitionering udføres i Hbase
  • Det er en skemabaseret database
  • Det er en rækkeorienteret datalager
  • Det bruges til at gemme normaliserede data
  • Den indeholder tynde borde
  • Der er ingen sådan bestemmelse eller indbygget support til partitionering

14) Hvad er HBaseFsck klasse?

Der er et værktøjsnavn, der kaldes tilbage, er tilgængeligt i HBase, som er implementeret af HBaseFsck-klassen. Det tilbyder flere kommandolinjekontakter, der påvirker dets adfærd.

15) Hvad er de vigtigste nøglestrukturer i HBase?

Rækketast og Kolonnetast er de to vigtigste nøglestrukturer, der bruges i HBase

16) Diskuter, hvordan du kan bruge filtre i Apache HBase

Filtre i HBase Shell. Det blev introduceret i Apache HBase 0.92, som hjælper dig med at udføre serversidesfiltrering for at få adgang til HBase via HBase-shell eller sparsommelighed.

17) HBase understøtter syntaksstruktur som SQL ja eller nej?

Nej, desværre er SQL-support til HBase ikke tilgængelig i øjeblikket. Ved at bruge Apache Phoenix kan vi dog hente data fra HBase gennem SQL-forespørgsler.

18) Hvad er betydningen af ​​komprimering i HBase?

På tidspunktet for tunge indkommende skrivninger er det umuligt at opnå optimal ydeevne ved at have en fil pr. Butik. HBase hjælper dig med at kombinere alle disse HFiles for at reducere antallet af diskfrø til hver læsning. Denne proces er kendt som for komprimering i HBase.

19) Hvordan vil du implementere sammenføjninger i HBase?

HBase, understøtter ikke sammenkædning direkte, men bruger MapReduce-job sammenføjningsforespørgsler kan implementeres ved at hente data ved hjælp af forskellige HBase-tabeller.

20) Forklar JMX vedrørende HBSE

Java Management Extensions eller JMX er en eksportstatus for Java-applikationer er standarden for dem.

21) Hvad er brugen af ​​MasterServer?

Master sever hjælper dig også med at tildele en region til regionserveren. Det hjælper dig også med at håndtere den belastningsafbalancering, vi bruger MasterServer.

22) Definer begrebet sparsommelighed

Apache Thrift er skrevet i C ++. Det giver skema-kompilatorer til forskellige programmeringssprog som C ++, Perl, PHP, Python, Ruby og mere.

23) Hvorfor bruge klassen HColumnDescriptor?

Detaljen vedrørende kolonnefamilien, såsom kompressionsindstillinger, Antal versioner, gemmes .i HColumnDescriptor.

24) Hvad er en celle i HBase?

En celle i HBase er den mindste enhed i en Hbase-tabel. Det hjælper dig med at opbevare et stykke data i form af en tuple {række, kolonne, version}

25) Hvad er et Bloom-filter?

HBase understøtter Bloom Filter hjælper dig med at forbedre klyngens samlede kapacitet. Et HBase Bloom-filter er en pladseffektiv mekanisme til at teste, om en HFile inkluderer en bestemt række eller række-kolonne-celle.

26) Fortæl mig om de typer HBase-operationer?

Ans. To typer HBase-operationer er:

  • Læs operation
  • Skriv operation

27) Hvad er brugen af ​​HBase HMaster?

En mesters hovedansvar er:

  1. Koordinering af regionens servere
  2. Admin-funktioner

28) Hvilken teknik kan du bruge i HBase for at få adgang til HFile direkte uden hjælp fra HBase?

For at få adgang til HFile direkte uden at bruge HBase bruger vi metoden HFile.main ().

29) Kan regionsserveren være placeret på alle DataNodes?

Ja, Region Servers kører på de samme servere som DataNodes

30) Navngiv det filter, der accepterer sidestørrelsen som parameter i HBase

Et filter med navnet PageFilter accepterer sidestørrelsen som parameter.

Dette dokument er komponeret med de øjeblikkelige HTML-konverteringsværktøjer.