Her er spørgsmål om datamodellering til både friskere og erfarne kandidater.
1) Hvad er datamodellering?
Datamodellering er processen med at oprette en model, som dataene skal gemmes i en database. Det er en konceptuel repræsentation af dataobjekter, sammenhængen mellem forskellige dataobjekter og reglerne.
2) Forklar forskellige typer datamodeller
Der er hovedsageligt tre forskellige typer datamodeller:
Konceptuel: Konceptuel datamodel definerer hvad systemet skal indeholde. Denne model er typisk oprettet af forretningsinteressenter og dataarkitekter. Formålet er at organisere, omfatte og definere forretningskoncepter og regler.
Logisk: Definerer, hvordan systemet skal implementeres uanset DBMS. Denne model er typisk oprettet af dataarkitekter og forretningsanalytikere. Formålet er at udvikle et teknisk kort over regler og datastrukturer.
Fysisk: Denne datamodel beskriver, hvordan systemet implementeres ved hjælp af et specifikt DBMS-system. Denne model er typisk oprettet af DBA og udviklere. Formålet er den faktiske implementering af databasen.
3) Forklar fakta- og faktatabellen
Faktum repræsenterer kvantitative data. For eksempel det nettobeløb, der forfalder. En faktatabel indeholder numeriske data såvel som fremmednøgler fra dimensionstabeller.
4) Liste over forskellige designskemaer i datamodellering
Der er to forskellige typer skemaer for datamodelleringsskemaer: 1) Stjerneskema og 2) Snefnugskema
5) Hvornår skal du overveje denormalisering?
Denormalisering bruges, når tabellen er meget involveret, mens data hentes. Det bruges til at konstruere et datalager.
6) Forklar dimension og attribut
Dimensioner repræsenterer kvalitative data. For eksempel produkt, klasse, plan osv. En dimensionstabel har tekst- eller beskrivende attributter. For eksempel er produktkategorien og produktnavnet to attributter i produktdimensionstabellen.
7) Hvad er faktum mindre kendsgerning?
Fakta mindre kendsgerning er en tabel uden faktamåling. Den indeholder kun dimensionstasterne.
8) Hvad er analyse i hukommelsen?
In-memory-analyse er en proces til caching af databasen i RAM.
9) Hvad er forskellen mellem OLTP og OLAP?
OLTP | OLAP |
OLTP er et online transaktionssystem. | OLAP er en online analyse- og datahentningsproces. |
Det er kendetegnet ved et stort antal korte onlinetransaktioner. | Det er kendetegnet ved et stort datamængde. |
OLTP bruger traditionel DBMS. | OLAP bruger et datalager. |
Tabeller i OLTP-database er normaliseret. | Tabellerne i OLAP normaliseres ikke. |
Dens svartid er i et millisekund. | Dens svartid er i sekunder til minutter. |
OLTP er designet til realtids forretningsdrift. | OLAP er designet til analyse af forretningsmål efter kategori og attributter. |
10) Hvad er tabel?
Samlingen af rækker og kolonner kaldes som tabel. Hver kolonne har en datatype. Tabel indeholder relaterede data i tabelformat.
11) Hvad er kolonne?
Kolonne eller felt er et lodret arrangement af data, der indeholder relateret information.
12) Definer datasparhed
Datasparhed er et udtryk, der bruges til, hvor mange data du har for enhed / dimension af modellen.
13) Hvad er sammensat primærnøgle?
Den sammensatte primære nøgle henvises til det tilfælde, hvor mere end en tabelkolonne bruges som en del af den primære nøgle.
14) Hvad er primær nøgle?
Primær nøgle er en kolonne eller gruppe af kolonner, der ulige identificerer hver række i tabellen. Værdien af primærnøglen må ikke være nul. Hver tabel skal indeholde en primær nøgle.
15) Forklar fremmed nøgle
Fremmed nøgle er en gruppe attributter, der bruges til at linke forældre- og underordnet tabel. Værdien af den fremmede nøglekolonne, som er tilgængelig i underordnet tabel, henvises til værdien af den primære nøgle i den overordnede tabel.
16) Hvad er metadata?
Metadata beskriver data om data. Det viser, hvilken type data der faktisk er gemt i databasesystemet.
17) Hvad er datamart?
En datamart er en kondenseret version af et datalager og er designet til brug af en bestemt afdeling, enhed eller et sæt brugere i en organisation. F.eks. Marketing salg, HR eller økonomi.
18) Hvad er OLTP?
Online transaktionsbehandling, kort kendt som OLTP, understøtter transaktionsorienteret applikation i 3-lags arkitektur. OLTP administrerer den daglige transaktion af virksomhed eller organisation.
19) Hvad er eksemplerne på OLTP-systemet?
Eksempel på OLTP-system er:
- Afsendelse af en sms
- Føj en bog til indkøbskurven
- Online reservation af flybilletter
- Netbank
- Ordreindgang
20) Hvad er kontrolbegrænsning?
Kontroller begrænsning bruges til at verificere en række værdier i en kolonne.
21) Angiv hvilke typer normalisering?
Typer af normaliseringer er: 1) første normale form, 2) anden normale form, 3) tredje normale former, 4) boyce-codd fjerde og 5) femte normale former.
22) Hvad er forward data engineering?
Forward engineering er et teknisk udtryk, der bruges til at beskrive processen med automatisk oversættelse af en logisk model til et fysisk redskab.
23) Hvad er PDAP?
Det er en datakub, der gemmer data som et resumé. Det hjælper brugeren med at analysere data hurtigt. Dataene i PDAP er gemt på en måde, der rapporterer let.
24) Forklar snefnugskema-databasedesign
Et snefnugskema er et arrangement af en dimensionstabel og faktabord. Generelt er begge tabeller opdelt yderligere i flere dimensionstabeller.
25) Forklar analysetjeneste
Analysetjeneste giver en samlet oversigt over de data, der bruges i datamining eller OLAP.
26) Hvad er sekvensklyngealgoritme?
Sekvensklyngealgoritme samler stier, der er ens eller relaterede til hinanden og sekvenser af data, der har begivenheder.
27) Hvad er diskrete og kontinuerlige data?
Diskrete data er endelige data eller definerede data. F.eks. Køn, telefonnumre. Kontinuerlige data er data, der ændres løbende og ordnet. F.eks. Alder.
28) Hvad er tidsseriealgoritmen?
Tidsseriealgoritme er en metode til at forudsige kontinuerlige værdier af data i tabellen. F.eks. Performance en medarbejder kan forudsige overskuddet eller indflydelsen.
29) Hvad er Business Intelligence?
BI (Business Intelligence) er et sæt processer, arkitekturer og teknologier, der konverterer rådata til meningsfuld information, der driver lønsomme forretningshandlinger. Det er en pakke med software og tjenester, der omdanner data til handlingsmæssig intelligens og viden.
30) Hvad er bit mapped index?
Bitmap-indekser er en speciel type databaseindeks, der bruger bitmaps (bitarrays) til at besvare forespørgsler ved at udføre bitvise operationer.
31) Forklar datalager i detaljer
Datalager er en proces til indsamling og styring af data fra forskellige kilder. Det giver meningsfuld forretningsindsigt. Data warehousing bruges typisk til at forbinde og analysere data fra heterogene kilder. Det er kernen i BI-systemet, som er bygget til dataanalyse og rapportering.
32) Hvad er skrotdimension?
Uønsket dimension kombinerer to eller flere relaterede kardinaliteter i en dimension. Det er normalt boolske værdier eller flagværdier.
33) Forklar dataskemaet
Data Scheme er en diagrammatisk gengivelse, der illustrerer dataforhold og strukturer.
34) Forklar dataindsamlingsfrekvensen
Dataindsamlingsfrekvensen er hastigheden for at indsamle dataene. Det passerer også gennem forskellige faser. Disse trin er: 1) ekstrahering fra forskellige kilder, 3) transformation, 4) rensning og 5) lagring.
35) Hvad er databasekardinalitet?
Kardinalitet er en numerisk attribut for forholdet mellem to enheder eller enhedssæt.
36) Hvad er de forskellige typer kardinalforhold?
Forskellige typer nøglehovedforhold er:
- En-til-en-forhold
- En-til-mange forhold
- Mange-til-en-forhold
- Mange-til-mange-forhold
37) Definer kritisk succesfaktor, og opregn dens fire typer
Kritisk succesfaktor er et gunstigt resultat af enhver aktivitet, der er nødvendig for, at organisationen kan nå sit mål.
Fire typer kritisk succesfaktor er:
- Industrielle CSF'er
- Strategi-CSF'er
- Miljømæssige CSF'er
- Temporal CSF'er
38) Hvad er datamining?
Data mining er en tværfaglig færdighed, der bruger maskinindlæring, statistik, AI og databaseteknologi. Det handler om at opdage intetanende / tidligere ukendte forhold mellem dataene.
39) Hvad er forskellen mellem stjerneskema og snefnugskema?
Stjerneskema | Snowflake Schema |
Hierarkier for dimensionerne er gemt i dimensionstabellen. | Hierarkier er opdelt i separate tabeller. |
Den indeholder en faktatabel omgivet af dimensionstabeller. | Én faktatabel omgivet af dimensionstabel, som igen er omgivet af dimensionstabel |
I et stjerneskema opretter kun en enkelt sammenføjning forholdet mellem faktatabellen og eventuelle dimensionstabeller. | Et snefnugskema kræver mange sammenføjninger for at hente dataene. |
Det har et enkelt databasedesign | Det har et komplekst databasedesign |
Denormaliseret datastruktur og forespørgsel kører også hurtigere. | Normaliseret datastruktur. |
Højt niveau af dataredundans | Meget lavt niveau af dataredundans |
Tilbyder hurtigere forespørgsler ved hjælp af Star Join Query Optimization. Tabeller kan være forbundet med flere dimensioner. | Snow Flake Schema er repræsenteret af en centraliseret faktatabel, som sandsynligvis ikke er forbundet med flere dimensioner. |
40) Hvad er identifikationsforhold?
Identifikation af enhedsrelationer i DBMS bruges til at identificere et forhold mellem to enheder: 1) stærk enhed og 2) svag enhed.
41) Hvad er et selvrekursivt forhold?
Rekursivt forhold er en enkeltstående kolonne i en tabel, der er forbundet til den primære nøgle i den samme tabel.
42) Forklar relationel datamodellering
Relationsdatamodellering er repræsentation af objekter i en relationsdatabase, som normalt normaliseres.
43) Hvad er forudsigelig modelleringsanalyse?
Processen med validering eller testning af en model, der ville bruges til at forudsige testning og validering af resultater. Det kan bruges til maskinlæring, kunstig intelligens samt statistik.
44) Hvad er forskellen mellem logisk datamodel og fysisk datamodel?
Logisk datamodel | Fysisk datamodel |
En logisk datamodel kan designe kravet om forretningslogisk. | En fysisk datamodel giver information om måldatabasekilden og dens egenskaber. |
Det er ansvarligt for den faktiske implementering af data, der er gemt i databasen. | En fysisk datamodel hjælper dig med at oprette en ny databasemodel ud fra eksisterende og anvende den begrænsning, der refererer til integritet. |
Den indeholder en enhed, primære nøgleattributter, Inversionsnøgler, alternativ nøgle, regel, forretningsforbindelse, definition osv. | En fysisk datamodel indeholder en tabel, nøglebegrænsninger, unik nøgle, kolonner, fremmednøgle, indekser, standardværdier osv. |
45) Hvad er de forskellige typer begrænsninger?
En anden type begrænsning kan være unik, nulværdier, fremmednøgler, sammensat nøgle eller kontrolbegrænsning osv.
46) Hvad er et datamodelleringsværktøj?
Data modelleringsværktøj er en software, der hjælper med at konstruere datastrøm og forholdet mellem data. Eksempler på sådanne værktøjer er Borland Together, Altova Database Spy, casewise, Case Studio 2 osv.
47) Hvad er hierarkisk DBMS?
I den hierarkiske database er modeldata organiseret i en trælignende struktur. Data gemmes i et hierarkisk format. Data repræsenteres ved hjælp af et forhold mellem forældre og barn. I hierarkisk DBMS-forælder kan have mange børn, børn har kun en forælder.
48) Hvad er ulemperne ved den hierarkiske datamodel?
Ulemperne ved den hierarkiske datamodel er:
- Det er ikke fleksibelt, da det tager tid at tilpasse sig virksomhedens skiftende behov.
- Strukturen udgør spørgsmålet inden for inter-afdelingskommunikation, vertikal kommunikation såvel som kommunikation mellem agenturer.
- Hierarkisk datamodel kan skabe problemer med uenighed.
49) Forklar den procesdrevne tilgang til datamodellering
Procesdrevet tilgang, der anvendes i datamodellering, følger en trinvis metode til forholdet mellem enhedsforholdsmodellen og organisationsprocessen.
50) Hvad er fordelene ved at bruge datamodellering?
Fordelene ved at bruge datamodellering i datalager er:
- Det hjælper dig med at administrere forretningsdata ved at normalisere det og definere dets attributter.
- Datamodellering integrerer data fra forskellige systemer for at reducere dataredundans.
- Det gør det muligt at skabe effektivt databasedesign.
- Datamodellering hjælper organisationsafdelingen med at fungere som et team.
- Det letter adgang til data med lethed.
51) Hvad er ulemperne ved at bruge datamodellering?
Ulemperne ved at bruge datamodellering er:
- Det har mindre strukturel uafhængighed
- Det kan gøre systemet kompliceret.
52) Hvad er indeks?
Indeks bruges til en kolonne eller gruppe af kolonner til hurtigt at hente data.
53) Hvad er kendetegnene ved en logisk datamodel?
Karakteristika for logisk datamodel er:
- Beskriver databehov for et enkelt projekt, men kan integreres med andre logiske datamodeller baseret på projektets omfang.
- Designet og udviklet uafhængigt af DBMS.
- Dataattributter vil have datatyper med nøjagtige præcisioner og længde.
- Normaliseringsprocesser til modellen, som generelt anvendes typisk indtil 3NF.
54) Hvad er kendetegnene ved den fysiske datamodel?
Karakteristika for fysisk datamodel er:
- Den fysiske datamodel beskriver databehovet for et enkelt projekt eller en enkelt applikation. Det kan integreres med andre fysiske datamodeller baseret på projektomfang.
- Datamodellen indeholder forhold mellem tabeller, der adresserer kardinalitet og ugyldighed af forholdene.
- Udviklet til en specifik version af en DBMS, placering, datalagring eller teknologi, der skal bruges i projektet.
- Kolonner skal have nøjagtige datatyper, tildelte længder og standardværdier.
- Primære og udenlandske nøgler, visninger, indekser, adgangsprofiler og autorisationer osv. Er defineret.
55) Hvad er de to typer datamodelleringsteknikker?
To typer af datamodelleringsteknikker er: 1) enhedsrelation (ER) -model og 2) UML (Unified Modeling Language).
56) Hvad er UML?
UML (Unified Modelling Language) er et generelt formål, databaseudvikling, modelleringssprog inden for software engineering. Hovedintentionen er at give en generaliseret måde at visualisere systemdesign på.
57) Forklar objektorienteret databasemodel
Den objektorienterede databasemodel er en samling objekter. Disse objekter kan have tilknyttede funktioner såvel som metoder.
58) Hvad er en netværksmodel?
Det er en model, der er bygget på hierarkisk model. Det tillader mere end et forhold at linke poster, hvilket indikerer, at det har flere poster. Det er muligt at konstruere et sæt overordnede poster og underordnede poster. Hver post kan tilhøre flere sæt, der giver dig mulighed for at udføre komplekse tabelforhold.
59) Hvad er hashing?
Hashing er en teknik, der bruges til at søge i hele indeksværdien og hente ønskede data. Det hjælper med at beregne den direkte placering af data, der registreres på disken uden at bruge indeksets struktur.
60) Hvad er forretnings- eller naturlige nøgler?
forretnings- eller naturlige nøgler er et felt, der entydigt identificerer en enhed. For eksempel klient-id, medarbejdernummer, e-mail osv.
61) Hvad er sammensat nøgle?
Når mere end et felt bruges til at repræsentere en nøgle, kaldes det en sammensat nøgle.
62) Hvad er den første normale form?
Første normale form eller 1NF er en egenskab af en relation, der er tilgængelig i et relationsdatabasesystem. Enhver relation kaldes første normale form, hvis domænet for hver attribut indeholder værdier, der er atomare. Den indeholder en værdi fra dette domæne.
63) Hvad er forskellen mellem primærnøgle og fremmednøgle?
Primærnøgle | Fremmed nøgle |
Primær nøgle hjælper dig med entydigt at identificere en post i tabellen. | Fremmednøgle er et felt i tabellen, der er den primære nøgle til en anden tabel. |
Primær nøgle accepterer aldrig nulværdier. | En fremmed nøgle accepterer muligvis flere nulværdier. |
Primær nøgle er et grupperet indeks, og data i DBMS-tabellen er fysisk organiseret i sekvensen af det grupperede indeks. | En fremmed nøgle kan ikke automatisk oprette et indeks, grupperet eller ikke-grupperet. Du kan dog manuelt oprette et indeks på den udenlandske nøgle. |
Du kan have den eneste primære nøgle i en tabel. | Du kan have flere fremmednøgler i en tabel. |
64) Hvad er kravene i den anden normale form?
Kravene til anden normalform er:
- Det skal være i den første normale form.
- Den indeholder ikke nogen ikke-primær attribut, som funktionelt er afhængig af nogen undergruppe af kandidatnøglen til tabelrelationen.
65) Hvad er reglerne for tredje normale form?
Regler for tredje normale former er:
- Det skal være i anden normal form
- Det har ingen midlertidige funktionelle afhængigheder.
66) Hvad er vigtigheden af at bruge taster?
- Taster hjælper dig med at identificere enhver række data i en tabel. I en applikation i den virkelige verden kan en tabel indeholde tusindvis af poster.
- Tasterne sikrer, at du entydigt kan identificere en tabeloptegnelse på trods af disse udfordringer.
- Giver dig mulighed for at etablere et forhold mellem og identificere forholdet mellem tabeller
- Hjælp dig med at håndhæve identitet og integritet i forholdet.
67) Hvad er en surrogatnøgle?
En kunstig nøgle, der sigter mod at identificere hver post entydigt, kaldes en surrogatnøgle. Disse typer nøgler er unikke, fordi de oprettes, når du ikke har nogen naturlig primærnøgle. De giver ikke mening til dataene i tabellen. Surrogatnøgle er normalt et heltal.
68) Forklar den alternative tast i detaljer
Alternativ nøgle er en kolonne eller gruppe af kolonner i en tabel, der entydigt identificerer hver række i den pågældende tabel. En tabel kan have flere valg for en primær nøgle, men kun en kan indstilles som den primære nøgle. Alle taster, der ikke er primærnøgle, kaldes en alternativ nøgle.
69) Hvad er fjerde normalform i DBMS?
Fjerde normal form er et niveau af database normalisering, hvor der ikke må have ikke triviel afhængighed udover kandidatnøglen.
70) Hvad er et databasestyringssystem?
Database management system eller DBMS er en software til lagring og hentning af brugerdata. Den består af en gruppe programmer, der manipulerer databasen.
71) Hvad er reglen om femte normale form?
En tabel er i 5 th normal form, hvis det er i 4 th normale form, og den kan ikke nedbrydes i et vilkårligt antal mindre tabeller uden tab af data.
72) Hvad er normalisering?
Normalisering er en teknik til databasedesign, der organiserer tabeller på en måde, der reducerer redundans og afhængighed af data. Det opdeler større tabeller i mindre tabeller og forbinder dem ved hjælp af relationer.
73) Forklar karakteristikaene ved et databasestyringssystem
- Giver sikkerhed og fjerner overflødighed
- Selvbeskrivende databasesystems karakter
- Isolering mellem programmer og dataabstraktion
- Understøttelse af flere visninger af data.
- Deling af data og behandling af flere brugere
- DBMS tillader enheder og relationer mellem dem at danne tabeller.
- Det følger ACID-konceptet (Atomicitet, Konsistens, Isolering og Holdbarhed).
- DBMS understøtter et multibrugermiljø, der giver brugerne mulighed for at få adgang til og få adgang til og manipulere data parallelt.
74) Liste over populær DBMS-software
Populær DBMS-software er:
- MySQL
- Microsoft Access
- Oracle
- PostgreSQL
- dbase
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Forklar begrebet RDBMS
Relational Database Management System er en software, der bruges til at gemme data i form af tabeller. I denne type system administreres og lagres data i rækker og kolonner, hvilket er kendt som tupler og attributter. RDBMS er et kraftfuldt datastyringssystem og bruges i vid udstrækning over hele verden.
76) Hvad er fordelene ved datamodel?
Fordelene ved datamodellen er:
- Hovedmålet med en designe datamodel er at sikre, at dataobjekter, der tilbydes af det funktionelle team, er repræsenteret nøjagtigt.
- Datamodellen skal være detaljeret nok til at blive brugt til at opbygge den fysiske database.
- Oplysningerne i datamodellen kan bruges til at definere forholdet mellem tabeller, primære og udenlandske nøgler og lagrede procedurer.
- Data Model hjælper virksomheder med at kommunikere inden for og på tværs af organisationer.
- Datamodel hjælper med at dokumentere datatilknytninger i ETL-processen
- Hjælp med at genkende korrekte datakilder for at udfylde modellen
77) Hvad er ulemperne ved datamodellen?
Ulemper ved datamodellen er:
- For at udvikle datamodellen skal man kende fysiske datalagrede egenskaber.
- Dette er et navigationssystem, der producerer kompleks applikationsudvikling, styring. Således kræver det kendskab til den biografiske sandhed.
- Endnu mindre ændringer i strukturen kræver ændring i hele applikationen.
- Der er ikke noget sæt dataanvendelsessprog i DBMS.
78) Forklar forskellige typer faktatabeller
Der er tre typer faktaborde:
- Additiv: Det er et mål, der føjes til enhver dimension.
- Ikke-additiv: Det er et mål, der ikke kan føjes til nogen dimension.
- Semitilsætningsstof: Det er et mål, der kan føjes til nogle få dimensioner.
79) Hvad er samlet tabel?
Den samlede tabel indeholder aggregerede data, der kan beregnes ved hjælp af funktioner såsom: 1) Gennemsnit 2) MAX, 3) Antal, 4) SUM, 5) SUM og 6) MIN.
80) Hvad er en bekræftet dimension?
En tilpasset dimension er en dimension, der er designet på en måde, der kan bruges på tværs af mange faktatabeller i forskellige områder af et datalager.
81) Liste over hierarkier i datamodellering
Der er to typer hierarkier: 1) Niveaubaserede hierarkier og 2) Forældre-barn-hierarkier.
82) Hvad er forskellen mellem et datamart og datalager?
Data mart | Data varehus |
Data mart fokuserer på et enkelt forretningsområde. | Datalager fokuserer på flere forretningsområder. |
Det bruges til at tage taktiske beslutninger for forretningsvækst. | Det hjælper virksomhedsejere med at tage en strategisk beslutning |
Data mart følger bottom-up-modellen | Datalager følger en top-down model |
Datakilde kommer fra en datakilde | Datakilde kommer fra mere end en heterogen datakilde. |
83) Hvad er XMLA?
XMLA er en XML-analyse, der betragtes som standard for adgang til data i Online Analytical Processing (OLAP).
84) Forklar uønsket dimension
Uønsket dimension hjælper med at gemme data. Det bruges, når data ikke er korrekt at gemme i skemaet.
85) Forklar lænket datareplikering
Situationen, når en sekundær node vælger mål ved hjælp af pingtid, eller når den nærmeste node er en sekundær, kaldes den som kædet datareplikering.
86) Forklar Virtual Data Warehousing
Et virtuelt datalager giver et samlet overblik over de udfyldte data. Et virtuelt datalager har ikke historiske data. Det betragtes som en logisk datamodel med metadata.
87) Forklar øjebliksbillede af datalager
Snapshot er en komplet visualisering af data på det tidspunkt, hvor dataudvindingsprocessen begynder.
88) Hvad er et tovejsekstrakt?
Systemets evne til at udtrække, rense og overføre data i to retninger kaldes et retningsbestemt ekstrakt.