SAP DS (Data Services) i HANA

Anonim

Hvad er SAP datatjenester?

SAP Data services er et ETL-værktøj, der giver en enkelt virksomhedsniveau løsning til dataintegration, transformation, datakvalitet, dataprofilering og tekstbehandling af data fra den heterogene kilde til en måldatabase eller et datalager.

Vi kan oprette applikationer (job), hvor datakortlægning og transformation kan udføres ved hjælp af designeren. (Den seneste version af SAP BODS er 4.2).

Funktioner i datatjenester

  • Det giver højtydende parallelle transformationer.
  • Det har omfattende administrative værktøjer og rapporteringsværktøj.
  • Det understøtter multi-brugere.
  • SAP BODS er meget fleksibel med webservicebaseret applikation.
  • Det tillader skriptsprog med rige sæt funktioner.
  • Datatjenester kan integreres med SAP LT Replication Server (SLT) med

    Triggerbaseret teknologi. SLT tilføjer deltafunktioner til hver SAP- eller ikke-SAP-kildetabel

    Hvilket tillader brug af datafangst til ændring og overførsel af delta-data fra

    kildetabellen.

  • Datavalidering med dashboards og procesrevision.
  • Administrationsværktøj med planlægningsfunktioner og overvågning / dashboards.
  • Fejlfinding og indbygget profilering og visning af data.
  • SAP BODS understøtter bred kilde og mål.
    • Alle applikationer (f.eks. SAP).
    • Alle databaser med masseindlæsning og ændring af datafangst
    • Filer: fast bredde, kommasepareret, COBOL, XML, Excel.

Komponent af datatjenester

SAP DATA-tjenester har nedenstående komponent -

  1. Designer - Det er et udviklingsværktøj, hvormed vi kan oprette, teste og udføre et job, der udfylder et datalager.

    Det giver udvikleren mulighed for at oprette objekter og konfigurere dem ved at vælge et ikon i et flow-diagram fra kilde til mål.

    Det kan bruges til at oprette en applikation ved at specificere arbejdsgange og datastrømme.

    For at åbne Data Service Designer skal du gå til Start Menu -> Alle programmer -> SAP Data Services (4.2 her) -> Data Service Designer.

  1. Jobserver - Det er et program, der starter datatjenestebehandlingsmotoren og fungerer som en grænseflade til motoren og Data Services Suite.
  2. Engine- Data Service-motor udfører individuelle job, der er defineret i applikationen.
  3. Repository - Repository er en database, der gemmer designer foruddefinerede objekter og brugerdefinerede objekter (kilde- og målmetadata, transformationsregler).

    Datalager er af to typer -

  • Lokalt lager (bruges af designer og jobserver).
  • Central Repository (bruges til objektdeling og versionskontrol)
  1. Adgangsserver - Adgangsserver sender meddelelser mellem webapplikationer, datatjenestejobserver og motorer.
  2. Administrator- Webadministrator giver browserbaseret administration af datatjenestens ressourcer, detaljerne er som nedenfor -
  • Konfiguration, start og stop af realtidstjenester.
  • Planlægning, overvågning og udførelse af batchjob.
  • Konfiguration af jobserver, adgangsserver og lagerbrug.
  • Håndtering af brugere.
  • Udgivelse af batchjob og realtidstjenester via webservices
  • Konfiguration og styring af adaptere.

Arkitektur for datatjenester -

Data Services-arkitektur har følgende komponent-

  • Central Repository - det bruges til lagringskonfigurationer til jobservere, sikkerhedsstyring, versionskontrol og objektdeling
  • Designer - Bruges til Opret projekt, job, workflow, dataflytning og kørsel.
  • Lokalt lager (her kan du oprette ændringer og starte job, Workflow, dataflow).
  • Jobserver og motor - Det styrer jobbet.
  • Adgangsserver - Den bruges til at udføre realtidsjob, der er oprettet af udviklere i arkiverne.

I billedet nedenfor vises datatjenester og komponentforholdet.

SAP BODS-arkitektur

Designer Window Detail: Først ser vi på den første komponent i SAP datatjeneste - Designer

Detalje for hvert afsnit af datatjenesteudvikler er som nedenfor

  1. Værktøjslinje (bruges til åben, gem, tilbage, valider, udfør osv.).
  2. Projektområde (Indeholder det aktuelle projekt, som inkluderer Job, Workflow og Dataflow. I Data Services er alle enheder objekter.
  3. Arbejdsområde (applikationsvinduesområdet, hvor vi definerer, viser og ændrer objekter).
  4. Lokalt objektbibliotek (Det indeholder lokale arkivobjekter, såsom transformationer, job, arbejdsgang, dataforløb osv.).
  5. Værktøjspalet (Knapper på værktøjspaletten giver dig mulighed for at tilføje nye objekter til arbejdsområdet).

Objekthierarki

Nedenstående diagram viser hierarkiske relationer for de vigtigste objekttyper i Data Services.

>

Bemærk:

Workflows og Conditional * er valgfri

Objekter, der bruges i SAP Data Services-detaljer, er som nedenfor -

Objekter Beskrivelse
Projekt Et projekt er et objekt på højeste niveau i Designer-vinduet. Projekter giver dig en måde at organisere de andre objekter, du opretter i Data Services. Kun et projekt er åbent ad gangen (hvor "åben" betyder "synlig i projektområdet").
Job Et "job" er den mindste enhed, du kan planlægge uafhængigt af forex.
Scripts En delmængde af linjer i en procedure.
Workflow En "arbejdsgang" er inkorporering af flere datastrømme i en sammenhængende arbejdsgang for et helt job. Workflow er valgfrit. Workflow er en procedure.
  • Opkaldsdatastrømme
  • Ring til en anden arbejdsgang
  • Definer rækkefølgen af ​​trin, der skal udføres i dit job
  • Videregiv parametre til og fra datastrømme.
  • Angiv, hvordan fejl, der opstår under udførelse, skal håndteres.
  • Definer betingelser for udførelse af dele af projektet.
Dataflow En "datastrøm" er den proces, hvorved kildedata transformeres til måldata. En datastrøm er et genanvendeligt objekt. Det kaldes altid fra et arbejdsflow eller et job.
  • Identificer de kildedata, du vil læse.
  • Definer de transformationer, du vil udføre på dataene.
  • Identificer måltabellen, som du vil indlæse data til.
Datalager Logisk kanal, der forbinder Data Services til kilde- og Datastore-måldatabaser.
  • Skal angives for hver kilde og måldatabase.
  • Bruges til at importere metadata til kilde- og måldatabaser til depotet
  • Bruges af Data Services til at læse data fra kildetabeller og indlæse datato-måltabeller
Mål Tabel eller fil, hvor Data Services indlæser data fra kilden.

Eksempel på datatjenester efter indlæsningsdata fra SAP-kildetabel

Alt i datatjenester er et objekt. Vi er nødt til at adskille datalager for hver kilde og måldatabase.

Trin til indlæsning af data fra SAP-kildetabel - SAP BODS har mange trin, hvor vi skal oprette et datalager til kilde og mål og kortlægge dem.

  • Opret datalager mellem kilde og BODS
  • Importer metadataene (strukturer) til BODS.
  • Konfigurer importserver
  • Importer metadataene til HANA-systemet.
  • Opret datalager mellem BODS til HANA.
  • Opret projekt.
  • Opret job (batch / realtid)
  • Opret arbejdsflow
  • Opret dataflow
  • Tilføj objekt i dataflow
  • Udfør jobbet
  • Tjek dataeksemplet i HANA

Trin 1) Opret datalager mellem SAP-kilde og BODS

  1. For at indlæse data fra SAP-kilde til SAP HANA via SAP BODS har vi brug for en datalager. Så vi opretter først en datalager som vist nedenfor -

    Projekt -> Ny -> Datalager

  2. En pop op-vindue til Opret ny datalager vises, indtast detaljer som nedenfor -
    1. Indtast datalagernavnet "ds_ecc".
    2. Vælg datalagertypenavn som "SAP-applikationer".
    3. Indtast databaseservernavnet
    4. Brugernavn og adgangskode.
    5. Klik på knappen "Anvend".
    6. Klik på knappen "OK".

  3. Data Store oprettes og se den oprettede datalager som nedenfor -
  1. Gå til lokalt objektbibliotek
  2. Vælg fanen DataStore.
  3. Datalager "ds_ecc" vises.

Trin 2) Importer metadata (struktur) til BODS Server.

Vi har oprettet et datalager til ECC to BODS; nu importerer vi metadata fra ECC til BODS. Følg nedenstående trin for at importere -

  1. Vælg Datastore "ds_ecc" og højreklik.
  2. Vælg Importer efter navn.

    Et pop op-vindue til Import efter navn vises. Indtast detaljer som nedenfor -

    1. Vælg Type som en tabel.
    2. Indtast navnet på den tabel, som vi vil importere. Her importerer vi KNA1-tabellen.
    3. Klik på "Importer" -knappen. KNA1-tabellen vises under tabelknudepunktet for "ds_ecc" -datakilden.

Tabelmetadata importeres i datalager ds_ecc som nedenfor -

Trin 3) Konfigurer importserver

Indtil nu har vi importeret tabel til data gemt "ds_ecc" oprettet til ECC til SAP BODS-forbindelse. For at importere data til SAP HANA skal vi konfigurere Import-server,

  1. For at gøre dette skal du gå til Hurtigvisning-> Konfigurer importserver som nedenfor -

  2. Et pop op-vindue til Select System vises, Vælg SAP HANA (HDB her) System som nedenfor -

  1. Klik på knappen "Næste". En anden popup til datatjenesteoplysninger vises, indtast følgende detaljer
  1. SAP BODS-serveradresse (her BODS: 6400)
  2. Indtast SAP BODS Repository Name (HANAUSER Repositery Name)
  3. Indtast ODBC-datakilde (ZTDS_DS).
  4. Indtast standardport til SAP BODS-server (8080).

Klik på knappen "Afslut".

Trin 4) Importer metadataene til HANA-systemet

1. Indtil nu har vi konfigureret Import Server, nu importerer vi metadata fra SAP BODS server.

  1. Klik på Importer indstilling i Hurtigvisning.
  2. Et pop op-vindue til importmulighed vises. Vælg "Selektiv import af metadata".

Klik på knappen "Næste".

2. En pop op-pop op til "Selektiv import af metadata" vises, hvor vi vælger målsystem.

  1. Vælg SAP HANA System (HDB her).

Klik på knappen "Næste".

Trin 5) Opret datalager mellem BODS og HANA

Som vi ved, skal vi i BODS oprette en separat datalager til kilde og mål. Vi har allerede oprettet et datalager til kilden, nu skal vi oprette et datalager til målet (mellem BODS og HANA). Så vi opretter et nyt datalager med navnet "DS_BODS_HANA".

  1. Gå til Projekt -> Ny -> Datastore.

  1. En skærm til Opret ny datalager vises som nedenfor.
    1. Indtast datalagerets navn (DS_BODS_HANA).
    2. Indtast datalagringstype som database.
    3. Indtast databasetype som SAP HANA.
    4. Vælg databaseversion.
    5. Indtast SAP HANA-databaseservernavnet.
    6. Indtast portnavn til SAP HANA-database.
    7. Indtast brugernavn og adgangskode.
    8. Kryds af for "Aktiver automatisk dataoverførsel".

Klik på "Anvend" og derefter "OK" -knappen.

Datalager "DS_BODS_HANA" vises under fanen Datalager i Local Object Library som

Under-

  1. Nu importerer vi tabel i datalager "DS_BODS_HANA".
    1. Vælg datalager "DS_BODS_HANA" og højreklik.
    2. Vælg Importer efter navn.

  1. Et pop op-vindue til Import efter navn vises som nedenfor -
    1. Vælg Type som tabel.
    2. Indtast navn som KNA1.
    3. Ejeren vises som Hanauser.
    4. Klik på knappen Importer.

Tabel vil blive importeret i "DS_BOD_HANA" datalager, for at se data i tabel følg nedenstående trin -

  1. Klik på tabel "KNA1" i datalager "DS_BODS_HANA".
  2. Data vises i TABELformat.

Trin 6) Definer projekt: Projektgruppe og organiser relaterede objekter. Projektet kan indeholde et vilkårligt antal job, Workflow og dataforløb.

  1. Gå til Designer Project-menuen.
  2. Vælg ny indstilling.
  3. Vælg projektindstilling.

En POP-UP til oprettelse af nyt projekt vises som nedenfor. Indtast projektnavn, og klik på knappen Opret. Det opretter en projektmappe i vores tilfælde BODS_DHK.

Trin 7) Definer job: Et job er et genanvendeligt objekt. Den indeholder arbejdsgange og dataforløb. Job kan udføres manuelt eller som en tidsplan. For at udføre BODS-processen skal vi definere jobbet.

Vi opretter et job som JOB_Kunde.

  1. Vælg projekt (BODS_DHK) oprettet i trin 1, højreklik og vælg "Nyt batchjob".

  2. Omdøb det til "JOB_Customer".

Trin 8) Definer arbejdsgang:

  1. Vælg Job "JOB_Customer" i projektområdet,
  2. Klik på arbejdsgangsknappen på værktøjspaletten. Klik på området Black Workspace. Et arbejdsprocesikon vises i arbejdsområdet.
  3. Skift navnet på arbejdsgangen som "WF_Customer".

Klik på navnet på arbejdsgangen, en tom visning for arbejdsgangen vises i arbejdsområdet.

Trin 9) Definer dataforløb:

  1. Klik på Workflow "WF_Customer".
  2. Klik på knappen Dataflow på værktøjspaletten. Klik på området Black Workspace. Et Dataflow-ikon vises i arbejdsområdet.
  3. Skift navnet på Dataflowet som "DF_Customer".
  4. Dataflowet vises også i projektområdet til venstre under jobnavnet.

Trin 10) Tilføj objekt i dataforløb:

Inde i datastrøm kan vi give instruktioner til at omdanne kildedata til den ønskede form til måltabellen.

Vi vil se nedenstående objekt -

  • Et objekt til kilden.
  • Et objekt til måltabellen.
  • Et objekt til forespørgselstransformation. (Forespørgselstransformation kortlægger kolonnerne fra kilde til mål.)

    Klik på dataforløbet DF_Customer. Et tomt arbejdsområde vises som nedenfor -

  1. Angiv objekt fra kilde - Gå til datalager "ds_ecc" og vælg tabel KNA1 og træk og slip til datastrøm blank skærm som nedenfor skærm-
  2. Angiv objekt til Target- Vælg datalager "DS_BODS_HANA" fra arkivet, og vælg tabel KNA1.
  3. Træk og slip til arbejdsområdet, og vælg "Opret mål". Der vil være to tabeller til kilde og mål. Her definerer vi tabellen som kilde og mål.

  1. Forespørgselstransformation - Dette er et værktøj, der bruges til at hente data baseret på inputskema til brugerspecifik tilstand og til transportdata fra kilde til mål.
    1. Vælg ikonet Query Transform fra værktøjspaletten, og træk og slip det mellem kilde og målobjekt i arbejdsområdet som nedenfor -
    2. Link forespørgselobjekt til kilde
    3. Link forespørgselsobjekt til måltabellen.

    1. Dobbeltklik på ikonet forespørgsel. Ved dette kortlægger vi en kolonne fra inputskema til outputskema.

Når vi klikker på forespørgselsikonet, vises et næste vindue til kortlægning, hvor vi udfører følgende trin -

  1. Kildetabel KNA1 er valgt.
  2. Vælg alle kolonner fra kildetabellen, og højreklik, og vælg et kort, der skal outputes.
  3. Måloutput valgt som forespørgsel, og kolonnen kortlægges.

5. Gem og valider projekt.

1. Klik på validér ikon.

2. Der vises et pop op-vindue til validering.

Trin 11) Udfør job - For at udføre job, følg nedenstående vej-

  1. Vælg ikon for projektområde for at åbne projekt, og vælg oprettet projekt.
  2. Vælg Job, og højreklik.
  3. Vælg Udfør mulighed for at udføre job.

    1. Efter udførelse af job vises et joblogvindue, hvor alle meddelelser om job vises.
    2. Den sidste besked er Job <> er afsluttet med succes.

    Trin 12) - Valider / kontroller data i SAP HANA-database.

    1. Log ind på SAP HANA-database via SAP HANA Studio, og vælg HANAUSER-skema.
    2. Vælg KNA1-tabel i tabelknude.
    3. Højreklik på tabel KNA1, og vælg Open Data Preview.
    4. Tabel (KNA1) Data indlæst af BODS-processer som ovenfor vises i skærmbilledet med dataeksempel.