sql >> Database teknologi >  >> RDS >> Database

SSIS Tutorial for begyndere:Hvorfor, hvad og hvordan?

SQL Server Integration Services (SSIS) udgør en integreret del af Microsoft SQL Server Database-softwaren. Dette gør arbejdet med datahåndtering meget lettere med dets forskellige funktioner. I denne tutorial vil vi grave dybere ned i SSIS på et konceptuelt niveau i følgende rækkefølge:

  • Hvad er dataintegration?
  • Hvorfor SSIS?
  • Hvad er SSIS?
  • Funktioner i SSIS
  • Hvordan fungerer SSIS?
    • ETL-proces
    • Datalager
  • Krav til SQL Server Integration Services
    • Installation af SQL Server
    • Installer SQL Server Data Tools
  • Hvad er SSIS-pakke?

Lad os komme i gang.

Hvad er dataintegration?

Dataintegration er en proces, hvor heterogene data hentes og kombineres som en inkorporeret form og struktur. For eksempel er enhver virksomhed i disse dage nødt til at behandle store datasæt fra forskellige kilder. Disse data skal behandles for at give indsigtsfuld information til at træffe forretningsbeslutninger. Så en simpel løsning ville være dataintegration. Det vil grundlæggende integrere alle dine data, der er til stede i de forskellige databaser og kombinere dem på den samme platform.

Her er et par måder at opnå dataintegration på:

Nu hvor du har forstået dataintegration, lad os se, hvorfor SSIS bruges. SSIS står for SQL Server Integration Services.

Hvorfor SSIS?

  • Data kan indlæses parallelt til mange forskellige destinationer
  • SSIS fjerner behovet for hardcore programmører
  • Tæt integration med andre produkter fra Microsoft
  • SSIS er billigere end de fleste andre ETL-værktøjer
  • SIS leverer GUI til nemt at transformere data
  • Byg BI ind i en datatransformationsproces
  • Robust fejl- og hændelseshåndtering

Gå videre i denne SSIS-tutorial, lad os se, hvad det præcist er, og hvordan det virker.

Hvad er SSIS?

SQL Server Integration Services (SSIS) er en komponent i Microsoft SQL Server-databasesoftwaren, der kan bruges til at udføre en bred vifte af dataintegrations- og datatransformationsopgaver.

  • Dataintegration: Den kombinerer dataene fra forskellige kilder og giver brugerne et samlet overblik over disse data
  • Arbejdsgang: Den kan også bruges til at automatisere vedligeholdelse af SQL Server-databaser og opdateringer til multidimensionelle analytiske data

Funktioner i SSIS

Nogle af funktionerne til at bruge SSIS er:

  • Organiserede transformationer og opslag
  • Tæt integration med andre Microsoft SQL-familier
  • Giver rige studiemiljøer
  • Indeholder en masse dataintegrationsfunktioner for bedre transformationer
  • Højhastighedsdataforbindelse

Du kan gennemgå nedenstående video, som dækker alt det grundlæggende, inklusive data warehousing-koncepter, som bruges til dataudtræk, transformation og indlæsning (ETL). Den er ideel til både begyndere og professionelle, der ønsker at opfriske deres grundlæggende MSBI.

Gå videre i SSIS tutorial, lad os se, hvordan det præcist fungerer.

Hvordan fungerer SSIS?

SSIS består af tre hovedkomponenter, nemlig:

  • Driftsdata
  • ETL-proces
  • Datavarehus

Disse opgaver med datatransformation og oprettelse af arbejdsgange udføres ved hjælp af 'SSIS Package', som vil blive diskuteret senere i denne blog. Lad os gå videre med SSIS-tutorial, og lad os først forstå hver af disse komponenter i detaljer:

Driftsdata

Et operationelt datalager (ODS) er en database designet til at integrere data fra flere kilder til yderligere operationer på dataene. Dette er stedet, hvor de fleste af de data, der bruges i den aktuelle operation, opbevares, før de overføres til datavarehuset til længerevarende opbevaring eller arkivering.

ETL-proces

ETL er en proces til at udtrække, transformere og indlæse data. Extract, Transform and Load (ETL) er processen med at udtrække data fra forskellige kilder, transformere disse data for at opfylde dine krav og derefter indlæse i et måldatavarehus. ETL giver en ONE STOP-LØSNING til alle disse problemer.

  • Udtræk
  • Transformer
  • Indlæs

Udtræk: Ekstraktion er processen med at udtrække data fra forskellige homogene eller heterogene datakilder baseret på forskellige valideringspunkter.

Transformation: Ved transformation analyseres hele data, og forskellige funktioner anvendes på dem for at indlæse dataene til måldatabasen i et renset og generelt format.

Indlæs: Indlæsning er processen med at indlæse de behandlede data til et måldatalager ved brug af minimale ressourcer.


Datalager

  • Datawarehouse indfanger data fra forskellige kilder for nyttig analyse og adgang.
  • Datawarehousing er et stort sæt akkumulerede data, som bruges til at samle og administrere data fra forskellige kilder med det formål at besvare forretningsspørgsmål. Hjælper derfor med at træffe beslutninger.

Krav til SQL Server Integration Services

For at arbejde med SSIS skal du installere følgende:

  • SQL-server
  • SQL-serverdataværktøjer

Lad os tage et kig på installationsprocessen.

SQL-serverinstallation

Gå til webstedet:https://www.microsoft.com/en-au/sql-server/sql-server-downloads for at installere SQL Server. Du kan installere den seneste version eller den tidligere version efter dit valg.

Så der er forskellige udgaver af SQL Server, nemlig:

    • Gratis prøveperiode: Du får en 180-dages gratis prøveversion af SQL Server 2017 på Windows.
    • Udviklerudgave: Det er en gratis udgave med alle funktioner, licenseret til brug som en udviklings- og testdatabase i et ikke-produktionsmiljø.
    • Express Edition: Express er en gratis udgave af SQL Server, ideel til udvikling og produktion til desktop-, web- og små serverapplikationer.

Næste gang, lad os se, hvordan du installerer dataværktøjerne.

SQL-serverdataværktøjer

Gå til webstedet:https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server -ver15 og tjek de forskellige udgivelser leveret af Microsoft. Se nedenstående skærmbillede med den seneste SSDT-udgivelse sammen med downloadlinket.

I denne vejledning vil jeg installere 15.9.1-versionen. Så lad os begynde.

Trin 1: Når du åbner .exe-filen, bliver du bedt om at genstarte systemet før installationen.

Trin 2: Når du har genstartet dit system, er du klar til at gå. Bare klik på knappen "Næste" og følg instruktionerne på skærmen.

Trin 3: Det vil vise de nødvendige værktøjer og funktioner såsom SQL Server Database, SSAS, SSRS og SSIS. Sørg for at kontrollere dem alle og klik på knappen "Installer". Se nedenstående skærmbillede for det samme.

Næste i SSIS Tutorial vil vi diskutere SSIS-pakken, og hvordan du kan oprette den ved hjælp af ovenstående værktøjer.

Hvad er SSIS-pakke?

En pakke er en grundlæggende blok, hvor du går videre og koder i SSIS. Nu henviser "kode" ikke til noget programmeringssprog, det er den udvikling, du laver. Så dybest set foregår din udvikling inde i en pakke. Som diskuteret ovenfor er SSIS afgørende for ETL, og SSIS-pakken vil udføre ETL-processen. Derfor er det et objekt, der implementerer Integration Services-funktionalitet til at udtrække, transformere og indlæse data . En pakke består af:

  • Forbindelser
  • Kontrol af flowelementer
  • Dataflowelementer

Det er alt for denne SSIS Tutorial. Jeg håber, du har nydt at læse den.

Dette bringer os til slutningen af ​​denne blog. Jeg håber, du kunne lide denne Power BI tutorial blog. Dette var den første blog i Power BI-serien. Denne Power BI tutorial vil blive efterfulgt af min næste blog, som vil fokusere på Power BI Dashboards, læs det også.

Hvis du ønsker at lære SSIS og bygge en karriere inden for datavisualisering eller BI, så tjek vores MSBI Training Certification som kommer med instruktørledet livetræning og projekterfaring i det virkelige liv. Denne træning vil hjælpe dig med at forstå MSBI i dybden og hjælpe dig med at opnå beherskelse over emnet.

Har du et spørgsmål til os? Nævn det i kommentarfeltet i "SSIS Tutorial", så vender vi tilbage til dig.


  1. Sådan tilføjer du lodrette grænser til dit SQL*Plus / SQLcl-outputgitter

  2. Sådan benchmarker du PostgreSQL-ydelse

  3. Brug af row_to_json() med indlejrede joinforbindelser

  4. Hvordan kan jeg løse ORA-00911:ugyldig tegnfejl?