sql >> Database teknologi >  >> RDS >> Database

SQL dataopdagelse og klassificering

Med de seneste databeskyttelseslove og implementeringen af ​​GDPR sidste år, er det bydende nødvendigt for os at vide, hvilken type data vores databaser gemmer. Dette vil hjælpe os med at klassificere data baseret på reglerne og hjælpe os med at opfylde databeskyttelsesstandarderne. Det er ret svært for DBA'er at kende typen af ​​data i en database. Der er dog et nyt indbygget værktøj i SQL Server Management Studio (SSMS), som kan hjælpe os med nemt at finde data i databasen. Med dette værktøj vil vi være i stand til at klassificere dataene og arbejde på at rapportere eventuelle følsomme data.

Global databeskyttelsesforordning aka GDPR

GDPR blev først vedtaget i 2016 og trådte i kraft fra 2018. Grundlæggende er det en ny ramme for databeskyttelse i Europa. Det påvirker dog ikke kun organisationer, der er beliggende inden for EU, men alt, der er eksternt relateret til det. Det er vigtigt for organisationer at kende konsekvenserne af ikke at overholde disse regler, da konsekvenserne kan være skadelige. For at få en idé om konsekvenserne henvises til afsnit 5 her:https://gdpr-info.eu/art-83-gdpr/, "Overtrædelser af følgende bestemmelser skal i overensstemmelse med stk. 2 være underlagt til administrative bøder op til 20 000 000 EUR , eller i tilfælde af en virksomhed op til 4 % af den samlede verdensomspændende årlige omsætning i det foregående regnskabsår, alt efter hvad der er højest . Af en af ​​disse grunde vil du bemærke, at en række virksomheder kæmper for at opfylde de lovgivningsmæssige krav sidste år. Selv store virksomheder verden over, inklusive Microsoft, har implementeret GDPR på tværs af alle deres kunder verden over, uanset om de er placeret inden for EU eller udenfor. Som DBA'er eller dataprofessionelle skal vi være opmærksomme på konsekvenserne af vores handlinger og forstå vigtigheden af ​​de data, der er gemt i vores databaser.

Download den seneste SQL Server Management Studio (SSMS)

Før vi starter demoen til dataopdagelse og klassificering, er det vigtigt for os at downloade den seneste version af SQL Server Management Studio (SSMS). Som du ved, er SSMS ikke længere en del af SQL Server-installationen, der er nye udgivelser af produktet, som udgives hyppigt med nyere og opgraderede funktioner. Da dataopdagelse og klassificering er et indbygget værktøj i SSMS, anbefales det altid at have den nyeste version af SSMS. I skrivende stund er den seneste SSMS-version 17.9.1 og kan downloades her. Sørg for at lukke alle versioner af SSMS på din server før installation, da installationen stopper, når SSMS kører. Når den er installeret, genstart din server og fortsæt med de næste trin.

Gendan en prøvedatabase

For at demonstrere den nye indbyggede dataklassificeringsfunktion i SSMS kan du bruge eksempel SQL Server-databasen, der er tilgængelig til download. Jeg brugte "WideWorldImporters"-eksempeldatabasen i denne demo. Du kan downloade en sikkerhedskopieksempel og gendanne den på din server. Se dette link for sikkerhedskopieringsfilen. Du kan downloade den valgte fil som vist nedenfor.

Når backupfilen er downloadet, skal du gendanne databasen ved hjælp af den. Du kan bruge dette eksempelscript til at udføre gendannelsen. Du skal muligvis opdatere mappestierne i henhold til placeringen på din server.

restore database WideWorldImporters
from disk='C:\WideWorldImporters-Full.bak'
with move 'WWI_Primary' to 'C:\SQLData\WideWorldImporters.mdf',
     move 'WWI_UserData' to 'C:\SQLData\WideWorldImporters_UserData.ndf',
	 move 'WWI_Log' to 'C:\SQLData\WideWorldImporters.ldf',
	 move 'WWI_InMemory_Data_1' to 'C:\SQLData\WideWorldImporters_InMemory_Data_1',
	 stats

Klassificer data

Når databasen er gendannet, skal du højreklikke på databasen i SSMS, gå til Opgaver og klik på Klassificer data , som vist nedenfor.

Når du klikker på Klassificer data , åbnes en dialogboks, hvor du kan se klassificeringsanbefalingerne.

Når du klikker på Klik for at se , vil du være i stand til at se den detaljerede liste over kolonner, der anbefales til dataklassificering. På skærmbilledet nedenfor kan du se en liste med 92 kolonner med klassificeringsanbefalinger. Værktøjet var i stand til at udføre scanningen for dig og give anbefalinger uden brugerinput.

Vælg flere kolonner på den anbefalede liste

Ud af de 92 kolonner, der blev anbefalet, kan vi først vælge flere kolonner på listen og se de ændringer, der sker. I vores demo vil vi vælge E-mailadresse kolonnen i Personer bord. På skærmbilledet nedenfor kan du se, at E-mailadresse kolonne er valgt i venstre side. Når det er gjort, vil du se Acceptér valgte anbefalinger mulighed. Ellers er denne indstilling nedtonet.

I kolonnen med følsomhedsetiket kan du også se, om kolonnen skal overholde GDPR eller ej. Når kolonnen er valgt, vil du se, at anbefalingen skal gemmes.

Klik på Gem , og du vil se en bekræftelse på, at ændringerne er blevet opdateret.

Nu kan du klikke på Vis rapport at generere en rapport til SQL Data Classification for WideWorldImporters-databasen. Rapporten er vist nedenfor.

I rapporten kan du se det samlede antal af tabeller, kolonner og datafordeling. Under datafordelingen kan du se, om data er mærket som GDPR eller ej. Ved at bruge dette værktøj har du en bedre forståelse af vigtigheden og typen af ​​data, der lagres i din database. For at gøre tingene nemmere kan du også eksportere denne rapport enten som Excel, PDF eller Word og e-maile den til din virksomhedsleder eller CIO til gennemgang. Du skal bare højreklikke hvor som helst i rapporten og bruge en af ​​mulighederne som vist nedenfor.

Vælg alle kolonner på den anbefalede liste

I det foregående eksempel anvendte du kun én kolonne fra listen over anbefalede kolonner. Du har dog mulighed for at vælge alle kolonnerne på den anbefalede liste og gøre din database kompatibel med hensyn til datasikkerhedspolitikker. Bare vælg Afkrydsningsfeltet mulighed for derved at vælge alle kolonnerne på den anbefalede liste, som vist på skærmbilledet nedenfor.

Med denne mulighed bliver alle kolonnerne valgt og er klar til at blive anvendt. For at foretage ændringerne i din database skal du klikke på Accepter valgte anbefalinger . På skærmbilledet kan du se 91 kolonner med klassificeringsanbefalinger. Med blot et klik på en knap kan du anvende anbefalingerne for alle disse kolonner. Ligesom du gjorde i det foregående eksempel for en enkelt kolonne, skal du gå videre og klikke på Gem for at fuldføre processen.

Når du klikker på Gem , bliver klassifikationsændringerne opdateret. Klik nu på Vis rapport for at se den detaljerede dataklassificeringsrapport.

Fra denne rapport kan du se, at alle de klassificerede kolonner tilhørte tabellerne inden for 4 skemaer. Klik på Tabel for at få oplysninger om tabelnavnene kolonne for at se. Rapporten har et cirkeldiagram med detaljer om GDPR-følsomhed. Der er også et andet nyttigt cirkeldiagram til informationstypefordelingen.

Tilføj klassificeringsmulighed

Du har måske bemærket, at en række tabeller blev mærket som indeholdende følsomme data fra den genererede dataklassificeringsrapport. Dette var gennem den anbefaling, der blev genereret ved at bruge dette dataklassificeringsværktøj. Det kan dog være en god idé at gennemgå rapporten yderligere og tilføje din egen dataklassificering baseret på din forståelse af dataene. Dette er en manuel proces, hvor vi selv vælger kolonnerne. Fra dataklassificeringsrapporten nedenfor kan du se, at kun én kolonne TaxRate i OrderLines tabellen er klassificeret til at indeholde fortrolige data.

Du er dog klar over, at andre kolonner i denne tabel også skal være i denne rapport. Du kan gennemgå OrderLines tabel og planlægger at inkludere Beskrivelse kolonne i dataklassificeringsrapporten.

I dette tilfælde skal du højreklikke på databasen og udføre de samme handlinger, som du gjorde tidligere for at klassificere data. Du vil se Tilføj klassifikation mulighed.

Når du er færdig, kan du vælge tabellen og kolonnen som vist nedenfor. Vælg de muligheder, der er tilgængelige i rullemenuen for at klassificere dataene. På skærmbilledet nedenfor kan du se, at Beskrivelse kolonnen i Ordrelinjer tabel er markeret som Fortroligt . Tilføj dataklassifikationen ved at klikke på Tilføj knap.

Når du er færdig, skal du klikke på Gem for at opdatere ændringerne.

For at bekræfte, at ændringerne er blevet anvendt korrekt, kan du køre dataklassificeringsrapporten igen, som du gjorde i de foregående trin. Derefter kan du bekræfte, at kolonnen blev tilføjet korrekt.

I rapporten kan du bekræfte, at Beskrivelse kolonne blev faktisk tilføjet med succes og er mærket som fortrolig. Med denne tilgang kan du mærke andre kolonner efter eget valg baseret på bestemte krav eller anvisninger fra ledelsen.

Udvidede egenskaber i kolonner

Når du tjekker kolonnerne yderligere, kan du få detaljer om den udvidede egenskabskatalogvisning relateret til kolonnerne mærket til dataklassificering. For eksempel, når du højreklikker på Beskrivelse kolonnen i Sales.OrderLines tabel, vil du være i stand til at se detaljerne i Udvidede egenskaber sektion for den kolonne.

sys_information_type_name og sys_sensitivity_label_name værdier er beskrivelser i kolonnen i sys.extended_properties katalogvisning. Metadataene vedrørende disse dataklassifikationer er gemt i denne katalogvisning:sys.extended_properties .

Yderligere kommentarer

Med dette nye værktøj vil du bemærke, at Microsofts produktteam har gjort denne opgave med dataklassificering så enkel og nem at bruge. For at være ærlig er der ingen reel undskyldning for manglende forståelse af de underliggende data i din database. I betragtning af vigtigheden af ​​brugerdatabeskyttelse og de bekymringer, som forskellige globale agenturer har med hensyn til at kompromittere brugerdata fra velkendte organisationer, er det yderst vigtigt for DBA'er og dataprofessionelle at tage databeskyttelse alvorligt og holde sig ajour med det nyeste teknologitilbud. I betragtning af at dette værktøj er gratis og nemt at bruge, er der ingen reel grund til ikke at bruge det på tværs af dine produktionssystemer.

Konklusion

  • I denne artikel læser du om brugen af ​​en ny cool funktion i SQL Server Management Studio (SSMS)
  • Du lærte kort en række vigtige punkter vedrørende databeskyttelse
  • Du forstod vigtigheden af ​​at holde din SSMS-version opdateret med de nyeste versioner, så du ikke går glip af nye funktioner eller opgraderinger
  • Du så, hvordan du nemt kan teste nye funktioner ved at gendanne en eksempel SQL Server-database
  • Du lærte, hvordan du klassificerer dataene ved hjælp af SSMS
  • Du lærte, hvordan du genererer rapporter for at se detaljer om de mærkede kolonner
  • Du lærte, hvordan du manuelt tilføjer dine egne dataklassifikationer baseret på din forståelse af de underliggende data
  • Du ved også, at alle dataklassifikationer kan udføres baseret på dette enkle værktøj, og du kan generere fantastiske rapporter og få en bedre forståelse af de data og den database, du administrerer.


  1. Fejlkode:1005. Tabellen '...' kan ikke oprettes (fejlnr.:150)

  2. Hvad betyder nøgleordet KEY?

  3. Sådan listes alle standardbegrænsninger med kolonner i SQL Server-databasen - SQL Server / TSQL selvstudium, del 92

  4. Inkluder manglende måneder i gruppe efter forespørgsel