Værdien af gode testdata for DBA'er er velkendt:
"Test af databaseintensive applikationer har unikke udfordringer, der stammer fra skjulte afhængigheder, subtile forskelle i datasemantik, måldatabaseskemaer og implicitte forretningsregler. Disse udfordringer bliver endnu sværere, når applikationen involverer integrerede og heterogene databaser eller fortrolige data. Korrekte testdata, der simulerer virkelige dataproblemer, er afgørende for at opnå rimelige kvalitetsbenchmarks for funktionel inputvalidering, belastning, ydeevne og stresstest. ” – Ali Raza &Stephen Clyde, abstrakt fra Creating Dataset for Testing Relational Databases
Test af databaseoperationer, prototyping af datavarehus og ETL/ELT-job, sikker outsourcing af filprøver og rapporter og kørsel af ydeevnebenchmarks på DB-apparater kræver alt sammen testdata med produktionsdatabasens udseende og fornemmelse, så de applikationer, der bruger disse testdata nu vil udføre succesfuldt med rigtige data senere. I deres bog fra 2012 sammenligner Raza og Clyde testdatagenerering med testdataekstraktion.
IRI og dets brugere ved, at det er uønsket at bruge rigtige data til test. Den mest åbenlyse årsag i dag er, at reelle data risikerer at afsløre personlig identificerbar information (PII), som skal holdes fortrolig. En udvikler eller tester ønsker ikke at køre processer eller teste et databasesystem og risikere at dele kundeoplysninger som cpr-numre, kreditkortoplysninger, fødselsdatoer osv. i denne fase. Aktuelt tilgængelige reelle data er muligvis heller ikke robuste eller realistiske nok til at stressteste applikationer eller databaser, som skal håndtere større mængder og/eller værdiområder.
Desværre skrev Raza og Clyde deres bog, før RowGen v3 blev udgivet, da de måske har observeret, at den genererer testdata, der:
1) ikke afslører PII, fordi den indeholder nye eller randomiserede reelle kolonneværdier
2) bibeholder den strukturelle og referentielle integritet defineret i den originale DDL
3) er ikke begrænset til den originale databases datamængder eller værdiintervaller
4) kan tilpasses gennem generering af scripts for at imødekomme komplekse krav
5) er forudsorteret og automatisk masseindlæst for den hurtigst mulige population
6) er defineret i batch scripts, der har forskellig fleksibilitet og kan eksporteres, genbruges og ændres efter behov
IRI RowGen v3 er den seneste udgivelse af verdens hurtigste og mest robuste højvolumen-testdatagenerator til relationelle databaser. RowGen vil køre fra IRI Workbench GUI bygget på Eclipse, på kommandolinjen eller fra batch-programmer for at producere kvaliteten og mængden af testdata, der er nødvendige for nøjagtigt at afspejle omfanget, layouterne og relationerne i produktionsdatabaser, og til gengæld, datavarehuse og operationelle datalagre.
RowGen v3's nye DB Test Data wizard, når den lanceres fra IRI Workbench GUI, guider brugerne gennem specifikationen og automatiseringen af:
Parsing – ved at vælge skemaet og tabellerne, der skal udfyldes, oversætter RowGen databasetabelbeskrivelserne og integritetsbegrænsningerne til .rcl-scripts, der specificerer kildestrukturen, afhængige sæt og dataoprettelse i den rækkefølge, der er nødvendig for at udfylde tabellerne i det rigtige format, og med alle primære nøgler, unikke indekser og fremmednøgleforhold respekteret.
Generation – ved at bygge og køre .rcl-scripts for at oprette én testfil pr. tabel, der kan masseindlæses og/eller gemmes til fremtidig brug.
Befolkning – ved at masseindlæse måltabellerne i den rigtige rækkefølge med forudsorterede testdata, der er strukturelt og referentielt korrekte.
Processen kan hurtigt indlæse enorme testdatabaser og overholde både forretningsregler og love om databeskyttelse. De genererede data er realistiske og robuste nok til at stressteste databaseoperationer og forespørgselsapplikationer.
RowGen v3 understøtter også regel- og script-baserede muligheder for at kontrollere specifikke feltværdier og værdiområdefordelinger, der imødekommer specifikke databasebegrænsninger og bedst repræsenterer forekomsten og forekomsthastigheden af data i produktionen. Brugere kan også tegne grafer og visuelt underbygge, at testværdierne er i overensstemmelse med lineære, normaliserede, vægtede eller standardfordelinger.
For flere oplysninger om RowGen v3, se www.iri.com/products/rowgen, www.iri.com/products/rowgen/gui eller læs de andre artikler i afsnittet Testdata på IRI-bloggen.