Tid og teknologi bliver ved med at accelerere, og de data, vi gemmer, bliver ved med at vokse eksponentielt. Således fortsætter den nøjagtige definition af en meget stor database (VLDB) med at ændre sig med nye fremskridt inden for hardware og software. Men montering af en VLDB på din nye tablet, eller endda en bærbar computer, vil typisk ikke ske, i hvert fald ikke endnu.
Hvor stor er en meget stor database?
Mange tekniske myndigheder diskuterer det egentlige udgangspunkt for, hvad der udgør en VLDB. Nogle siger databaser på 100 gigabyte eller mere. Andre hævder, at en VLDB er mindst 1 terabyte (1000 GB) i størrelse. Det kan også måles ved antallet og typen af komplekse forespørgsler og transaktioner, det kan understøtte. Men uanset den nøjagtige mængde, er det sikkert at sige, at en VLDB indeholder en enorm mængde information, spredt i et ekstremt højt antal tuples (databaserækker), og optager massiv lagerplads i et fysisk filsystem.
Du ved, at du har at gøre med en VLDB, når selve størrelsen på den kræver mere arbejde. Ikke at være i stand til at tage backup af databasen inden for rimelig tid, og de økonomiske begrænsninger i at duplikere DB'en til testformål, er blot et par af de problemer, der skal håndteres.
Hvem bruger VLDB'er?
Mange virksomheder og organisationer bruger VLDB'er, herunder kommuner, offentlige forsvarsentreprenører, forskningsfirmaer og store virksomheder i den finansielle industri. Et godt eksempel på en, der regelmæssigt udnytter VLDB'er til dens strategiske fordel, er TAC, en fuldstændig uafhængig europæisk forskningsgruppe, der leverer rådgivning om internationale økonomiske og finansielle spørgsmål til finansielle investorer, industrivirksomheder og multilaterale organisationer. TAC konstruerer VLDB'er, for det meste til eget internt brug, men nogle er blevet gjort tilgængelige for offentligheden med det analytiske formål at overvåge udenlandske investeringer og udviklingsmål.
Andre virksomheder bruger VLDB'er til datasammenligning, datamining, data warehousing, replikeringer, forespørgsler, demonstrationer og en lang række yderligere funktioner. Teknologitrendseere overvåger med dem. IT-chefer designer og udvikler sammen med dem. F&U-eksperter og innovationsenheder sporer statistik med dem. Og VLDB'er spiller en stadig vigtigere rolle i efterspørgslen efter personlig information på World Wide Web.
Så hvordan administrerer du en meget stor database?
Historien om David vs. Goliat kommer ofte til at tænke på, når folk finder, at deres databaser nærmer sig en terabyte. Det bliver mere og mere vanskeligt at allokere plads og fremskynde forespørgsler. Så den tilsyneladende uoverkommelige opgave med at generobre plads og forbedre ydeevnen skal derefter tildeles en ekspert, en med knowhow og teknologiske værktøjer til at erobre den gigant.
VLDB'er kan effektivt kontrolleres af den rigtige type Database Management System (DBMS); dvs. specifikt designet computersoftware (eller softwarepakke), der giver en grænseflade mellem databasen og slutbrugeren, hvilket muliggør oprettelse, forespørgsel, opdatering og administration af dataene. Et DBMS opretholder også sikkerheden og integriteten af lagrede data og letter gendannelsen af information, hvis et system skulle svigte. Og der er forskellige typer DBMS'er, men vi gemmer den afhandling til en anden blog på et andet tidspunkt.
Udviklingen af de fleste databasestyringssystemer er ekstremt kompleks og tidskrævende og kræver løbende opgraderinger med fremskridt inden for computerhukommelse, lagring, processorer og netværk. Databaser fortsætter med at stige i størrelse, omfang og ydeevne, da softwareudviklere stræber efter at holde trit med kravene til moderne stigninger i datavolumen. Som det meste af livet i det 21. århundrede er vi nået meget hurtigt, og vi har data til at bevise det!