Koncepter
Hvad er Cloudera Operational Database (COD)?
Operational Database er en relationel og ikke-relationel database bygget på Apache HBase og er designet til at understøtte OLTP-applikationer, som bruger big data.
Den operationelle database i Cloudera Data Platform har følgende komponenter:
- Apache Phoenix giver en relationel model, der letter massiv skalerbarhed. Det udnytter skalerbarheden og robustheden af Apache HBase.
- Apache HBase leverer en ikke-relationel model designet til massiv skalerbarhed, så du kan gemme ubegrænsede mængder data på en enkelt platform og håndtere voksende krav til visning af data.
- Apache ZooKeeper leverer en distribueret konfigurationstjeneste, en synkroniseringstjeneste og et navneregister.
- Apache Knox Gateway giver perimetersikkerhed, så virksomheden trygt kan udvide adgangen til nye brugere.
- Apache HDFS bruges til at skrive Apache HBase WAL'erne (og HBase HFiles i nogle tilfælde).
- Objektbutikker såsom Amazon S3 og Microsoft ADLS Gen2 bruges til at gemme Apache HBase HFiles.
- Shared Data Experience (SDX) bruges til sikkerheds- og styringsfunktioner. Sikkerheds- og styringspolitikker fastsættes én gang og anvendes på tværs af alle data og arbejdsbelastninger. Ligesom CDP selv, er SDX bygget på community open source-projekter, hvor Apache Ranger og Apache Atlas er en ære.
Atlas leverer åbne metadatastyrings- og styringsfunktioner til at opbygge et katalog over alle aktiver og også klassificere og styre disse aktiver. SDX-laget i CDP udnytter det fulde spektrum af Atlas til automatisk at spore og kontrollere alle dataaktiver.
Ranger leverer sikkerhedsnøglestyring med et separat login for nøgleadministratorer, der bruger Ranger KMS-tjenesten. Apache Ranger giver også meget nødvendige sikkerhedsfunktioner som kolonnemaskering og rækkefiltrering ud af boksen. En anden vigtig faktor er, at adgangspolitikkerne i Ranger kan tilpasses med dynamisk kontekst ved hjælp af forskellige attributter som "geografisk region" eller "tid på dagen".
- IDBroker er en REST API bygget som en del af Apache Knox's godkendelsestjenester. Det giver en godkendt og autoriseret bruger mulighed for at udveksle et sæt legitimationsoplysninger eller et token med adgangstokens for cloudleverandører.
CDP Operational Database Data Service
CDP Operational Database (COD) er en operationel database med automatisk skalering i realtid drevet af Apache HBase og Apache Phoenix. Det er en datatjeneste, der kører på Cloudera Data Platform (CDP). Du kan få adgang til COD direkte fra din CDP-konsol. COD giver dig mulighed for at oprette en ny operationel database med et enkelt klik og automatisk skalerer baseret på din arbejdsbyrde.
Følgende er de vigtigste trin for at komme i gang med COD:
- Opret en database i et miljø ved hjælp af et enkelt klik, og en database skulle være oppe og tilgængelig inden for få minutter.
- Konfigurer din adgangskode til arbejdsbelastning. For mere information, klik her.
- Download og installer Apache Maven, Java, Python 3.8.
- Installer CDP Client på din maskine. For mere information, klik her.
- Følg instruktionerne i eksempellageret for at foretage ændringer i din maven settings-security.xml, settings.xml og pom.xml.
- Byg og kør applikationerne.
Apache HBase
HBase er en kolonneorienteret datalagringsarkitektur, der er dannet oven på HDFS for at overvinde dens begrænsninger. Det udnytter de grundlæggende funktioner i HDFS og bygger på det for at give skalerbarhed ved at håndtere en stor mængde læse- og skriveanmodninger i realtid. Selvom HBase-arkitekturen er en NoSQL-database, letter den processen med at vedligeholde data ved at fordele dem jævnt på tværs af klyngen. Dette gør det hurtigt at få adgang til og ændre data i HBase-datamodellen. Lær mere om Apache HBase.
Apache Phoenix
Apache Phoenix er en RDBMS og ANSI SQL-grænseflade. Apache Phoenix implementerer bedste praksis-optimeringer for at sætte softwareingeniører i stand til at udvikle næste generations datadrevne applikationer baseret på HBase. Ved at bruge Phoenix kan du oprette og interagere med tabeller i form af typiske DDL/DML-sætninger ved hjælp af standard JDBC API, ODBC og Phoenix DB API.
Phoenix leverer:
- SQL og JDBC API-understøttelse
- Understøttelse af sent bundet, skema-på-læsning
- Adgang til data lagret og produceret i andre komponenter såsom Apache Spark og Apache Hive
Lær mere om Apache Phoenix.
Procedure
Sådan opretter du en operationel database
Du kan oprette en operationel database i dit registrerede miljø ved hjælp af CDP Operational Database (COD).
Forudsætninger
- Du skal være logget ind på COD-miljøet som ODA-administrator.
- Sørg for, at du er autoriseret til at oprette en database.
Trin
- Log ind på CDP-webgrænsefladen. For eksempel CDP-konsol.
- Vælg Operational Database.
- I COD-webgrænsefladen skal du klikke på Opret database.
- Vælg det miljø fra listen, hvor du vil have databasen.
- Angiv et navn til databasen i feltet Databasenavn.
- Klik på Opret database.
Resultat
Der vises en informationsside, der viser status for databasen. Din nye database er klar til at blive brugt, når dens status bliver Tilgængelig.
Demo
Sådan administrerer du en databaseforbindelse
Når du har oprettet en operationel database, og den er tilgængelig, kan du administrere databaseforbindelserne.
Forudsætninger
- Sørg for, at en database er oppe og tilgængelig.
- Du er autoriseret til at foretage ændringer i databasen.
Trin
- I COD-webgrænsefladen skal du vælge den database, som du vil administrere forbindelserne for.
- Under Connect, gå ind i hver fane og rediger parametrene.
Referencer
- Cloudera-dokumentation om oprettelse af en COD-database
- Operationel database i CDP
Hvis du er interesseret i at prøve CDP Public Cloud og Operational Database, så prøv vores Testdrev .