sql >> Database teknologi >  >> NoSQL >> HBase

Operationel database i CDP

Redaktørens note, august 2020:CDP Data Center kaldes nu CDP Private Cloud Base. Du kan lære mere om det her.

Clouderas operationelle database (OpDB) i CDP leverer en real-time, altid tilgængelig, skalerbar OpDB, der serverer traditionelle strukturerede data sammen med nye ustrukturerede data inden for en samlet Operational and Warehousing platform. Cloudera leverer en operationel database, der serverer traditionelle strukturerede data sammen med nye ustrukturerede data inden for en samlet open source-platform.

Den operationelle database hjælper dig med at:

Operationaliser maskinlæring/kunstig intelligens for at revolutionere sektorer som sundhedspleje, offentlige forsyningsselskaber osv. 

  • Vis indhold i realtid på webskala.
  • Gennemfør big data-analyse til operationel og offline brug.
  • Bruges som en robust lagerplads.

OpDB i CDP er i øjeblikket tilgængelig i to formfaktorer:som et fuldt sikkert, semi-administreret tilbud i CDP Public Cloud - Data Hub, og som et fuldt tilpasseligt tilbud i CDP Data Center - svarende til det, der allerede er tilgængeligt i CDH og HDP. Du kan vælge en formfaktor baseret på din implementeringsstrategi og OpDB-behov. Den operationelle database bruger et objektlager såsom Amazon S3 som et lagerlag for Apache HBase, hvor hFiler skrives til objektlageret, men WAL'er skrives til HDFS.

Den operationelle database i CDP har følgende komponenter: 

  • Apache Phoenix en SQL-grænseflade, der kører oven på Apache HBase.
  • Apache HBase er designet til massiv skalerbarhed, så du kan gemme ubegrænsede mængder af data på en enkelt platform og håndtere stigende krav til visning af data.
  • Apache ZooKeeper leverer en distribueret konfigurationstjeneste, en synkroniseringstjeneste og et navneregister.
  • Apache Knox Gateway giver perimetersikkerhed, så virksomheden trygt kan udvide adgangen til nye brugere.
  • Apache HDFS bruges til at skrive Apache HBase WAL'erne.
  • Objektbutik som Amazon S3 og Microsoft ADLS Gen2 bruges til at gemme Apache HBase HFiles.
  • Shared Data Experience (SDX) bruges til sikkerheds- og styringsfunktioner. Sikkerheds- og styringspolitikker sættes én gang og anvendes på tværs af alle data og arbejdsbelastninger.
  • IDBroker er en REST API bygget som en del af Apache Knox's godkendelsestjenester. Det giver en godkendt og autoriseret bruger mulighed for at udveksle et sæt legitimationsoplysninger eller et token med adgangstokens for cloudleverandører.

Driftsdatabase i CDP-serien 

Denne artikel gav dig en introduktion om OpDB om CDP og dens arkitektur. Du kan lære mere om hvert aspekt af OpDB og finde ud af de nye funktioner og muligheder i OpDB i de kommende artikler i denne serie. Vi opdaterer links til hvert blogindlæg, efterhånden som de udgives.

Tilgængelighed

Clouderas OpDB sikrer, at brugere kan få adgang til eller hente lagrede data. Den understøtter både auto-sharding og foruddefineret sharding, tre forespørgselsmotorer og adskillige dataintegrationsværktøjer. Denne artikel giver et overblik over disse muligheder og andre funktioner, der sikrer, at der opnås et højt tilgængelighedsniveau.

Administration

Clouderas OpDB giver adskillige administrationsværktøjer og funktioner til at administrere din OpDB-arbejdsbyrde. Administratorer kan implementere OpDB som et fuldt sikkert, semi-administreret tilbud i CDP Public Cloud – Data Hub og som et fuldt tilpasseligt tilbud i CDP Data Center (svarende til, hvad der er tilgængeligt i CDH og HDP). Denne artikel giver dig et overblik på højt niveau over, hvilke funktioner og værktøjer der understøttes til at administrere OpDB i CDP.

Administration

Clouderas OpDB leverer administrationsværktøjer, der hjælper dig med effektivt at administrere dine OpDB-arbejdsbelastninger. Denne artikel giver dig et overblik over OpDB-administrationsværktøjerne og funktionerne i CDP.

Tilgængelighed

Clouderas OpDB opretholder et højt niveau af datatilgængelighed, hvilket sikrer, at de nødvendige data er tilgængelige, når og hvor det er nødvendigt, selvom der opstår knudefejl. Denne artikel giver et overblik over funktioner, der gør et højt tilgængelighedsniveau muligt, såsom høj tilgængelighed, datareplikering og fejlbeskyttelse.

Integritet

Clouderas OpDB giver forskellige dataintegritetsfunktioner, herunder enheds- og domæneintegritet, ACID-transaktioner og ikke-relationel integritet. Denne artikel giver et overblik over OpDBs dataintegritetsfunktioner.

Applikationssupport

Clouderas OpDB understøtter forskellige populære sprog, rammer og applikationer, som du kan bruge til at få adgang til data gemt i din OpDB. Denne artikel giver dig et overblik over de understøttede sprog, rammer og applikationer.

NoSQL og relaterede funktioner

Da Clouderas OpDB inkluderer NoSQL-databasen HBase til at gemme data, har den NoSQL-kapaciteter, såsom nøgleværdier, tabel-stil-kapaciteter og fleksible datatyper. Tæt integration på tværs af Hadoop-økosystemet leveres også, inklusive HDFS, Spark og Kafka. Denne artikel giver et overblik over disse muligheder.

Skalerbarhed

Clouderas OpDB er designet til høj skalerbarhed, der understøtter både vertikal og horisontal skalerbarhed med fleksibel datatype og ingen begrænsning på datastørrelse. Denne artikel giver et overblik over understøttede skalerbarhedsrelaterede funktioner og værktøjer.

Sikkerhed

Clouderas OpDB leverer flere sikkerhedsløsninger på forskellige niveauer, hvad angår kryptering, autentificering, autorisation og revision. Denne artikel giver et overblik over disse sikkerhedsrelaterede funktioner og værktøjer.

For mere information, gå venligst til:Kom godt i gang med operationel database.


  1. Hvordan udfører man MongoDB native query (JSON) kun ved hjælp af mongo-java-driver?

  2. Hvordan bruger man en variabel som et feltnavn i mongodb-native findOne()?

  3. Sådan opdaterer du en matrixværdi i Mongoose

  4. Gruppér efter tilstand i MongoDB