sql >> Database teknologi >  >> RDS >> Oracle

Implementer Cloudera CDP Data Center på Oracle Cloud Infrastructure (OCI)

Cloudera Data Platform (CDP) Data Center er en fuldstændig dataplatform, der forener den seneste open source-analyse – Spark, Impala, Hive, HBase, Kafka, Hadoop og mere – til et multifunktionelt analyse- og datastyringssystem, der indeholder:

  • SQL-analyse med højere ydeevne
  • Strømbehandling og -styring i realtid
  • Granulær attributbaseret adgangskontrol
  • Dynamisk kolonnefiltrering og rækkemaskering
  • En 10x stigning i fil- og objektskalerbarhed

Jeg brugte et Terraform (v0.12) modul, der implementerer CDP Data Center på Oracle Cloud Infrastructure (OCI).

Denne skabelon har støtte til at målrette eksisterende VCN/Subnets til klyngeimplementering. For at aktivere denne funktionalitet skal du blot bruge skemamenusystemet til at vælge et eksisterende VCN-mål og derefter vælge passende undernet for hver klyngeværtstype.

1. Download zip-filen til enten Cloudera Terraform-implementeringen med Resource Manager .

2. Log ind på Oracle Cloud Infrastructure (OCI)

3. Vælg Ressourceadministrator og klik på Stakke

4. Klik på Opret stak .

5. På Stakoplysninger side upload zip-filen, som du downloadede i trin 1, og klik derefter på Næste .

6. På Konfigurer variabler side, skal du indtaste indholdet af en "SSH-leveret nøgle" (valgfrit). Bemærk:Hvis du implementerer Cloudera Manager til et privat undernet, skal du bruge en VPN- eller SSH-tunnel gennem en Edge Node for at få adgang til klyngestyring. Når du opretter en VPC, skal du angive en række IPv4-adresser for VPC'en i form af en Classless Inter-Domain Routing (CIDR) blok, for eksempel 10.0.0.0/16. Klik på Næste .

7. Bekræft din konfiguration, og klik påOpret.

9. Fra Terraform-handlinger menuen vælg Plan

10. Klik på Planlæg

11. Vent et øjeblik på, at dette job er fuldført.

12. Terraform er blevet initialiseret.

13. Job fuldført lykkedes

14. Diagram, der viser, hvad der typisk er implementeret ved hjælp af denne skabelon. Disse ressourcer fordeles automatisk mellem "Fejldomæner" i et "Tilgængelighedsdomæne" for at sikre fejltolerance.

Referencer

Lær om implementering af Hadoop på Oracle Cloud Infrastructure. Tilgængelig på https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B

Implementer Hadoop nemt på Oracle Cloud Infrastructure ved hjælp af Resource Manager. Tilgængelig på https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager

Cloudera på Oracle Cloud Infrastructure (Terraform-implementeringsskabelon). Tilgængelig på https://github.com/oracle-quickstart/oci-cloudera

Oversigt over Ressourcemanager. Tilgængelig på https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm

CDP Datacenter. Tilgængelig på https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html


  1. Opsætning af maven-afhængighed til SQL Server

  2. Hvordan gemmer man arrays i MySQL?

  3. Hvordan får man primær nøglekolonne i Oracle?

  4. SQL Buddy – Et webbaseret MySQL-administrationsværktøj