Cloudera Data Platform (CDP) Data Center er en fuldstændig dataplatform, der forener den seneste open source-analyse – Spark, Impala, Hive, HBase, Kafka, Hadoop og mere – til et multifunktionelt analyse- og datastyringssystem, der indeholder:
- SQL-analyse med højere ydeevne
- Strømbehandling og -styring i realtid
- Granulær attributbaseret adgangskontrol
- Dynamisk kolonnefiltrering og rækkemaskering
- En 10x stigning i fil- og objektskalerbarhed
Jeg brugte et Terraform (v0.12) modul, der implementerer CDP Data Center på Oracle Cloud Infrastructure (OCI).
Denne skabelon har støtte til at målrette eksisterende VCN/Subnets til klyngeimplementering. For at aktivere denne funktionalitet skal du blot bruge skemamenusystemet til at vælge et eksisterende VCN-mål og derefter vælge passende undernet for hver klyngeværtstype.
1. Download zip-filen til enten Cloudera Terraform-implementeringen med Resource Manager .
2. Log ind på Oracle Cloud Infrastructure (OCI)
3. Vælg Ressourceadministrator og klik på Stakke
4. Klik på Opret stak .
5. På Stakoplysninger side upload zip-filen, som du downloadede i trin 1, og klik derefter på Næste .
6. På Konfigurer variabler side, skal du indtaste indholdet af en "SSH-leveret nøgle" (valgfrit). Bemærk:Hvis du implementerer Cloudera Manager til et privat undernet, skal du bruge en VPN- eller SSH-tunnel gennem en Edge Node for at få adgang til klyngestyring. Når du opretter en VPC, skal du angive en række IPv4-adresser for VPC'en i form af en Classless Inter-Domain Routing (CIDR) blok, for eksempel 10.0.0.0/16. Klik på Næste .
7. Bekræft din konfiguration, og klik påOpret.
9. Fra Terraform-handlinger menuen vælg Plan
10. Klik på Planlæg
11. Vent et øjeblik på, at dette job er fuldført.
12. Terraform er blevet initialiseret.
13. Job fuldført lykkedes
14. Diagram, der viser, hvad der typisk er implementeret ved hjælp af denne skabelon. Disse ressourcer fordeles automatisk mellem "Fejldomæner" i et "Tilgængelighedsdomæne" for at sikre fejltolerance.
Referencer
Lær om implementering af Hadoop på Oracle Cloud Infrastructure. Tilgængelig på https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Implementer Hadoop nemt på Oracle Cloud Infrastructure ved hjælp af Resource Manager. Tilgængelig på https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera på Oracle Cloud Infrastructure (Terraform-implementeringsskabelon). Tilgængelig på https://github.com/oracle-quickstart/oci-cloudera
Oversigt over Ressourcemanager. Tilgængelig på https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
CDP Datacenter. Tilgængelig på https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html