Apache Phoenix til CDH:Bedste nye funktion til DBMS
Cloudera adopterer og vil understøtte Apache Phoenix til CDH, mens det integrerer det til sin Cloudera-dataplatform på en fremadrettet basis.
Clouderas CDH-udgivelser har inkluderet Apache HBase som giver et robust NoSQL DBMS til kunders operative applikationer, der ønsker at udnytte kraften i big-data. Disse applikationer er vokset til missionsvigtige og missionskritiske applikationer, der driver toplinjeindtjening og bundlinjerentabilitet. Disse applikationer omfatter kundevendte applikationer, e-handelsplatforme, opdagelse af risici og svindel, der bruges bag kulisserne i banker eller serverer AI/ML-modeller til applikationer og muliggør yderligere forstærkningstræning af samme baseret på faktiske resultater.
Men for mange kunder har HBase været en alt for skræmmende rejse – hvilket kræver, at de lærer
- En ny datamodel, da HBase er et wide-table-skema, der understøtter millioner af kolonner, men ingen joins og
- Brug af Java API'er i stedet for ANSI SQL
De har bedt om at kunne bruge mere traditionelt skemadesign, der ligner det, der leveres af Oracle eller MySQL og været villige til at foretage nogle afvejninger vedrørende fleksibilitet, f.eks.
- De er villige til at bruge angivne datatyper i stedet for at definere deres egne
- De er villige til at opgive fleksibiliteten til at have en enkelt kolonne med flere typer afhængigt af rækken i bytte for en enkelt type i en enkelt række
For at gøre det muligt for kunderne at få en nem adgang til de andre fordele ved Apache HBase (ubegrænset udskalering, millioner af rækker, skemaudvikling osv.) og samtidig levere RDBMS-lignende funktioner (ANSI SQL, simple joins, datatyper ud af box osv.), introducerer vi support til Apache Phoenix på CDH.
For alle andre drager Phoenix-baserede applikationer også fordel af HBase-optimeringer bag kulisserne, hvilket gør det nemmere at få bedre HBase-ydeevne. For eksempel implementerer Phoenix saltning af primærnøgler - så HBase-brugere behøver ikke at gennemtænke dette aspekt af nøgledesign.
Yderligere kan Phoenix-baserede applikationer eksistere side om side med HBase-applikationer - hvilket betyder, at du kan bruge en enkelt HBase-klynge til at understøtte begge dele. Med Phoenix kan kunder fortsætte med at bruge deres foretrukne BI &dashboarding-værktøjer, ligesom de gjorde med Hive &Impala tidligere. Når de bruger Phoenix, kan de også vælge at bruge Phoenix direkte med disse værktøjer ud over muligheden for at bruge Hive / Impala, hvilket eliminerer et trin for nye implementeringer.
Fra et sikkerheds- og styringsperspektiv (SDX) bruger Phoenix i CDH HBase ACL'er til rollebaseret adgangskontrol til Phoenix-tabeller. Phoenix bruger også HBase-integration i Cloudera Navigator til revisionsoplysninger.
Cloudera har frigivet en Phoenix 4.14.1 pakke tilgængelig for CDH 5.16.2-kunder og Phoenix 5.0-pakke tilgængelig for CDH 6.2+-kunder.
Eksisterende HDP-kunder har allerede Apache Phoenix-understøttelse, og næsten halvdelen af HBase-brugere, der bruger HDP, bruger i øjeblikket Phoenix, hvilket også taler for dets popularitet i HBase-brugerfællesskabet.
Download Apache Phoenix til CDH
Byg missionskritiske applikationer ved hjælp af Apache Phoenix. Download softwaren her.
Ofte stillede spørgsmål om Phoenix
Q) Hvad er de arbejdsbelastninger, som Phoenix skal bruges til
Phoenix understøtter de samme use cases som HBase, primært lav-latens, høj samtidig arbejdsbelastning. Phoenix gør det dog nemmere også at udnytte de underliggende data til dashboarding og BI-formål
Sp) Hvad er godkendelsesmekanismen med Phoenix?
Phoenix afhænger af HBase for godkendelse. For CDH-kunder bruger dette HBase ACL'er. For HDP-kunder er dette gennem HBase-Ranger-integration
Q) Hvad er skalerbarheden af Phoenix? Hvad er den største kendte klynge?
Phoenix skalerer til hundredvis af TB data. Den største kunde har over 0,5 PB data, der administreres af Phoenix. Specifikke brugertilfælde kan findes i PhoenixCon-arkiverne og i arkiverne for NoSQL-dagsvideoer tidligere i år i brugernes egne ord og dias.
Sp) Understøtter Phoenix geospatial sekundær indeksering? Hvilket niveau af understøttelse af geografiske data?
Det har begrænset understøttelse af geo-spatiale data. Men GeoMesa leverer et geospatialt lag på HBase, der kan understøtte dette behov og integreret med kundeapplikationer. Phoenix, GeoMesa samt JanusGraph og OpenTSDB kan alle sameksistere i en enkelt HBase-klynge.
Sp) Hvordan opretter og bruger du et indeks?
Se siden Phoenix Secondary Indexing for detaljer om indeksering. Fra Phoenix 4.8.0 og frem kræves ingen konfigurationsændringer for at bruge lokal indeksering.
Sp) Er der en grænse for antallet af kolonner, du kan sætte på indeks?
Ligesom i et RDBMS er et indeks i det væsentlige en separat tabel med indekset og et link til kildedataene. Hvis du indekserer alle kolonner, besejrer du formålet ved at opretholde to identiske tabeller. Indekser bør bruges med omtanke, da der er nogle ikke-trivielle overhead ved skrivning (globale indekser) eller læse (lokale indekser).