sql >> Database teknologi >  >> RDS >> Database

ScyllaDB-trends – Sådan implementerer brugere The Real-Time Big Data-database

ScyllaDB er et open source-distribueret NoSQL-datalager, genimplementeret fra den populære Apache Cassandra-database. Scylla, der blev udgivet for bare fire år siden i 2015, har i gennemsnit haft over 220 % år-til-år vækst i popularitet ifølge DB-Engines. Vi har hørt meget om denne stigende database fra DBA-fællesskabet og vores brugere, og besluttede at blive sponsor for dette års Scylla Summit for at lære mere om implementeringstendenserne fra dets brugere. I dette indlæg opdeler vi ScyllaDB-skyen vs. on-premise-implementeringer, de mest populære cloud-udbydere, SQL- og NoSQL-databaser brugt med ScyllaDB, de mest tidskrævende administrationsopgaver, og hvorfor du skal bruge ScyllaDB vs. Cassandra.

  • ScyllaDB vs. Cassandra
  • ScyllaDB Cloud vs. ScyllaDB On-Premises
  • Mest populære cloud-udbydere til ScyllaDB
  • Databaser, der oftest bruges med ScyllaDB
  • Mest tidskrævende ScyllaDB-administrationsopgaver

ScyllaDB vs. Cassandra – Hvilken er bedre?

Vil du vide, hvilken butik med bred spalte du skal bruge til dine implementeringer? Mens Cassandra stadig er den mest populære, vinder ScyllaDB hurtigt frem som den 7. mest populære brede kolonnebutik ifølge DB-Engines. Så hvad er nogle af grundene til, at brugere ville vælge ScyllaDB vs. Cassandra?

ScyllaDB tilbyder væsentligt lavere latenstid, hvilket giver dig mulighed for at behandle en stor mængde data med minimal forsinkelse. Faktisk er deres 99,9 percentil latency ifølge ScyllaDB's performance benchmark rapport op til 11X bedre end Cassandra på AWS EC2 bare metal. Så denne type præstation skal have en pris, ikke? Det gør det, men de hævder i denne rapport, at det er en omkostningsreduktion på 2,5 gange sammenlignet med at køre Cassandra, da de kan opnå denne ydeevne med kun 10 % af noderne.

Der er snesevis af kvalitetsartikler om ScyllaDB vs. Cassandra, så vi stopper kort her, så vi kan komme til det egentlige formål med denne artikel, og opdele ScyllaDB-brugerdataene. .

ScyllaDB Cloud vs. ScyllaDB On-Premises

ScyllaDB kan køres både i den offentlige sky og på stedet. Faktisk er ScyllaDB mest populært implementeret i både offentlige cloud- og on-premise-miljøer inden for en enkelt organisation. De 44 % af ScyllaDB-implementeringer, der udnytter både cloud- og on-premise computing, kunne enten være gennem et hybridt cloudmiljø, der udnytter både til en specifik applikation, eller bruge disse miljøer separat til at administrere forskellige applikationer.

ScyllaDB on-premise-implementeringer og ScyllaDB cloud-implementeringer var døde-selv med 28 % hver. Du kan køre både den gratis open source ScyllaDB og ScyllaDB Enterprise i skyen eller on-premise, og ScyllaDB Enterprise-licensen starter ved $28.8k/år for i alt 48 kerner.

Hvad er den bedste måde at implementere #ScyllaDB på? Cloud vs. On-Premise Klik for at tweete

Mest populære cloud-udbydere til ScyllaDB

Da 28 % af ScyllaDB-klyngen udelukkende er implementeret i skyen, og 72 % bruger skyen i en vis kapacitet, var vi interesserede i at se, hvilke cloud-udbydere der er mest populære til ScyllaDB-arbejdsbelastninger .

#1. AWS

Vi fandt ud af, at 39,1 % af alle ScyllaDB cloud-implementeringer kører på AWS fra vores undersøgelsesdeltagere. Selvom vi forventede, at AWS ville være den #1 cloud-udbyder for ScyllaDB, var procentdelen betydeligt lavere end svarene fra alle cloud-databasetyper i denne undersøgelse, som rapporterede, at 55 % implementerede på AWS. Dette tal er mere i tråd med vores nylige 2019 Open Source-databasetendensrapport, hvor 56,9 % af cloud-implementeringer blev rapporteret at køre på AWS. Dette kan skyldes, at AWS ikke understøtter ScyllaDB gennem deres Relational Database Services (RDS), så vi kunne antage, at efterhånden som flere organisationer fortsætter med at migrere deres data til ScyllaDB, kan AWS opleve et fald i deres kundebase.

#2. Google Cloud

Google Cloud Platform (GCP) var den næstmest populære cloud-udbyder til ScyllaDB og kom ind på 30,4 % af alle cloud-implementeringer. Google Cloud tilbyder deres egen brede kolonnebutik og big data-database kaldet Bigtable, som faktisk er rangeret #111, en under ScyllaDB på #110 på DB-Engines. ScyllaDBs lave omkostninger og høje ydeevne gør det til en attraktiv mulighed for GCP-brugere, især da det er open source sammenlignet med Bigtable, som kun er kommercielt tilgængeligt på GCP.

#3. Azure

Azure fulgte på tredjepladsen og repræsenterede 17,4 % af alle ScyllaDB-implementeringer i skyen fra vores undersøgelsesrespondenter. Azure er en attraktiv cloud-udbyder for organisationer, der udnytter Microsoft-pakken af ​​tjenester.

Hvilken cloud-udbyder er mest populær for #ScyllaDB? AWS vs. Azure vs. GCPklik for at tweete

De resterende 13,0 % af ScyllaDB cloud-implementeringer blev fundet at køre på DigitalOcean, Alibaba og Tencent cloud computing-tjenester.

Deres administrerede tjeneste, Scylla Cloud, er i øjeblikket kun tilgængelig på AWS, og du skal bruge ScyllaDB Enterprise-versionen til at udnytte deres DBaaS. Scylla Cloud planlægger at tilføje understøttelse af GCP og Azure i fremtiden, men med kun 39 % rapportering på AWS kan vi antage, at over 60 % af ScyllaDB-implementeringer bliver selvadministreret i skyen.

Databaser, der oftest bruges med ScyllaDB

Som vi også fandt fra 2019 Open Source Database Report, udnytter organisationer i gennemsnit 3.1 forskellige databasetyper. Men i denne undersøgelse rapporterede organisationer, der bruger ScyllaDB, kun at bruge 2,3 forskellige databasetyper i gennemsnit, en reduktion på 26 % sammenlignet med vores resultater fra alle open source-databasebrugere. Vi fandt også ud af, at 39 % af ScyllaDB-implementeringer kun bruger ScyllaDB og ikke udnytter nogen anden databasetype i deres applikationer.

Så hvilke databaser bruges mest i forbindelse med ScyllaDB? Vi fandt ud af, at ScyllaDB-brugere også bruger SQL-databaser MySQL 20% af tiden og PostgreSQL 20% af tiden også. Den næstmest brugte database med ScyllaDB var Cassandra repræsenteret i 16 % af implementeringerne, og vi kunne antage, at dette er af organisationer, der tester ScyllaDB som et alternativ til Cassandra i deres applikationer, da begge databasetyper er brede kolonnelagre.

MongoDB var den fjerde mest populært udrullede database med ScyllaDB på 12 %. Redis og Elasticsearch var uafgjort på en femteplads, og begge udnyttede 8 % af tiden med ScyllaDB-implementeringer.

Vi fandt også ud af, at 20 % af Scylla-implementeringerne udnytter andre databasetyper, herunder Oracle, Aerospike, Kafka (som nu forvandles til en hændelsesstreamingdatabase), DB2 og Tarantool.

Mest tidskrævende ScyllaDB-administrationsopgaver

Vi ved, at ScyllaDB er meget kraftfuldt, men hvor nemt er det at bruge? Vi spurgte ScyllaDB-brugere, hvad deres mest tidskrævende administrationsopgave var, og hørte fra 28 %, at Scylla Repair var den længste administrationsopgave. Scylla Repair er en synkroniseringsproces, der kører i baggrunden for at sikre, at alle replikaer til sidst indeholder de samme data. Brugere skal køre kommandoen nodetool reparation regelmæssigt, da der ikke er nogen måde at automatisere reparationer i ScyllaDB open source eller ScyllaDB Enterprise versionerne, men du kan konfigurere en reparationsplan gennem Scylla Manager.

ScyllaDB langsom forespørgselsanalyse knyttede ScyllaDB-sikkerhedskopier og gendannelser til andenpladsen på 14 % hver for den mest tidskrævende administrationsopgave. Det ser ikke ud til, at ScyllaDB i øjeblikket har en forespørgselsanalysator tilgængelig til at identificere forespørgsler, der skal optimeres, men brugere kan bruge deres langsom forespørgselslogning til at se, hvilke forespørgsler der har den længste responstid. ScyllaDB-sikkerhedskopier er heller ikke i stand til at automatiseres gennem open source- og virksomhedsversionerne, men de angiver, at tilbagevendende sikkerhedskopier vil være tilgængelige i fremtidige udgaver af Scylla Manager. Der er heller ingen automatiseret måde at gendanne en ScyllaDB backup på, da disse skal udføres manuelt i alle versioner.

10 % af ScyllaDB-brugere rapporterede, at tilføjelse, fjernelse eller udskiftning af noder var den mest tidskrævende opgave, og kom ind på en fjerdeplads. Det er manuelle processer, der kan tage en del tid, især hvis du har at gøre med en stor datastørrelse. Tilføjelse af noder bruges til at udskalere en implementering, mens fjernelse af dem nedskalerer din implementering. Noder skal udskiftes, hvis de er nede eller døde, selvom en klynge stadig kan være tilgængelig, når mere end én node er nede.

Uafgjort på en femteplads med 7 % var opgraderinger og fejlfinding. ScyllaDB Enterprise og open source kræver begge omfattende trin for at opgradere en klynge. De anbefalede metoder er gennem en rullende procedure, så der er ingen nedetid, men dette er en manuel proces, så brugeren skal tage én node ned ad gangen, udføre alle opgraderingstrinene, genstarte og validere noden, før han går videre til at udføre samme trin for de resterende noder i klyngen. Tidskrævende faktisk, men heldigvis ikke en daglig opgave! Fejlfinding er selvfølgelig et dybt kaninhul at dykke ned i, men ScyllaDB Enterprise-kunder modtager 24/7 missionskritisk support, og open source-brugere har adgang til et væld af ressourcer, herunder dokumentation, mailinglister, Scylla University og en slap kanal for brugeren diskussioner.

Hvad er den mest tidskrævende #ScyllaDB-administrationsopgave? Klik for at tweete

De resterende 21 % af de tidskrævende opgaver, der rapporteres af ScyllaDB-brugere, omfatter overvågning, migreringer, klargøring, balancering af shards, komprimering og patching.

Så hvordan sammenligner disse resultater sig med dine ScyllaDB-implementeringer? Leder du efter en måde at automatisere disse tidskrævende administrationsopgaver? Mens vi understøtter MySQL, PostgreSQL, Redis™* og MongoDB® Database i dag, leder vi altid efter feedback om hvilken database der skal tilføjes support til næste gang gennem vores DBaaS-planer. Fortæl os det i kommentarerne eller på Twitter på @scalegridio, hvis du leder efter en nemmere måde at administrere dine ScyllaDB-klynger i skyen eller på stedet!


  1. Postgresql:Sådan finder du filen pg_hba.conf ved hjælp af Mac OS X

  2. Hvad er forskellen mellem VARCHAR og NVARCHAR i SQL server - SQL Server / T-SQL Tutorial Del 32

  3. Sådan installeres og sikres MariaDB på CentOS 7

  4. Databaseskift og failover for Drupal-websteder, der bruger MySQL eller PostgreSQL