sql >> Database teknologi >  >> RDS >> Database

Analyser Big Data med Microsoft Azure Tools

Big Data

Big Data beskriver den store mængde data, enten struktureret eller ustruktureret, der oversvømmer en virksomhed på daglig basis. Big Data behandler måder at analysere, udtrække information fra eller håndtere datasæt, der er for store eller komplekse til at kunne håndteres af normal databehandlingssoftware.

Big data har følgende egenskaber:

  • Lydstyrke: Mængden af ​​genererede og lagrede data
  • Sort: Typen og arten af ​​dataene
  • Hastighed: Den hastighed, hvormed data genereres og behandles
  • Sikkerhed: Datakvalitet og dataværdien

Azures indflydelse på Big Data

Microsoft Azure transformerer data til brugbar indsigt ved at bruge maskinlæringsværktøjer. Det giver dig mulighed for at kombinere alle data i enhver skala og at bygge og implementere maskinlæringsmodeller i skala.

Med følgende Azure-produkter kan avancerede analyser udføres på Big Data:

  • SQL Data Warehouse
  • Data Factory
  • Azure BLOB Storage
  • Azure Databricks
  • Azure Cosmos DB
  • Power BI

Lad os se på hver af dem individuelt.

SQL Data Warehouse

SQL Data Warehouse er et cloud-baseret EDW (Enterprise Data Warehouse), der bruger Massively Parallel Processing (et stort antal processorer, der udfører et sæt beregninger parallelt) til at køre komplekse forespørgsler på tværs af petabytes af data.

Du importerer simpelthen big data til SQL Data Warehouse med PolyBase T-SQL-forespørgsler (forespørgsler, der læser data fra Hadoop), og kør derefter, med kraften i MPP, højtydende analyser. Datavarehuset bliver derefter den enkelte version af sandheden, som du kan regne med for at få indsigt.

Data Factory

Data Factory er en cloud-dataintegrationstjeneste, der sammensætter datalagring, bevægelse og behandlingstjenester til automatiserede datapipelines. Azure Data Factory er en hybrid dataintegrationstjeneste, der giver dig mulighed for at oprette, planlægge og orkestrere ETL/ELT (Extract, Transform, Load) arbejdsgange.

Azure BLOB Storage

Azure BLOB-lagring er et massivt skalerbart objektlager til ustrukturerede dokumenter, billeder, videoer og lyd. Azure BLOB-lagring er optimeret til lagring af enorme mængder af ustrukturerede data (data, der ikke overholder en bestemt datamodel eller definition), såsom tekst eller binære data, for eksempel.

Azure BLOB-lagerplads har følgende funktioner:

  • Visning af dokumenter eller billeder direkte til en browser
  • Lagring af filer til distribueret adgang
  • Streaming af lyd og video
  • Skriv til logfiler
  • Lagring af data til katastrofegendannelse, sikkerhedskopiering og gendannelse og arkivering

Azure Databricks

Azure Databricks er en nem, hurtig og kollaborativ Apache Spark-baseret (open source distribueret generel klyngecomputerramme, som giver en grænseflade til programmering af klynger med implicit dataparallelisme) analyseplatform.

Azure Cosmos DB

Azure Cosmos DB er en globalt distribueret databasetjeneste. Den er designet til at give lav latenstid, elastisk skalerbarhed af gennemløb, veldefineret semantik for datakonsistens og høj tilgængelighed.

Power BI

Power BI er en suite af forretningsanalyseværktøjer, der leverer indsigt. Power BI giver dig mulighed for at oprette forbindelse til snesevis af datakilder, forenkle dataforberedelser, drive ad hoc-analyser samt producere rapporter, der skal forbruges på nettet og på tværs af mobile enheder.

Konklusion

Big Data har udviklet sig og bliver ved med at udvikle sig. Ved hjælp af Azure-værktøjer bliver Big Data mere og mere overskuelige.


  1. PostgreSQL-mod:Hvad er "resjunk"?

  2. oracle blob tekstsøgning

  3. Oracle eksterne tabeller

  4. Enhver måde at vælge uden at forårsage låsning i MySQL?