Udnyt Big Data med Google BigQuery

I disse dage har selv de mindste af virksomheder opsamlet terabyte - hvis ikke petabytes - af datalagring. Derudover siges tjenester som YouTube og Twitter at overgå terabytes af data dagligt. Der er ingen tvivl om det; vi er i en alder af "big data". Så spørgsmålet opstår, hvordan skal vi scanne disse enorme bunker af information uden at opleve den ydelsesnedbrydning, der er bemærket med relationelle databaseservere (mest på grund af deres tilbøjelighed til at bevare en relationel struktur, eller opnå det, der kaldes normalisering)?

Principielt involverer de fleste forretningssager, der kræver forespørgsel i store datalagre, en slags følelsesanalyse til markedsføringsformål eller vedrører analyse af data vedrørende tidssensitive / realtidsprocesser, der skal forstås øjeblikkeligt for at maksimere deres værdi eller endda have nogen værdi overhovedet. For dem, der ønsker at udnytte big data, kan det imidlertid være en meget dyre og tidskrævende udgift at indstille en platform til at behandle og analysere data på tværs af serverklynger, mens de kontinuerligt streamer store mængder af forskellige datatyper. Heldigvis, som en del af sin for nylig oplagte Cloud Platform, tilbyder Google BigQuery, en "pay-as-you-use" løsning for dem, der ønsker at få deres fødder våde midt i forespørgsler om komplekse ustrukturerede datasæt - uden besværet med at skulle klare et besværligt distribueret system.

Google BigQuery er i det væsentlige en on-demand storlagrings- og forespørgselsservice. Man kan gemme så mange data, som han / hun føler sig nødvendige, og kun skulle betale for det, han / hun bruger (i det omfang, der er visse opbevaringsgrænser). Desuden kan man skalere hans / hendes data til mængden af ​​hundreder af terabyte med data uden yderligere administrationsbehov. Brugere administrerer deres datalagre via en webbaseret interface eller alternativt via et HTTP REST API eller ved hjælp af kommandolinje. Dette inkluderer kørsel af SQL-lignende forespørgsler, der ikke kun tillader en at forespørge kolonnedatastrukturer, men også deltage i relaterede tabeller, ligesom man kan gøre med en traditionel SQL-databasemotor.

Med hensyn til integration giver BigQuery en nem metode til eksport af data. Mere gradvist kan brugerne dele deres data i Google-regneark eller via Google App Engine-afledte dashboards, alt sammen mens de kontrollerer adgangen via ACL'er. Der leveres flere lag af sikkerhed, som skitseret i BigQuerys servicevilkår, der garanteres "overholder rimelige sikkerhedsstandarder ikke mindre beskyttende end sikkerhedsstandarderne på faciliteter, hvor Google behandler og gemmer sine egne oplysninger" med komplet redundans gennem Googles utallige datacentre . Prisfastsættelse er relativt ligetil, hvor man kun skal være opmærksom på to faktorer, forespørgsel og opbevaring.

Som anført på BigQuery-prissætning-websiden "bruger BigQuery en kolonnedatastruktur, hvilket betyder, at du for en given forespørgsel kun debiteres for data, der behandles i hver kolonne, ikke hele tabellen." Noget at være opmærksom på er, at afgifter afrundes til den nærmeste MB, med mindst 1 MB data behandlet pr. Forespørgsel. For en adgangskonto (ikke-premier) -konto løber lageret i øjeblikket på $ 0, 12 pr. GB for op til 2 TB månedligt. Forespørgsel debiteres baseret på GB-behandling, der koster $ 0, 035 (ja, det er ½ cent) pr. Gigabyte, med en grænse på 20.000 forespørgsler pr. Dag samt en 20 TB behandlede data pr. Daggrænse. Desuden er de første 100 GB data, der behandles pr. Måned, gratis!

BigQuery har flere klientbiblioteker, såsom Python og Java, så udviklere, der er fortrolige med Google App Engine, bør ikke have noget problem med at springe lige ind. Hvis du imidlertid er nybegynder, eller bare skal tilmelde dig tjenesten, kan du henvise til BigQuery Hurtig start guide. Se udviklervejledningen for mere komplekse eller virkelig "store" applikationer.

© Copyright 2020 | mobilegn.com