De top 10 big data-rammer, der bruges i virksomheden

Hvordan big data kan hjælpe din virksomhed med at blomstre Michael Hiskey, CMO for Semarchy, forklarer, hvorfor big data-æraen åbner nye og dybe muligheder for SMB'er og startups.

Mere om Big Data

  • Datastyring: Et snyderi
  • Sådan integreres robotprocesautomatisering i big data-projekter
  • Programmerer Hadley Wickham præsenterer mangfoldigheden i R-samfundet
  • Sådan vælges de rigtige dataanalyseværktøjer: 5 trin

Big data fortsætter sin hurtige vækst i virksomheden på tværs af alle brancher, ifølge en tirsdagrapport fra Qubole og Dimensional Research. Organisationer bruger big data til at drive it-projekter, forbedre salget og forbedre kundeservicen. Og de tapper i stigende grad big data-rammer for at tackle udfordringen ved at høste den fulde værdi af de oplysninger, der er samlet i deres forretning.

Ingen enkelt softwareramme dominerer big data-landskabet, viser rapporten efter undersøgelse af 401 datafagfolk med big data-ansvar i store virksomheder. Imidlertid bruger 25% af organisationerne hjemmearbejde fremgangsmåder til behandling af big data.

Ingen rammer er allestedsnærværende, men der er et par standouts. Her er de top 10 big data-rammer, ifølge rapporten:

  1. Gnist (31%)
  2. Hive (17%)
  3. HBase (17%)
  4. MapReduce (15%)
  5. Presto (13%)
  6. Kafka (13%)
  7. Impala (11%)
  8. Storm (11%)
  9. Flink (9%)
  10. Gris (6%)

Mens mange af disse tal er i samme interval, bemærkede rapporten også, at nogle steg i brug i løbet af 2017, mens andre faldt. Spark, HBase, Presto, Kafka, Impala, Flink og homegrown tiltag steg alle i popularitet i 2018, mens Hive, MapReduce, Storm og Pig alle faldt i brug.

Virksomheder prioriterer muligvis big data-initiativer, men talentmangel er stadig et stort problem, konstaterede rapporten. Tre fjerdedele (75%) af de adspurgte sagde, at de var udsat for en mangel på medarbejderne, ingeniører, videnskabsmænd og operatører, der kan levere big data-værdi. Mens 79% af virksomhederne sagde, at de ønsker at øge deres datateams antal i det næste år, sagde 83%, at det er meget vanskeligt at finde datapersonale med de nødvendige færdigheder og erfaringer.

Organisationer oplever adskillige andre udfordringer, når det kommer til big data, fandt rapporten. De mest almindelige road data-blokeringer blev navngivet en mangel på erfaring, der bremser fremskridt (44%), ved at følge med nye datakilder (42%), konstant udviklende brugssager (41%), for mange manuelle opgaver (38%) og datamængden (34%).

Efterhånden som flere virksomheder ser ud til at implementere maskinuddannelsesprogrammer i en lang række anvendelsessager, bliver stærk big data-praksis væsentlig, bemærkes rapporten. De vigtigste prioriteter for maskinlæringsinitiativer i det næste år inkluderer forbedring af datasikkerhed og trusselsbeskyttelse, optimering af kundeoplevelsen og udnyttelse af forudsigelig vedligeholdelse, ifølge rapporten.

De store takeaways for tech-ledere:

  • Spark, Hive og HBase er de mest populære big data-software-rammer, der bruges i virksomheden. - Qubole, 2018
  • 75% af datapersonerne sagde, at de havde en mangel på medarbejdere hos ingeniører, videnskabsmænd og operatører, der kan levere big data-værdi. - Qubole, 2018

Data, Analytics og AI-nyhedsbrev

Få eksperttips til at mestre de grundlæggende elementer i big data-analyse, og følg med den seneste udvikling inden for kunstig intelligens. Leveres mandage

Tilmeld dig i dag

© Copyright 2020 | mobilegn.com