Hvordan Amazon ønsker at bygge bro mellem datavidenskabet ved at bringe maskinlæring til skyen

Virksomheder er i stigende grad på udkig efter måder at styrke deres bundlinje ved at udvinde de data, de indsamler.

Men det er vanskeligt for virksomheder at udtrække meningsfuld information, når dataforskere mangler.

Som svar på dette færdighedsunderskud har store skyudbydere oprettet on-demand-tjenester for at give virksomhederne en chance for at komme i gang med maskinlæring.

Maskinlæring er en teknik, der gør det muligt for computere at kigge efter mønstre i data, og som styrker de online anbefalingsmotorer, der foreslår bøger eller film, du måske kan lide. Virksomheder kan bruge maskinlæringsmodeller til at fremsætte nyttige forudsigelser: såsom 'Er dette e-mail-spam?' eller 'Hvor mange varer forventes at sælge i denne region?'

AWSs generaldirektør for datavidenskab Matt Wood Image: Amazon

Amazon, Microsoft og Google leverer on-demand maskinstyringstjenester via deres respektive skyplatforme, hver med forskellige niveauer af tilgængelighed for udviklere uden baggrund i statistikker.

Amazon har brugt maskinuddannelse siden sine tidlige dage som en online-bøger-sælger, da det havde brug for en måde at hjælpe sine menneskelige redaktører med at vælge anbefalinger fra det ene million stærke bibliotek.

"Vi besluttede meget tidligt som en organisation, at maskinlæring ville blive vigtig, efterhånden som vores forretning voksede, " sagde Matt Wood, daglig leder for datavidenskab hos Amazon Web Services (AWS).

"Vi havde en beslutning om at tage. Vil vi gerne gå af og ansætte en hel masse eksperter og specialister i maskinlæring, når disse fyre og piger er meget sjældne? algoritme design. "

I stedet besluttede Amazon at ansætte en relativt lille gruppe af maskinlæringseksperter til at opbygge en intern service, som alle dens udviklere kunne bruge.

"Vi så denne flair af innovation, fordi udviklere ikke behøvede at bruge en hel masse tid på at arbejde på maskinlæring for at kunne bruge dens fordele til at bruge, " sagde han og nævnte tjenestens rolle inden for områder som opfyldelse, kapacitet planlægning, supply chain management og identificering af forfalskede varer.

Den offentlige maskinlæringstjeneste, som AWS tilbyder i dag, er baseret på de samme algoritmer, som virksomheden stiller til rådighed for sit personale internt. Kunder kan opbygge maskinlæringsmodeller ved hjælp af data, der er gemt i Amazons Relational Data Service med en MySQL-backend, S3-objektlageret eller Redshift-datalagringstjenesten for at træne dem.

Disse modeller kan bruges til at fremstille forskellige typer forudsigelser. Binær klassificering bruges til at forudsige et af to mulige resultater - 'Er denne e-mail spam eller ikke?'. Multiklasseklassificering for at forudsige et af tre eller flere mulige resultater og sandsynligheden for hver enkelt - 'Er dette produkt en bog, en film eller en beklædningsgenstand?'. Regression bruges til at forudsige et tal - 'Hvad er temperaturen sandsynligvis i morgen?'.

Tjenesten vil også forsøge at automatisk validere dataene og om muligt omdanne dem til en mere nyttig form, for eksempel udtrække postnummer eller postnummer fra en adresse.

Når modellen er opbygget, kan udviklere få adgang til den via AWS-konsollen eller API-opkald, så forudsigelserne kan fodres til en app eller en onlinetjeneste. Modeller kan finjusteres ved hjælp af skyder i konsollen.

"Udvikleren har brug for at vide meget, meget lidt om maskinlæring. Maskinens indlæring af koteletter administreres af tjenesten, " sagde Wood.

Cloudbaserede tjenester som dette reducerer vanskeligheden ved at eksperimentere med maskinlæring og reducerer den tid og de penge, der er nødvendige for at lære de færdigheder, der kommer i gang, sagde han.

Amazon testede, hvor meget lettere tjenesten gjorde det for udviklere at komme i gang med maskinlæring, og fik to udviklere uden maskinlæringsbaggrund at bygge en model til at forudsige en persons køn fra deres fornavn.

Det tog udviklerne en måned at bygge deres model, som blev trænet ved hjælp af folketællingsdata og forudsagt køn med 92 procents nøjagtighed. I modsætning hertil tog det en udvikler uden viden om maskinlæring 20 minutter at bygge den samme model med den samme forudsigelsesnøjagtighed ved hjælp af Amazons service.

Det er ikke at sige, at disse skytjenester er tilpasset alles behov for maskinlæring.

For det første, mens de muligvis reducerer omkostningerne ved at komme i gang, kan de være dyre at bruge på lang sigt. Amazons service kan koste omkring $ 100 pr. Million forudsigelser.

Som en iværksætter sagde: "Dette ville være rigtig dejligt at bruge ved min opstart, men det er omkostningsbudt selv på et meget stort budget."

Tjenesten har også fremsat kritik for at låse brugere ind, da tjenesten ikke tillader brugere at eksportere og importere modeller.

”Jeg kan ikke se, hvordan noget selskab med en sanselik ville låse deres forudsigelsesmodel ned i AWS, ” som en bruger på udviklerforummet Hacker News sagde.

På trods af denne kritik af den stadig nye service, tror Wood, at det vil føre til mere eksperimentering med maskinlæring hos virksomheder, der tidligere ikke havde vidst, hvor de skal starte.

"Nøglen for mig er produktivitet og at sikre, at udviklere har adgang til disse ting."

© Copyright 2020 | mobilegn.com