Domov Posel Google poenostavlja strojno učenje s sql

Google poenostavlja strojno učenje s sql

Kazalo:

Video: Администрирование SQL Server ч.1. Базы данных. (November 2024)

Video: Администрирование SQL Server ч.1. Базы данных. (November 2024)
Anonim

Google je zdaj svojim zmogljivostim Google BigQuery, družbeni ponudbi petabajtov (PB) v oblaku, dodal zmogljivosti strojnega učenja (ML). Zdaj imenovana BigQuery ML, nova različica omogoča uporabo preprostih stavkov strukturiranega poizvedbenega jezika (SQL) za izdelavo in uporabo modelov ML za prediktivno analitiko.

To ni le dobra novica za znanstvenike, ki uporabljajo podatke. Prav tako je dobro za poslovne subjekte, ki so zainteresirani za izboljšanje svojih zmogljivosti za analizo podatkov, saj dodaja še enega učinkovitega tekmeca na precej majhen seznam ponudnikov, ki lahko to stopnjo sofisticiranosti zagotavlja prek oblaka. Druga dva najbolj znana imena sta Amazonova storitev relacijskih podatkovnih baz in Microsoftov Azure SQL, več pa lahko najdete v našem nedavnem okrožnem servisu podatkovnih baz v oblaku.

Vsem prodajalcem in kupcem podatkovnih izdelkov je bila vedno vrzel v spretnostih. To še posebej velja za tiste, ki jih zanimajo ML in napovedna analitika, saj te discipline pogosto zahtevajo znanje novih tehnologij in jezikov za poizvedovanje.

"Za vsakega podatkovnega znanstvenika obstaja na stotine analitikov, ki delajo s podatki in večina uporablja SQL, " je za PCMag povedal Sudhir Hasbe, direktor upravljanja izdelkov v Googlu Cloud. Nekaj ​​bi moralo prinesti, če bi se vojska podatkovnih analitikov odvila od ozkega grla, ki ga je ustvarilo premalo in preveč preobremenjenih podatkovnih znanstvenikov.

Googlov odgovor na to dilemo ni nič posebnega. Medtem ko je ML najbolj vroč trend in se povsod pojavlja v izdelkih vseh vrst, je še vedno trdno ozemlje znanstvenikov. Številni prodajalci so si prizadevali poenostaviti tehnologijo, toda grda resnica je, da jo lahko poenostavite z veliko in je za več kot 99 odstotkov človeške populacije še vedno pretežko. Vendar pa ga moramo znati uporabljati, ker ML lahko naredi več in to hitreje, kot lahko skupina super pametnih ljudi.

Google sadi ML v Google BigQuery, tako da se nahaja bližje podatkom. Aplikacija bo delno prinesla zmogljivosti ML hitreje od tradicionalnih modelov ML, ker se lahko analiza podatkov izvede pri viru. Zdaj v beta različici, BigQuery ML omogoča analitikom (in podatkovnim znanstvenikom) izvajanje prediktivne analitike, kot je napovedovanje prodaje in ustvarjanje segmentov kupcev tik nad podatki, kjer so shranjeni. Samo to je ugledna in pomembna nadgradnja.

Vendar je Google šel dlje od tega, saj je dodal zmogljivost, ki analitikom podatkov omogoča uporabo preprostih stavkov SQL za izdelavo in uporabo modelov ML. Trenutno sta možnosti linearne regresije in logistične regresijske modele za napovedno analizo, saj sta to dva najpogosteje uporabljena modela.

Tu je ilustracija, ki jo je Google predstavil, da bi pokazala, kako bodo analitiki podatkov uporabili to sposobnost:

Google načrtuje, da bo tej zmogljivosti sčasoma dodalo še več možnosti ML, glede na Hasbe. "Od kupcev moramo slišati, katere modele želijo dodati, da bomo najprej zagotovili tiste najbolj uporabne, " je dejal.

Dodatne nadgradnje Google BigQuery

Na vrhu seznama nadgradenj po ML so sposobnost združevanja, BigQuery Geographic Information System (BigQuery GIS), nov podatkovni konektor Google Sheets in nov podatkovni konektor Google Sheets.

Grozd je tudi v beta različici in omogoča ustvarjanje grupiranih tabel v potezi za optimizacijo podatkov, ki združuje vrstice s podobnimi tipkami grozda. To zmanjšuje stroške, saj izboljšuje delovanje in omogoča Googlu BigQuery, da uporabnika zaračuna samo za skenirane podatke, ne pa za celotno tabelo ali particijo.

BigQuery GIS je trenutno v alfa in se uporablja za analizo geoprostorskih podatkov. Medtem ko je skupina Google Cloud sodelovala s programom Google Earth Engine za izdelavo GIS BigQuery, morate v tabelo prinesti svoje geoprostorne podatke. To ni problem v in v več panogah, vključno s povezanimi avtomobilskimi sistemi, internetom stvari (IoT), proizvodnjo, maloprodajo, pametnimi mesti in telematiko. Da ne omenjam vladnih agencij, od Agencije za varstvo okolja (EPA) in Nacionalne geoprostorsko-obveščevalne agencije do Nacionalne uprave za oceano in atmosfero (NOAA) in vse vojaške veje, seveda.

BigQuery GIS uporablja knjižnico S2, ki ima zdaj več kot milijardo uporabnikov prek različnih izdelkov, kot sta Google Earth Engine in Google Maps. Če potrebujete več geoprostorskih podatkov, jih zvezna vlada na GeoPlatformu deli ogromno.

Novi podatkovni konektor Google Sheets bo verjetno navdušil številne analitike podatkov zgolj zato, ker je tako praktičen za vsakodnevno uporabo. Do storitve Google BigQuery lahko dostopate prek programa Google Sheets (preglednica) in uporabite orodja Google Sheets, kot je Explore, ki je kombinirano orodje za sodelovanje, vizualizacijo podatkov in poizvedovanje v naravnem jeziku.

Google BigQuery ima zdaj tudi nov uporabniški vmesnik (UI) v beta različici. Eden bolj zanimivih elementov je funkcija vizualizacije z enim klikom, ki jo podpira Google Data Studio. Vse povedano je odličen krog nadgradenj za že tako elegantno storitev. Te nadgradnje bodo preizkušene v naslednjem krogu pregledov rešitev PCMag Database-as-a-Service (DBaaS), potem ko se napake razrešijo in izdelki presežejo svoj status alfa in beta.

PCMag EIC Dan Costa razpravlja o prihodnosti podatkov:
Google poenostavlja strojno učenje s sql