Domov Ocene Kako podjetja lahko dobijo smisel na trgu velikih podatkov

Kako podjetja lahko dobijo smisel na trgu velikih podatkov

Video: Kako prijaviti inovacijo na razpis GZS za inovacije 2020? (Oktober 2024)

Video: Kako prijaviti inovacijo na razpis GZS za inovacije 2020? (Oktober 2024)
Anonim

Podjetja ne dobijo točk, kako učinkovito deluje njihova infrastruktura ali kako visoko lahko zberejo vse velike podatke, ki jih zbirajo. Pomembna je kakovost analitike in inteligence, ki jo proizvajajo podatki.

V zadnjih nekaj letih je Hadoop beseda, ki je postala najbolj sinonim za zaužitje, obdelavo in preoblikovanje podatkov. Ta odprtokodni okvir za porazdeljeno shranjevanje in obdelavo podatkov je ustvaril lastni poslovni prostor in integriral svojo pot v vse glavne platforme v oblaku. Hadoop še zdaleč ni edina tehnologija Big Data, o kateri je vredno govoriti, vendar je postala tista, na kateri je zgrajenih še veliko drugih.

Težava za podjetja je, da je prostor Hadoop poln distribucij in orodij, in kot je pojasnil direktor raziskave Gartner Nick Heudecker, so številna od njih videti enako. Heudecker, katerega raziskave zajemajo upravljanje informacij, vključno s prostorom Big Data in NoSQL, je dejal, da če gledate splošne možnosti obdelave podatkov, veliko ponudnikov ponuja zelo podobne funkcije.

Razbijanje trga

Obstajajo trije glavni start-upi Hadoop-a - Cloudera, Hortonworks in MapR - in vsi so v letu 2015 nenehno rasli. Po Gartnerjevih besedah ​​ima vsak približno 700 kupcev, ki jih dajo ali sprejmejo 10 odstotkov, kar globalni trg uvrsti med 2.100-2.400 Hadoop kupcev po vsem svetu. Vsi trije ponujajo brezplačno in poslovno raven svoje distribucije Hadoop, vsak pa prispeva pomembne odprte vire v projekte pod zastavo Apache Software Foundation (ASF).

"Naši podatki kažejo, da je 44 odstotkov uporabe Hadoop trenutno neplačanih, " je dejal Heudecker. "Ali je jasen vodja? Mislim, da ne. Vsi privzemajo tržni delež, ker gre za zelo nov prostor."

V zadnjih nekaj mesecih se je velika konkurenca med tremi zmanjšala na konkurenco zaradi zmogljivosti analitike podatkov in kreativnih načinov vključevanja Apache Spark, odprtokodnega sistema za obdelavo podatkov Big Big z uporabo primerov od sprotnega pretoka podatkov do strojnega učenja. MapR je pred kratkim napovedal MapR Streams kot del "konvergirane podatkovne platforme", ki vključuje Hadoop, Spark obdelavo tokov in analitiko. Hortonworks je predstavil posodobitev platforme Hortonworks Data Platform (HDP) z vgrajeno spominsko analitiko, Cloudera pa ponuja različne odprtokodne integracije Spark prek svoje platforme One Platform, skupaj s ponudbo izobraževalnih tečajev Spark.

"V prostorih za upravljanje informacij in informacijske infrastrukture se veliko dogaja in Hadoop še ni vse, " je pojasnil Heudecker. "Za hitrostjo in pomnilniško usmerjenim modelom za obdelavo podatkov je ogromen zagon, čeprav je Sparkov razvoj še vedno v zgodnji fazi. Spark bo še ena lingua franca pri obdelavi podatkov, podobno kot danes SQL, in vsekakor kaže na znake, da ima nekaj nog saj vse več podjetij vlaga vanj."

Heudecker je izpostavil tudi pomen oblačnih igralcev v Big Data; tehnični velikani, ki so integrirali Hadoop in druge tehnologije velikih podatkov v svoje obstoječe ponudbe infrastrukture (as-a-a-Service) (IaaS).

Amazon Web Services (AWS) uporablja svojo storitev Amazon Elastic MapReduce (EMR) za orkestracijo Hadoop v oblaku. Microsoft ponuja celo vrsto velikih podatkovnih storitev v svoji oblačni platformi Azure, ki sodelujejo s Hortonworksom pri njegovi storitvi HDInsight za upravljanje Apache Hadoop, Spark, HBase in Storm, skupaj s svojimi Azure Data Lake in Azure Data Analytics. IBM ima v ponudbi analitičnega paketa za Hadoop in IBM BigInsights lokalno ponudbo IBM Open Platform, skupaj z upravljanimi Hadoopom in Apache Spark-as-a-service v svojem oblaku Bluemix. Seznam se nadaljuje in podjetja najdejo uporabnejše primere uporabe v oblaku.

"Ocenjujemo, da ima samo AWS približno 5000 kupcev, kar pomeni več kot dvakratno število kupcev v skupni ponudbi, " je dejal Heudecker. "Ena od prednosti selitve v oblak je, da dobite ekosistem. Dostopne distribucije Hadoop lahko dobite v kateri koli ponudbi IaaS. MapR je na voljo v vseh oblakih, ki jih lahko pomislite, razen pri IBM-u; za Cloudera in Hortonworks. Nismo videli, da je razpoložljivost oblakov preveč dejavnik pri izbiri med enim in drugim ponudnikom."

Izbira strategije podatkov podjetja

Tako za mala in srednje velika podjetja (SMB) kot za rastoča podjetja, ko vlagajo v rešitve za obdelavo podatkov in analitiko, je Heudecker dejal, da je odločilni dejavnik, katera platforma lahko zagotovi najvišjo raven storitev. Po Gartnerjevih besedah ​​je največji izziv za podjetja razkorak v znanju - ugotoviti, kdo bo upravljal platformo, ko bo nameščena in nameščena.

"Če podjetja iščejo partnerja na podatkovni platformi, kdo jim bo pomagal pri prenašanju podatkov? Kdo jim bo pomagal sestaviti analitično aplikacijo? Kar se tiče treh čistih igralcev Hadoop-jev, so merila za ocenjevanje običajno okoli zrelost orodij in konzol za upravljanje, orodij za upravljanje podatkov in uspešnosti."

Drugi zanimiv vidik izbire platforme Hadoop je pomanjkanje zvestobe. Podjetja svojo Hadoop platformo revidirajo tako pogosto kot vsakih 6–12 mesecev, da ugotovijo, ali so komponente za obdelavo podatkov še vedno ustrezne, saj se hitro spreminja prostor in kako malo so se veliki igralci razlikovali. Heudecker je dejal, da ima 20 odstotkov podjetij, s katerimi se pogovarja, več Hadoop distribucij, ki delujejo v njihovih podatkovnih centrih ali oblaku, bodisi dajejo različnim skupinam možnost, da izberejo svojo izbrano platformo, ali da se namerno razširijo, da se ne bi zataknili samo z eno Hadoop distribucijo.

Tovrstno raznolikost portfelja platforme vključuje tisto, kar Frank Buytendijk, podpredsednik za raziskave Gartner in ugledni analitik, ki se osredotoča na digitalno strategijo, imenuje "informacije kot prednost". Ker ne morete voditi podjetja brez kapitala, dela, materialov in fizičnih ali virtualnih naprav, je tudi Buytendijk dejal, da podjetja ne morete voditi podjetja brez informacij.

"Na poslovanje smo gledali v smislu treh tokov: primarni tok je bilo blago, sekundarni tok denar, terciarni tok pa je informacija, da smo zagotovili, da sta blago in denar usklajena. Zdaj je v večini podjetij obratno.. Primarni tok so informacije, od identifikacije in konfiguracije do trženja vsebin itd. Ali jih imenujete Big Data ali ne, v resnici ni pomembno."

"Veliki podatki" so zastareli

Buytendjik je dejal, da Big Data ne vidi kot ločeno tehnologijo za podjetja, ampak kot eno temo ali miselnost v vaši celotni digitalni strategiji.

"Ne verjamem v strategijo velikih podatkov, " je dejal Buytendjik. "Brez digitalnih komponent skoraj ni poslovne strategije, zato verjamem v digitalno strategijo, v kateri vse vrste tehnologij zagotavljajo kritične zmogljivosti. Sem spadajo mobilni, socialni, oblačni, IoT, pametni stroji in veliki podatki."

Heudecker verjame, da bomo začeli vse manj govoriti o "velikih podatkih", ker so zdaj le podatki. Tako je posel. Ogromen obseg in velika hitrost podatkov nista več zastrašujoča.

"Podatki in analitika Big Data ponovno zasedajo, " je dejal Heudecker. "Kategorija Big Data se odkrito ne razlikuje. Vedno nas vprašajo velikost trga Big Data, ampak kaj to sploh pomeni? Big Data v resnici ni trg, ampak koncept. Za podjetja, ki razmišljajo o Big Data kot nekaj edinstvenega in posebnega, ki je korenito drugačno od tistega, kar ste storili prej, je napaka. V tem trenutku so podatki čisto običajni."

Kako podjetja lahko dobijo smisel na trgu velikih podatkov