Коришћење Фирехосе: Добивање пословне вредности од Стреаминг Аналитицс: Транскрипт вебинара

Аутор: Louise Ward
Датум Стварања: 5 Фебруар 2021
Ажурирати Датум: 17 Може 2024
Anonim
Коришћење Фирехосе: Добивање пословне вредности од Стреаминг Аналитицс: Транскрипт вебинара - Технологија
Коришћење Фирехосе: Добивање пословне вредности од Стреаминг Аналитицс: Транскрипт вебинара - Технологија

Одузети: Домаћин Ребецца Јозвиак разговара о аналитичким струјама с врхунским стручњацима у индустрији.




Тренутно нисте пријављени. Пријавите се или пријавите да бисте видели видео.

Ребецца Јозвиак: Даме и господо, здраво и добродошли у Хот Тецхнологиес 2016! Данашњи наслов је „Коришћење кријесница: Добивање пословне вредности од Стреаминг Аналитицс“. Ово је Ребецца Јозвиак. Ја сам други за команданта домаћина веб емисије кад год наш драги Ериц Каванагх не може бити овдје, тако да је лијепо видјети толико вас данас вани.

Ова епизода се мало разликује од осталих. Некако смо разговарали о ономе што је вруће и наравно ове године је вруће. Последњих неколико година је било вруће. Увек се појављују нове ствари. Данас говоримо о аналитичкој струји. Стреаминг аналитика је некако нова. Наравно стриминг, централни подаци, РФИД подаци, они нису нужно нови. Али, у складу са архитектуром података, ми смо деценијама били толико фокусирани на податке у мировању. Базе података, систем датотека, складишта података - све у највећој мери ради групне обраде. Али сада са помаком у стварању вредности од преноса података, емоција података, неки то називају живим токовима, заиста им је потребна архитектура заснована на струји, а не подаци у мировању архитектуре на које смо навикли и за које треба бити способна руковање брзим ингестијом, у стварном времену или близу обраде у стварном времену. Мора бити у стању да користи не само Интернет ствари, већ и Интернет свега.


Наравно, у идеалном случају било би лепо да две архитектуре живе једна поред друге, једна рука пере другу, да тако кажем. Иако подаци који трају данима, недељама, година стари подаци још увек имају вредност, историјску аналитику, анализу трендова, то су живи подаци који покрећу интелигенцију уживо ових дана и зато је стреаминг аналитике постао толико важан.

Данас причам о томе више. Имамо научника за податке, Дез Бланцхфиелд, који долази из Аустралије. За њега је рано јутро. Имамо нашег главног аналитичара, др Робина Блоор-а. Придружио нам се Ананд Венугопал, шеф производа за СтреамАналитик у Импетус Тецхнологиес. Они су заиста фокусирани на аспект аналитике у току овог простора.

Са тим ћу ићи даље и проследити га Дезу.

Дез Бланцхфиелд: Хвала вам. Морам да узмем контролу над екраном и искочим напред.

Ребецца Јозвиак: Изволи.

Дез Бланцхфиелд: Док ми хватамо слајдове горе, допустите ми да само покренем основну тему.


Подржаћу га на високом нивоу и задржаћу га на отприлике 10 минута. Ово је врло велика тема. Учествовао сам у догађају у коме смо провели два до три дана дубински улазећи у детаље шта је процесирање токова и тренутни оквири које развијамо и шта би требало да значи радити аналитику у тим великим количинама.

Само ћемо разјаснити шта мислимо помоћу струје аналитике, а затим ћемо истражити да ли се пословна вредност може извући, јер то је оно што предузећа траже. Они желе да им људи објасне веома брзо и сажето, одакле могу да добијем вредност применом неког облика аналитике на наше податке о стриму?

Шта је ток аналитике?

Стреаминг аналитика пружа организацијама начин да извуку вредност из података великих и великих брзина које долазе кроз посао у различитим облицима у покрету. Битна разлика овде је у томе што смо имали дугу историју развијања аналитике и сочива и погледа на податке које смо деценијама обрађивали у мировању откад је осмишљен маинфраме. Огромна промена парадигме коју смо видели у последње три до пет година, на ономе што називамо „веб локација“, упада у токове података који нам долазе у реалном времену или близу реалног времена, а не само обрађује и тражи корелацију догађаја или покретачи догађаја, али вршећи заиста детаљну, детаљну анализу на тим токовима. То је значајан помак према ономе што смо радили прије тога било прикупљање података, стављање у некакво спремиште, сада већ традиционално велике базе података, велики оквири великих података као што је Хадооп платформа и обављање батцх начина обраде на томе и добијање нека врста увида.

Били смо веома добри у томе врло брзо и испробавали пуно тешког гвожђа на тим стварима, али ми и даље стварно снимамо податке, чувамо их, а затим гледамо и добијамо неке врсте увида или аналитике о томе. Прелазак на обављање те аналитике током преношења података био је сасвим ново и узбудљиво подручје раста за врсте ствари које се догађају око великих података. Потребан је потпуно другачији приступ само прикупљању, складиштењу и обради и извођењу аналитике.

Један од кључних покретача за помак и фокусирање на обављање аналитичких података у току је то што можете добити значајну пословну вредност тако што ћете те увиде добити брже и спремније како подаци стижу до вас, јер се информације стављају на располагање предузећу. Идеја да се сада ради на крају дана више није релевантна у одређеним индустријама. Желимо да можемо да радимо аналитику у лету. На крају дана, већ знамо шта се догодило као што се десило, а не да дођемо до краја дана и радимо 24-часовни групни посао и добијемо те увиде.

Стреаминг аналитика је управо упадање у тај ток, док су токови података обично вишеструки токови веома великих количина података и података који нам долазе у покрету врло, веома брзо и добијају увиде или аналитику о тим токовима док нам долазе насупрот. до омогућавања да то изађе у мировању и обављања аналитике на њима.

Као што сам напоменуо, имали смо деценијама и деценијама да радимо оно што ја зовем серијска анализа. Ставио сам овде стварно супер слику. Ово је слика господина који стоји испред ругавог рачунара који је креирала компанија РАНД Цорпоратион пре читавог живота и тако су изгледали као рачунар у кући. Оно што је занимљиво је да су чак и тада имали овај концепт свих тих малих бројева, а ти бирања су представљала информације које долазе из куће и обрађују се у реалном времену и говоре вам шта се догађа. Једноставан пример је скуп барометријског притиска и температуре који можемо видети где гледамо шта се дешава у стварном времену. Али замишљам то још тада, када је РАНД Цорпоратион саставила тај мали модел, заправо су већ размишљали о обради података и извршавању аналитике на њему као што долази у формату тока. Нисам баш сигуран зашто су ставили волан на рачунар, али то је прилично у реду.

Од проналаска грешке, имали смо поглед на снимање података и анализу скупа на њима. Као што рекох сада са великим помаком и то смо видели по вољи играча на веб скали који сви знамо, сви су они брендови домаћинстава, као и ЛинкедИн, да интерактивно понашање које имамо са тим друштвеним платформама захтева не само снимање, складиштење и обрада у батцх режиму, већ заправо снимање и покретање аналитике у лету из токова података који пролазе. Кад нешто кликнем, не само да их морају касније снимити и похранити, али морају и да га могу одмах вратити на мој ток и делити са другим људима који ме прате. То је модел серијске обраде.

Зашто бисмо се спустили овом рутом? Зашто би организације улагале вријеме, труд и новац чак и размишљајући о изазовима улагању на пут аналитике струјања? Организације имају ову огромну жељу да остваре повећање перформанси над својим конкурентима у индустријама у којима се налазе и да се добитак перформанси може брзо имплементирати једноставном аналитиком струјања и то може почети једноставним праћењем података у стварном времену које смо већ упознат са. Имам малу слику екрана Гоогле Аналитицс-а. Ово је вероватно један од првих случајева када смо заиста добили аналитику на нивоу потрошача. Тако да су људи посећивали вашу веб локацију и добијали бројање хит резултата, са ситним комадом ЈаваСцрипта на дну ваше веб странице у ХТМЛ-у уграђеном у вашу веб локацију, ови мали кодови су се у стварном времену враћали Гооглеу и били су вршење аналитике на оним токовима података који стижу са сваке странице на вашој веб локацији, сваког предмета на вашој веб локацији у стварном времену и враћају вам их на овој заиста слаткој малој веб страници на контролној табли графикона у стварном времену, слатким малим хистограмима и линијом граф који приказује Кс број људи који су историјски погодили вашу страницу, али ево колико их је тренутно тренутно.

Као што видите на снимку, тренутно пише 25. То је 25 људи управо у време снимања екрана, било је на тој страници. То је прва стварна шанса коју смо одиграли на алату за анализу потрошача. Мислим да је пуно људи то стварно схватило. Они су само разумели моћ сазнања шта се догађа и како могу да одговоре на то. Када помислимо на размере авионике, авиони који лете унаоколо, има само 18.700 домаћих летова дневно само у САД-у. Прочитао сам рад пре неког времена - било је то пре отприлике шест или седам година - да је количина података које су произвели ти авиони била око 200 до 300 мегабајта по старом инжењерском моделу. У данашњем дизајну авиона, ове летелице производе око 500 гигабајта података или око пола терабајта података по лету.

Када врло брзо направите математику са врха главе, 18.700 домаћих летова свака 24 сата у ваздушном простору САД-а, ако све модерне летелице производе око пола терабајта, то је 43 до 44 петабајта података који пролазе и дешава се док су авиони у ваздуху. То се дешава када слете и раде депоније. Тада иду у продавницу и одлазе од стране инжењерских тимова са целим подацима како би погледали шта се догађа у лежајевима, точковима и унутар мотора. Неки од тих података морају се обрадити у реалном времену како би се могли доносити одлуке о стварним проблемима док је авион био у ваздуху или док је на земљи. Једноставно не можете то радити у пакетном режиму. У другим индустријама које видимо негде око финансија, здравства, производње и инжењерства, они такође гледају како могу да добију овај нови увид у оно што се догађа у стварном времену, за разлику од онога што се само складишти у базама података на термин.

Ту је и овај концепт бављења подацима као што називам покварљивим добрима или брзо покварљивом робом - да много података временом губи на вредности. То се све чешће догађа са апликацијама за мобилност и алатима за друштвене мреже јер оно што људи желе рећи и шта је сада у тренду је оно на шта желите да одговорите. Када размишљате о осталим деловима нашег живота са логистиком и испоруком хране около, ми разумемо концепт покварљиве робе у том смислу. Али размислите о подацима који пролазе кроз вашу организацију и вредности коју има. Ако неко тренутно обавља неке послове с вама и можете комуницирати с њима у стварном времену, не желите да сачекате сат времена како би се подаци могли снимити и ставити у систем као што је Хадооп, а затим притисните ово дугме, нећете моћи да се носите с тим тренутно и желите да то буде могуће на захтев клијента одмах. Сада ће се појавити израз који ће се појавити у којем ће људи разговарати о томе да имате у реалном времену ток података који вам може дати персонализацију и да се персонализација подешава у систему који користите према вашем личном искуству. На пример, када погодите алат као што је Гоогле Сеарцх тоол, ако ја упитам, а ви учините исти упит, увек не добијамо исте податке. Ми добијамо у основи оно што ја називам искуством славних. Лече ме једнократно. Ја добијам своју личну верзију онога што се дешава у овим системима на основу профила и података које су прикупили на мени, а ја сам могао да радим аналитику у реалном времену у току.

Ова идеја да су подаци покварљива роба за сада је стварна ствар, а вредност података која се временом смањује је нешто са чиме се данас морамо бавити. То није ствар јуче. Обожавам ову слику медведа који зграби лососа који скаче из реке, јер заиста слика управо оно што видим у аналитичкој струји. Ово је огромна река података који нам стижу, ако хоћете, а медвед сједи усред потока. Извршиће аналитику у стварном времену на ономе што се догађа око ње тако да заправо може да произведе своју способност хватања те рибе у ваздуху. Није баш да уроните у ток и зграбите га. Ова ствар скаче у ваздух и мора бити на правом месту у право време да би уловила ту рибу. Иначе, не доручкује или руча.

Организација жели да учини исто са својим подацима. Они желе да извуку вредност из садашњих огромних количина података у покрету. Они желе да изврше аналитику на тим подацима и подацима велике брзине, тако да то није само количина података која нам долази, већ брзина којом они долазе од њих. На пример, у безбедности су сви ваши рутери, прекидачи, сервери, заштитни зидови и сви догађаји који долазе са тих и десетине хиљада ако не и стотине хиљада уређаја, у неким случајевима подаци који су брзо покварљиви. Када размислимо о Интернету ствари и индустријском Интернету, говоримо о милионима ако не и милијардама сензора, а како подаци долазе путем којих се врши аналитика, ми сада гледамо на сложену обраду догађаја наређењем величине и брзине какве никада раније нисмо ни видели и са чиме ћемо се данас бавити. Морамо да направимо алате и системе око тога. То је прави изазов за организације, јер с једне стране, имамо веома велике брендове који раде ДИИ, испеку их сами, када имају капацитет за то и вештине и инжењеринг. Али за просечну организацију то није случај. Немају сет вештина Они немају ни капацитета ни времена, чак ни новца да уложе у то. Сви циљају на овај концепт доношења одлука у стварном времену.

Употријебите случајеве на које сам наишао и они су у сваком широком спектру сваког сектора који можете замислити, људи сједе и обраћају пажњу и говоре: како да примијенимо неке аналитичке податке на наше токове података? Говоримо о мрежним сервисима на мрежи. Постоје традиционалне платформе за друштвене мреже и мрежне е-поруке и малопродаја, на пример, апликације. Сви нам покушавају пружити ово славно искуство у стварном времену. Али када се упуштамо у више услуга технолошког скупа, телефонских услуга, гласа и видеа, видим људе како шетају радећи ФацеТиме на телефонима. Само експлодира. Смета ми што људи држе телефон испред себе и разговарају са видео стреамом пријатеља, за разлику од тога да га више држе за ухо. Али они знају да то могу и прилагодили су се и свидело им се то искуство. Развој ових апликација и платформа које их испоручују треба да извршавају аналитику у стварном времену на том саобраћају и на профилима саобраћаја, како би могли да извршавају једноставне ствари попут савршеног усмеравања видео снимка тако да квалитет гласа у видео који сте добили је адекватан за добро искуство. Не можете групно обрађивати такве податке. То не би учинило видео стреам у реалном времену функционалном услугом.

Изазов управљања је у финансијским трансакцијама. Није у реду доћи до краја дана и сазнати да сте прекршили закон премештајући приватне податке по том месту. У Аустралији имамо веома интересантан изазов где је премештање података везаних за приватност ван мора једноставно не. Не можете преузети мој ПИД, моје приватне личне податке у иностранство. У Аустралији постоје закони који спречавају да се то догађа. Даваоци финансијских услуга, посебно државне службе и агенције, морају да раде аналитику у стварном времену са својим токовима података и упутствима како би били сигурни да оно што ми пружају не напушта обале. Све ствари морају остати локално. Морају то да раде у реалном времену. Не могу прекршити закон и касније тражити опрост. Откривање преваре - прилично је очигледно оно што чујемо код трансакција кредитним картицама. Али како се врсте трансакција које обављамо у финансијским услугама мењају веома, врло брзо, постоје разне ствари које ПаиПал сада прво ради на откривању преваре у реалном времену где се новац не креће од једне до друге ствари, али јесте финансијска трансакција између система. Платформе за лицитирање на Ебаиу, откривање преваре мора да се врши у реалном времену у канцеларији за стриминг.

Сада се креће тренд извођења активности вађења и трансформације оптерећења у потоцима, тако да не желимо да снимимо ништа што иде у ток. Не можемо то стварно учинити. Људи су научили да подаци воле да се брзо руше ако снимимо све. Трик је сада у томе да извршите аналитику на тим токовима и направите ЕТЛ на њој и само снимите оно што вам треба, потенцијално метаподате податке, а затим возите предиктивну аналитику тамо где ми заправо можемо рећи шта ће се догодити мало даље низ стазе о ономе што ми Управо сам видео у току на основу аналитике коју смо извршили на основу тога.

Добављачи енергије и комуналија доживљавају ову огромну жељу потрошача да цене цене потражње. Могао бих да одлучим да желим да купим зелену струју у одређено доба дана јер сам само код куће и не користим пуно уређаја. Али ако имам вечеру, можда бих желео да сви моји уређаји буду укључени и не желим да купујем јефтину струју и чекам да је испоруче, али вољан бих да платим више трошкова да бих је добио. Ова цена тражења, посебно у комуналном и енергетском простору, већ се догодила. Убер је, на пример, класичан пример ствари које можете радити свакодневно и све је вођен ценама потражње. Постоје неки класични примери како људи у Аустралији узимају цене 10.000 долара због велике потражње у новогодишњој ноћи. Сигуран сам да су се бавили тим проблемом, али струјна аналитика се врши у стварном времену док у аутомобилу говоре колико бих требао да платим.

Интернет ствари и сензорски токови - само смо огребали по површини и стварно смо се само разговарали о томе, али видећемо занимљив помак у томе како се технологија бави тиме, јер када говорите не отприлике хиљаде или десетине хиљада, али стотине хиљада и потенцијално милијарде уређаја који долазе на вас, скоро ниједан технолошки низ који сада имамо није дизајниран да се носи са тим.

Постоје неке заиста вруће теме које ћемо видети свуда око нас, као што су безбедност и цибер ризик. Они су за нас врло стварни изазови. На интернету постоји заиста уредан алат назван Сјевер, гдје можете сједити и гледати на веб страници разне цибератне нападе у стварном времену. Када га погледате, мислите да је „ох то симпатична мала веб страница“, али након отприлике пет минута унутра, схватили сте количину података које систем врши аналитиком на свим различитим токовима свих различитих уређаја широм света. која се у њих храни. Почиње да вам замагљује ум како они то заиста раде на ивици снимка и пружа вам једноставан мали екран који вам говори шта или нешто друго нападате у стварном времену и које врсте напада. Али то је заиста уредан мали начин да само стекнете добар укус онога што аналитика струје потенцијално може учинити за вас у стварном времену тако што ћете само гледати ову страницу и схватити само количину и изазов преузимања струјања, обраде аналитичких упита о њих и представљајући то у реалном времену.

Мислим да ће разговор који имам током остатка сеансе бавити свим тим стварима са једним занимљивим погледом, са мог угла, и то је изазов ДИИ-а, испекујте га сами, одговара неком од класични једнорози који су у стању да себи приуште да граде такве врсте ствари. Имају милијарде долара за изградњу ових инжењерских тимова и за изградњу њихових податковних центара. Али за 99,9% тамошњих организација које желе да повећају вредност у свом послу аналитике струјања, треба да добију неовисну услугу. Они морају да купе производ ван кутије и обично им је потребна нека консултантска услуга и професионална услуга која ће им помоћи да га спроведу и ту вредност добију назад у послу и продају га као пословно решење.

С тим се враћам, Ребека, јер верујем да ћемо о томе сада детаљно говорити.

Ребецца Јозвиак: Одлично. Хвала вам пуно, Дез. То је сјајна презентација.

Сада ћу проследити лопту Робину. Однеси то.

Робин Блоор: У реду. Пошто је Дез упао у гнојну мрљу токова обраде, изгледало ми је да нема смисла поново то покривати. Само ћу заузети потпуно стратешки став.Гледајући готово с врло високог нивоа на оно што се дођавола догађа и позиционирати га јер мислим да би то могло помоћи људима, посебно нама људима који раније нису утаборени у токове који обрађују на великој дубини.

Обрада токова је већ дуго присутна. Некада смо га звали ЦЕП. Пре тога је постојао систем у реалном времену. Оригинални системи за контролу процеса заправо су обрађивали токове информација - наравно да ништа није ишло тако далеко као данас. Ова графика коју видите на дијапозитиву овде; заправо указује на много ствари, али указује изнад и изван свега осталог - чињеница да овде постоји спектар кашњења која се појављују у различитим бојама. Оно што се заправо догодило од проналаска рачунара или комерцијалног рачунања који је стигао тачно око 1960. године јесте да је све текло све брже и брже. Некада смо могли да зависимо од начина на који ће то заиста изаћи ако желите у таласима, јер то тако изгледа. То заправо зависи од тога. Будући да је све управљало Мооресовим законом и Мооресов закон би нам дао фактор од око десет пута брже у периоду од око шест година. Онда, кад смо заправо стигли до 2013. године, све се покварило и одједном смо почели убрзавати брзином којом никад нисмо, што је необично без преседана. Добијали смо фактор од око десет у смислу повећања брзине, а самим тим и смањења кашњења отприлике сваких шест година. У шест година од отприлике 2010, добили смо више од најмање хиљаду. Три величине више него један.

То се догађа и зато се чини да се индустрија на овај или онај начин креће фантастичном брзином - јер јесте. Управо пролазећи кроз значење ове конкретне графике, времена одзива заправо су она у алгоритамској скали низ вертикалну осовину. Реално време је брзина рачунара, бржа од људских бића. Интерактивна времена су наранџаста. Када комуницирате са рачунаром, тамо желите да задржите десетину до отприлике једну секунду кашњења. Изнад, постоји трансакција у којој ми заправо размишљамо о ономе што радите у рачунару, али ако то испадне за око петнаест секунди, постаје неподношљиво. Људи заправо само не би чекали рачунар. Све је урађено у шаржи. Много ствари које су урађене у пакету сада се спуштају право у трансакциони простор, право у интерактивни простор или чак у простор у стварном времену. Док смо претходно, талас са врло малим количинама података могли нешто да урадимо од овога, сада можемо да урадимо и са веома великим количинама података користећи изузетно умањено окружење.

У основи, све ово говори да су заиста времена трансакције и интерактивне људске реакције. Страшно пуно онога што се тренутно ради са струјањима је информисање људи о стварима. Неке од њих иде брже од тога и добро обавештавају ствари тако да је у стварном времену. Тада узимамо дозволу да само паднемо попут камена, чинећи тренутну анализу изводљивом и случајно сасвим приступачном. Није се само смањила брзина, већ се и врх срушио. Вероватно највећи утицај на све ове међу свим разним апликацијама, можете урадити све ове предиктивне анализе. Рећи ћу ти зашто за минут.

Ово је само продавница хардвера. Имате паралелни софтвер. Говоримо о 2004. години. Архитектура скалирања, мултицоре чипови, повећање меморије, подесив ЦПУ. ССД дискови сада иду много брже од окретања диска. Можете прилично да се поздравите са диском који се окреће. ССД дискови се такође налазе у више језгара, тако да су опет бржи и бржи. Ускоро да се појави, добили смо меморзор од ХП-а. Добили смо 3Д КСПоинт од компаније Интел и Мицрон. Обећање оних је да ће ионако све ићи брже и брже. Када заправо размишљате о две нове меморијске технологије, које ће обе учинити целог основног малог дела, појединачна штампана плоча иде брже, још увек нисмо видели крај томе.

Стреамс технологија која је следећа заиста је ту да остане. Мораће да постоји нова архитектура. Мислим, Дез је то већ споменуо у неколико тачака у свом излагању. Десетљећима смо архитектуру доживљавали као комбинацију скупова података и цијеви података. Тежили смо да обрађујемо хрпе и тежили смо да податке преносимо између група. Сада се темељно крећемо ка ономе што називамо Ламбда архитектура података која комбинује обраду протока података са групама података. Када заправо обрађујете ток догађаја који долазе против историјских података као проток података или гомила података, то мислим на Ламбда архитектуру. Ово је у повојима. То је само део слике. Ако сматрате нешто сложеним попут Интернета свега што је Дез такође споменуо, заправо ћете схватити да постоје различите врсте проблема са подацима о локацији - одлуке о томе шта бисте требали да обрадите у стриму.

Оно што овде стварно кажем је да смо, када смо обрађивали у пакету, заправо обрађивали токове. Једноставно не бисмо могли једно по једно. Само чекамо док се не нађе велика хрпа ствари и онда све обрадимо одједном. Прелазимо у ситуацију у којој заправо можемо да обрађујемо ствари у току. Ако можемо да обрадимо ствари у току, тада ће копије података које држимо бити статични подаци које требамо навести да бисмо обрадили податке у току.

Ово нас води до ове посебне ствари. То сам већ поменуо у неком излагању са биолошком аналогијом. Начин на који бих волео да размишљате је у овом тренутку када смо људи. Имамо три различите мреже за предиктивну обраду у реалном времену. Називају их соматским, аутономним и ентеричким. Ентеријер вам је желудац. Аутономни нервни систем брине за борбу и за летове. Заправо брине о брзим реакцијама на околину. Соматичка која пази на померање тела. То су системи у реалном времену. Занимљивост у вези тога - или мислим да је некако занимљива - јесте да је много тога предиктивније него што бисте икада замислили. Као да стварно гледате екран на око 18 центиметара од вашег лица. Све што јасно можете видети, све што ваше тело може јасно видети је заправо у правоугаонику величине 8 × 10. Све што је изван тога заправо је замагљено што се тиче вашег тела, али ваш ум заправо попуњава празнине и чини да не буде мутно. Уопште не видите замућење. То јасно видите. Ваш ум заправо ради предиктивну методу протока података да бисте видели ту јасноћу. То је нешто занимљиво, али заправо можете сагледати начин на који функционише нервни систем и начин на који успевамо да се снађемо и понашамо се разумно - барем неки од нас - разумно здраво и не налетимо на ствари стално.

Све је то учињено низом скала неуронске анализе овде. Оно што ће се догодити је да ће организације имати исту врсту ствари и да ће изградити исту врсту ствари, а то ће бити обрада токова, укључујући унутрашње токове организације - ствари које се дешавају унутар оно, ствари које се дешавају изван њега, тренутни одговори који заправо морају бити донети, наравно, хране човека да доноси одлуке, да би се све то догодило. Тамо идемо, колико видим.

Једна од ствари која је последица тога је да ниво апликације за стриминг иде добро. Биће много више него што то сада видимо. Управо сада убиремо плодове од вешања да радимо ствари које су очигледне.

Дакле, свеједно је овде закључак. Стреаминг аналитика некада је ниша, али постаје главна и ускоро ће бити усвојена.

С тим путем, вратит ћу га Ребеки.

Ребецца Јозвиак: Хвала ти пуно, Робин. Одлична презентација, као и обично.

Ананд, ти си следећи. Спрат је твој.

Ананд Венугопал: Фантастичан. Хвала вам.

Моје име је Ананд Венугопал и руководила сам производу за СтреамАналитик. То је производ који нуди Импетус Тецхнологиес, ​​из Лос Гатоса у Калифорнији.

Импетус је заправо имао сјајну историју у томе што је био добављач великих података за велика предузећа. Дакле, направили смо бројне примене аналитике у току као сервисна компанија и научили смо много лекција. Такође смо прешли у компанију која се бави производима и предузеће које се заснива на решењима у последњих неколико година, а аналитика струјања прелази на терет трансформације Импетуса у компанију која је у великој мери производ. Постоје неке критичне, врло, врло кључне имовине које је Импетус очистио захваљујући излагању нашим предузећима, а СтреамАналитик је једно од њих.

У послу смо 20 година и постоји сјајна комбинација производа и услуга што нам чини велику предност. А СтреамАналитик је рођен из свих научених лекција из наших првих пет или шест имплементација стриминга.

Дотакнут ћу се неколико ствари, али аналитичари, Дез и Робин, урадили су фантастичан посао у покривању простора у цјелини, тако да ћу прескочити пуно садржаја који се преклапа. Ја ћу вероватно ићи брзо. Поред истинских случајева стреаминга видимо и мноштво правих акцелерација серије код којих у предузећима постоје буквално веома, врло важни батцх процеси. Као што видите, цео овај циклус осећања неког догађаја и његове анализе и деловања на њему могао би потрајати недељама у великим предузећима и сви они га покушавају смањити на неколико минута, а понекад и секунди и милисекунди. Дакле, ишта брже од свих ових процеса су кандидати за аквизицију пословања и то је врло добро што се вредност података драматично смањује с годинама, тако да је већа вредност у почетном делу у секунди у којој се то управо догодило. У идеалном случају, ако можете предвидјети шта ће се догодити, то је највећа вриједност. То ипак зависи од тачности. Следећа највећа вредност је кад се она тамо налази, кад се дешава, можете је анализирати и одговорити. Наравно, вредност се драматично смањује након тога, главног рестриктивног БИ-а у којем се налазимо.

То је занимљиво. Можете очекивати драматично научни одговор на питање зашто струји аналитику. Са многим случајевима оно што видимо је то зато што је то сада могуће и зато што сви знају да је серија стара, серија је досадна, а серија није цоол. Сви имају довољно образовања о чињеници да је могуће струјање и сви имају Хадооп сада. Сада Хадооп дистрибуције имају уграђену технологију за стриминг, било да је у питању Олуја или Спарк стреаминг и наравно редови, попут Кафке итд.

Предузећа која видимо скачу у то и почињу експериментирати са овим случајевима и видимо две широке категорије. Једна има везе са аналитиком корисника и искуством корисника, а друга оперативном интелигенцијом. Упознаћу се са неким детаљима нешто касније. Целокупна корисничка служба и купац искуства, а ми у Импетус СтреамАналитик-у то смо радили на много различитих начина, заиста је све уистину, заиста ухвативши вишеканално ангажовање потрошача у реалном времену и пружајући им врло, врло цон-осетљива искуства које данас нису уобичајене. Ако прегледавате веб, веб локацију Банк оф Америца и истраживали сте неке производе и једноставно назовите цалл центар. Да ли би рекли: „Хеј Јое, знам да сте истраживали неке банкарске производе, да ли бисте желели да вас испуним?“ Не очекујете то данас, али то је врста искуства која је заиста могућа са стримингом аналитике. У многим случајевима то чини велику разлику, поготово ако је клијент започео истраживање начина како да изађе из уговора с вама гледајући клаузуле о раном раскиду или одредбе и одредбе за рани раскид на вашој веб локацији, а затим се јавите, а ви нисте у могућности да директно им се суочити око тога, али само индиректно понудити понуду за неку врсту прве промоције, јер систем зна да та особа гледа на превремени раскид, а ви ту понуду направите у том тренутку, ви бисте то врло добро могли да заштитите од купца који штити и заштити то средство .

То би био један пример, плус много корисничких услуга све су добри примери. Данас имплементирамо смањује трошкове у цалл центру као и пружа драматично угодно искуство купцима. Дез је обавио сјајан посао у сажетку неких случајева употребе. Можете да зурите у овај графикон неколико минута. Класифицирао сам га као вертикале, хоризонталне и комбиниране области, ИоТ, мобилне апликације и позивни центар. Све су вертикалне и хоризонталне. Зависи како посматрате. У наставку, видимо доста хоризонталних употреба које су прилично уобичајене за вертикалне индустрије и постоје случајеви специфичне вертикалне употребе, укључујући финансијске услуге, здравство, телеком, производњу итд. Ако се заиста постављате себи питање или кажете себи да, „ох, не знам који су случајеви употребе. Нисам сигуран да ли заиста има неке пословне вредности у струјању аналитике за моју компанију или за наше предузеће, “добро размислите, размислите два пута. Разговарајте са више људи јер постоје случајеви употребе који су данас у вашој компанији релевантни. Упознаћу пословну вредност о томе како се тачно изводи пословна вредност.

На дну пирамиде овде имате предвидљиво одржавање, сигурност, заштиту од пепела итд. Те врсте примене представљају заштиту прихода и имовине. Да је Таргет заштитио њихово кршење сигурности који се догађао сатима и недељама, ЦИО је могао да спаси његов посао. То би могло уштедјети десетине или стотине милиона долара, итд. Стреаминг аналитика у стварном времену заиста помаже у заштити те имовине и заштити губитака. То је директна додата вредност предузећа управо тамо.

Следећа категорија постаје профитабилнија, смањује трошкове и остварује више прихода од тренутног пословања. То је ефикасност тренутног предузећа. Све су то случајеви употребе које називамо оперативном интелигенцијом у стварном времену где добијате дубоки увид у то како се мрежа понаша, како се понашају ваши клијенти, како се понаша ваш пословни процес и да ли сте у могућности прилагодити се све то у реалном времену јер добијате повратне информације, добијате обавештења. Добијате одступања, одступања у стварном времену и можете брзо да делујете и одвајате процес који иде изван граница.

Такође бисте могли уштедети много новца у скупој надоградњи капитала и стварима за које мислите да су неопходне, а које можда неће бити потребне ако сте оптимизовали мрежни сервис. Чули смо за случај када је главни телцо одложио 40 милиона долара надоградње у својој мрежној инфраструктури, јер су открили да имају довољан капацитет за управљање својим тренутним прометом, што је оптимизирањем и бољим обављањем интелигентног усмеравања свог промета и сличних ствари. Све су то могуће само уз помоћ аналитике и механизма акције у стварном времену који делује на те увиде у реалном времену.

Следећи ниво додате вредности је уп-селл, цросс-селл где постоје могућности да се заради више прихода и профита од тренутне понуде. Ово је класичан пример који многи од нас знају о томе где су доживели где, размишљате о свом животу где сте данас спремни да заправо купите производ који вам се не нуди. У многим, многим случајевима се то заправо и догађа. Имате на уму ствари које волите да купујете, а знате да желите да купите, да имате листу обавеза или нешто слично, што вам је рекла супруга или ако немате жену, али сте стварно желели да купите и идете или у куповину на веб локацији или комуницирате у малопродаји, само место продавнице нема превару, нема интелигенцију да израчуна шта вам може требати. Дакле, они не могу да осигурају посао. Ако би се аналитика за стриминг могла применити да би се заиста прецизно предвидјела и која је заиста могућа по ономе што би највише одговарало овом конкретном конфекцији, овај купац у овом тренутку на овој локацији, постоји много уп-продаја и цросс-селл-а, а опет долази од струјна аналитика - могућност доношења одлуке о склоности шта ће овај купац вероватно купити или одговорити у том тренутку истине када за то постоји прилика. Зато волим ону слику коју је Дез показао медведу који је управо требао јести ту рибу. Прилично је то.

Такође мислимо да постоји велика категорија драматичних, трансформационих промена у предузећу која нуде потпуно нове производе и услуге једноставно засноване на проматрању понашања купаца, а све засновано на посматрању понашања другог предузећа. Ако, рецимо, телцо или кабловска компанија стварно поштују обрасце коришћења купаца у ком сегменту тржишта које он гледа, који програм у које време итд., Они заправо завршавају стварањем производа и услуга о којима се готово моли јер на неки начин. Дакле, цео концепт понашања на више екрана управо тамо где га сада готово схватамо да можемо да гледамо ТВ или кабловски садржај на нашим мобилним апликацијама. Неки од тих примера потичу из нових производа и услуга који нам се нуде.

Ући ћу у „Која су архитектонска својства струјне аналитике?“ То је крајње оно што покушавамо да урадимо. Ово је Ламбда архитектура у којој спајате историјске податке и увиде у стварном времену и истовремено их видите. То Сигма омогућава. Сви данас имамо серијску архитектуру и слику предузећа. Гледали смо у неку врсту скупа БИ-а и употребе и додана је Ламбда архитектура. Како је слој брзине или потреба и Ламбда све у томе да споји та два увида и то схвати на комбиновани начин, на богат начин који комбинује оба увида.

Постоји још једна парадигма која се зове архитектура Капа која се предлаже где се претпоставља да је брзински слој једини механизам за унос који ће постојати у дужем периоду. Све ће проћи кроз овај слој брзине. Не постоји чак ни механизам ван мреже ЕТЛ. Све ЕТЛ ће се догодити. Чишћење, чишћење података, квалитетан ЕТЛ - све се то догађа на жици, јер имајте на уму да су сви подаци рођени у реалном времену. У неком тренутку било је реално време. Толико смо навикли да ово стављамо на језера, на реке и океане, а онда то радимо на статичкој анализи да смо заборавили да су подаци рођени у неком тренутку у стварном времену.Сви подаци су заправо рођени као догађаји у стварном времену који су се догодили у одређеном тренутку и већина данашњих података о језеру управо је стављена у базу података за каснију анализу и ми сада имамо предност у Ламбда и Каппа архитектури видевши га, анализирајући га, унапред га обрађујући и реагујући на њега док стигне. То је оно што ове технологије омогућавају. Кад на то гледате као на укупну слику, изгледа отприлике овако где је унутра Хадооп, постоје МПП-ови и складишта података која већ имате.

Ми то постављамо зато што је важно не говорити само о новим технологијама на острву. Морају да се интегришу. Они морају имати смисла у тренутном предузећу, а као пружаоци решења који опслужују предузећа, ми смо на то веома осетљиви. Помажемо предузећима да интегришу целу ствар. Постоје извори података са леве стране који се хране и у Хадооп и слојеве складишта података, као и у реалном времену на врху, а сваки од тих ентитета су рачунари са залихама као што можете видети, а слој потрошње података је са десне стране страна. Непрестани напори су да се помакне већина усклађености, управљања, безбедности, управљања животним циклусом итд., Које су данас доступне, а све су то спојене у ову нову технологију.

Једна од ствари коју аналитичка струја покушава да уради, ако данас погледате пејзаж, у пејзажној технологији струје се догађа много ствари и са становишта клијента, толико је тога за разумети. Постоји толико тога за наставити. На левој страни постоје механизми за прикупљање података - НиФи, Логстасх, Флуме, Скооп. Очигледно сам ставио изјаву о одрицању одговорности рекавши да није исцрпна. Изађите у редове, а затим уђите у опен-соурце стреаминг моторе - Сторм, Спарк Стреаминг, Самза, Флинк, Апек, Херон. Херон вероватно још није отворени извор. Нисам сигурна да ли је од тога. Ти стриминг мотори затим воде или подржавају компоненту аналитичке компоненте за подешавање као што су сложена обрада догађаја, машинско учење, предиктивна аналитика, модул упозоравања, струјање ЕТЛ-а, филтри за статистику обогаћивања. То су све оно што сада називамо оператерима. Скуп тих оператора када се повезују заједно, потенцијално би такође био уобичајен закључак који би се у великој мери закључио ако је потребно, апликација за стриминг која ради на стреаминг енгинеу.

Као део тог ланца компоненти такође морате чувати и индексирати податке у своју омиљену базу података, свој омиљени индекс. Можда ћете такође морати да дистрибуирате кеш меморију која води у слој за визуелизацију података на десној страни на горњем делу до комерцијалних производа или производа отвореног кода, али на крају вам је потребан некакав производ да бисте те податке визуализовали у реалном времену. Такође, понекад морате смислити и друге апликације. Сви смо видели да вредности добијене само акцијом коју преузмете на увид, да ће акција бити окидач од аналитичког скупа у други сноп апликација који се можда променио то је нешто на страни ИВР или покреће позивни центар одлазни позив или нешто слично. Морамо да интегришемо те системе и неки механизам да ваш стриминг кластер покрене остале апликације за пренос података низводно.

То је укупна гомила од преласка с лева на десно. Затим имате сервисне слојеве, средњи надзор, ниво општег сервисног осигурања итд. Долазите до производа који се налазе у пословном простору који купци виде као Хадооп дистрибуције које све струје као што сам рекао и постоје комерцијалне или појединачне -вендор решења која су очигледно у нашим конкурентима. Такође у пејзажу има много више које можда овде нисмо споменули.

Оно што тамо видите углавном види и корпоративни корисник. Као што видите, сложен и брзо развијајући се пејзаж технологије за обраду токова. Морамо да поједноставимо избор и њихово корисничко искуство. Оно што мислимо да је предузећима заиста потребно функционално је апстрахирати све то у једном месту, једноставном интерфејсу који спаја све те технологије које га чине једноставним за употребу и не излаже све покретне делове и питања деградације и питања перформанси и питања одржавања животног циклуса у предузећу.

Апстракција функционалности је једна. Други део је апстракција струјног мотора. Мотори струје и домени отвореног кода појављују се једном у три, четири или шест месеци. Дуго је била Олуја. Самза се појавио и сада је Стреаминг Стреаминг. Флинк подиже главу, почињући да привлачи пажњу. Чак и путоказ за Спарк Стреаминг, они стварају начин да потенцијално користе други мотор за чисту обраду догађаја, јер они такође схватају да је Спарк дизајниран за серију и стварају пут у својој архитектонској визији и њиховом плану за потенцијално другачији приступ мотор за обраду токова поред тренутног микробатцх-а у Спарк Стреаминг-у.

То је реалност са којом се морате суочити да ће бити доста еволуције. Заиста се морате заштитити од тог тока технологије. Јер по дефаулту ћете морати да одаберете један, а затим да живите с њим, што није оптимално. Ако гледате на други начин, борите се између, "ок, морам да купим власничку платформу на којој нема закључавања, нема полуге отвореног кода, може бити веома велика цена и ограничена флексибилност наспрам свих ових скупова отворених кода тамо где морате сами да радите. “Поново, као што рекох, то кошта много трошкова и кашњења у приступу тржишту. Оно што ми кажемо да је СтреамАналитик један пример сјајне платформе која обједињује пословну класу, поуздан, појединачни добављач, подржану професионалну услугу - све оно што вам је као предузеће заиста потребно и снагу флексибилности екосистема отвореног кода где их обједињује једна платформа - Ингест, ЦЕП, аналитика, визуализација и све то.

То такође чини врло, врло јединствену ствар, која обједињује много различитих технологија мотора испод једног корисничког искуства. Заиста мислимо да је будућност у томе да можемо користити више стреаминг мотора јер различити случајеви употребе заиста захтевају различите струјне архитектуре. Као што је Робин рекао, постоји читав спектар латенција. Ако заиста говорите о милисекунди латенције, десетинама или чак стотинама милисекунди, заиста вам је потребна Олуја у овом тренутку док не буде неки други једнако зрели производ за мање попустљивости или блажи временски оквир и латенције можда за пар секунди, три, четири, пет секунди, у том распону, тада можете користити Спарк Стреаминг. Потенцијално постоје други мотори који могу радити и једно и друго. Дно црта, у великом предузећу, користиће се све врсте случајева. Заиста желите да приступ и опћенитост имају више мотора са једним корисничким искуством и то је оно што покушавамо да изградимо у СтреамАналитик-у.

Само брз преглед архитектуре. Ово ћемо мало прерадити, али у суштини, на левој страни долази више извора података - Кафка, РаббитМК, Кинесис, АцтивеМК, сви ти извори података и редови који долазе на платформу за обраду токова на којој сте дођите до састављања апликације, где морате да повлачите и испуштате од оператора попут ЕТЛ-ова, све ствари о којима смо разговарали. Испод је неколико мотора. Тренутно имамо Сторм и Спарк Стреаминг као јединствену индустријску платформу и прву платформу за стриминг предузећа у класи која има вишеструку подршку мотора. То је врло јединствена, флексибилност коју нудимо поред свих осталих флексибилности контролних табли у реалном времену. Уграђен је ЦЕТ мотор. Имамо беспрекорну интеграцију са Хадооп и НоСКЛ индексима, Солр и Апацхе индексима. Можете слетјети у своју омиљену базу података без обзира о чему се ради и правити апликације заиста брзо и брзо доћи на тржиште и остати доказ будућности. То је наша цела мантра у СтреамАналитику.

С тим мислим да ћу закључити своје примедбе. Слободно нам се обратите за више питања. Желео бих да реч остане отворена за питања везана за питања и питања и панел дискусију.

Ребека, за тебе.

Ребецца Јозвиак: Одлично, ок. Хвала Вам много. Дез и Робин, да ли имате неких питања пре него што их пребацимо на питања и питања публике?

Робин Блоор: Имам питање. Ставићу слушалице да ме чујете. Једна од занимљивих ствари, ако ми то можете љубазно рећи, много онога што сам видео у отвореном простору изгледа оно што бих рекао незрело за мене. У одређеном смислу, да, можете да радите разне ствари. Али чини се да у стварности гледамо на софтвер у његовом првом или другом издању и само сам се питао из вашег искуства као организације, колико сматрате незрелост Хадооп окружења проблематичном или је то нешто што нема ' не стварам превише проблема?

Ананд Венугопал: То је реалност, Робин. Апсолутно си у праву. Незрелост није нужно у подручју само функционалне стабилности и ствари, али можда су такви и случајеви. Али незрелост је више у спремности за употребу. Производи отвореног кода како излазе, а чак и док их нуди дистрибуција Хадооп, сви су они пуно различитих способних производа, компоненти које су спојене заједно. Они не раде неометано заједно и нису дизајнирани за несметано неприметно корисничко искуство које постаје попут Банк оф Америца или Веризон или АТ&Т, да би у року од неколико недеља применили апликацију за аналитику за стриминг. Нису сигурно дизајнирани за то. То је разлог због чега ми улазимо. Ми то спајамо и олакшавамо разумевање, постављање итд.

Мислим да је функционална зрелост тога у великој мери присутна. Многа велика предузећа данас користе на пример Олују. Многа велика предузећа се данас играју са Спарк Стреамингом. Сваки од ових мотора има своја ограничења у ономе што могу радити, зато је важно знати шта можете, а шта не можете са сваким мотором и нема смисла разбијати главу о зид и говорити: „Гледај ја изабрао је Спарк Стреаминг и то ми не функционира у овој одређеној индустрији. "Неће успети. Биће кориштени случајеви у којима ће искрење бити најбоља опција, а постојаће случајеви где Спаркинг Стреаминг можда неће радити код вас. Због тога вам је заиста потребно више опција.

Робин Блоор: Па, за већину тога требате имати стручне тимове. Мислим, ни сам не знам одакле да почнем на овоме. Разумна сарадња квалификованих појединаца. Интересује ме како ангажман у који се укључујете и како се дешава. Да ли је то зато што се одређена компанија налази након одређене апликације или видите неку врсту онога што бих назвао стратешким усвајањем тамо гдје желе да читава платформа уради много ствари.

Ананд Венугопал: Виђамо примере и једног и другог, Робин. Неке од првих десет марки које сви знају раде о томе на врло стратешки начин. Они знају да ће имати разне случајеве употребе, па процењују платформе које ће одговарати тој потреби, а то је мноштво различитих случајева употребе на начин који ће бити мулти-станар који ће бити распоређени у предузећу. Постоје и приче о једнократној употреби које такође почињу. У хипотекарној компанији на којој радимо постоји посебан случај праћења пословне активности праћења пословне активности, који не бисте замислили као случај прве употребе, али то је пословно решење или случај коришћења који су смислили и затим смо тачке повезали у стриминг . Рекли смо: "Знате шта? Ово је сјајан случај за стриминг аналитике и на овај начин је можемо имплементирати. "Тако је и почело. Затим се у том процесу едукују и кажу: „Ох вов, ако то можемо учинити и ако је ово генеричка платформа, онда можемо одвојити апликацију, слојити их у платформу и изградити много различитих апликација на овом платформа. "

Робин Блоор: Дез, имаш ли питања?

Ананд Венугопал: Дез је вероватно без звука.

Дез Бланцхфиелд: Извињавам се. Само сам добро обавио разговор. Само следећи оригинално запажање Робина, ви сте потпуно у праву. Мислим да је изазов сада да предузећа имају екосистем и културно и бихевиорално окружење где је бесплатни софтвер са отвореним кодом нешто што им је познато и они могу да користе алате попут Фирефока као прегледач и имају пристојан приступ животни век док не постане стабилан и сигуран. Али неке од тих веома великих платформи које користе су власничке платформе за предузећа. Дакле, усвајање оног што сматрам платформама отвореног кода није увек нешто што им је лако да се културолошки или емоционално преброде. То сам видео тек усвајањем малих програма који су били локални пројекти који се једноставно играју са великим подацима и аналитиком као основним концептом. Мислим да је један од кључних изазова, сигуран сам да сте их сада видели широм организација, њихова жеља да добију исход, али истовремено имају и једну ногу заглављену у стару конзерву, одакле могу ово само купити "Уметните велики бренд" Орацле, ИБМ и Мицрософт. Ови нови и познати брендови долазе с Хадооп платформама и још више. Долазе узбудљивији брендови преко којих поседује врхунску технологију попут стреам.

Које сте врсте разговора водили или пресекли кроз то? Знам да јутрос имамо масовно присуство и једна је ствар за коју сам сигуран да свакоме смета: „Како да пребацим цео овај изазовни слој од даске до нивоа управљања, ох превише отворени извор и превише крваве ивице? "Како пролазе разговори са клијентима и како се пробијате до те тачке где некако ублажавате те врсте страхова да размислите о усвајању симпатије СтреамАналитика?

Ананд Венугопал: Заправо нам је прилично лако продати предлог вредности јер купци природно крећу ка отвореном извору као преферираној опцији. Лако се одричу и говоре: „У реду, сада идем на отворени код.“ Они заправо пролазе кроз веома посвећену процену великог производа, рецимо да је то ИБМ или типичан производ, јер они имају ове везе између добављача. Не би поступали с нама ни с отвореним кодом према том производу. Проћи ће кроз шест до осам до дванаест недеља евалуације. Убедити ће се да овде постоји одређени степен перформанси и стабилности који желе да наставе, а онда се одлучују говорећи: „Вау, знаш шта, ја у ствари то могу да учиним.“

Данас, на пример, имамо главни телцо ниво једног нивоа који има аналитику струјања која се покреће у производњи поврх великог броја гомила и они процењују то против другог веома, веома великог познатог продавца и у то су се уверили тек након што смо доказали све перформансе, стабилност и све те ствари. Не узимају здраво за готово. Открили су да је опен соурце компетентан кроз своје процене и схватају да је, у најгорем случају, „Можда постоје та два случаја употребе која можда не могу да урадим, али већина мојих случајева употребе убрзања данас је изузетно могућа са отвореним кодом стацк. "И омогућавамо његово кориштење. То је сјајно место. Желели су опен соурце. Стварно желе да изађу из ситуације закључавања добављача у којој су навикли много, много година. Онда долазимо и кажемо: "Знате шта, учинићемо отворени извор много, много лакшим и пријатељскијим за употребу за вас."

Дез Бланцхфиелд: Мислим да је други изазов који предузећа проналазе када доведу традиционалну владу, често су генерација која стоји иза неких крвавих ивица узбудљивих ствари о којима овде причамо, и не мислим на то као негативне недостатке. Стварно је то да они имају генерацију и пут који треба да прођу да би ослободили оно што сматрају стабилним платформама за пролазак, развојним циклусима старе школе и УАТН интеграционим циклусима и тестирањима и документацијом, маркетингом и продајом. Док у типу који радите, мислим да је оно што ме занима требало да размотрим да гледајући нека од ваших последњих издања синоћ радећи неке истраживачке радове, сада сте добили овај микс где сте добили компетенције из перспективног саветодавног становишта и примене, али сте такође добили хрпу у коју се можете пријавити. Мислим да ће се ту време борити неко време. Много њих смо видели као и ја на пијаци. Они су често у ономе што ја зовем суседних чворова, док из онога што нам говорите кад водите те разговоре и спроводите их.

Можете ли нам дати пар примера неких граничних вертикала које сте видели усвајање? На пример, заиста постоји нишно окружење као што је ракетна наука и постављање сателита у свемир и прикупљање података са Марса. На планети то ради само неколицина људи. Али постоје велике вертикале као што су здравство, на пример, у ваздухопловству, бродарству, логистици, производњи и инжењерингу, који су пар примера већих и ширих сектора индустрије које сте до сада видели да сте видели заиста добро усвајање у?

Ананд Венугопал: Телцо је велики пример.

Само ћу брзо поправити своје слајдове овде. Да ли можете видети слајд овде, студија случаја 4?

Ово је случај великог телцо-а који гута податке с топ-бок уређаја и ради с њима више ствари. Они гледају шта купци стварно раде у реалном времену. Они гледају где се грешке догађају у стварном времену у сет-топ боковима. Они покушавају да обавесте позивни центар о томе, ако овај купац одмах позове, информације о вези са кодом са сет-топ бок-а овог купца, информације о картама за одржавање брзо корелирају да ли овај клијентски сет-топ бок има проблем или не и раније купац изговара реч. Свака кабловска компанија, сваки већи телцо покушава да то уради. Они гутају податке са сет-топ бок рачунара, раде аналитику у стварном времену, раде анализу кампања како би могли да постављају своје огласе. Постоји огроман случај употребе.

Као што рекох, постоји хипотекарна компанија која је поново генерички образац за који се велики системи укључују у обраду података. Подаци који иду кроз систем А у систем Б у систем Ц и то су регулисани послови којих све треба бити доследно.Често се системи међусобно искључују, један систем каже: „Обрађујем стотину кредита укупне вредности 10 милиона долара.“ Систем каже: „Не, обрађујем 110 зајмова неких других различит број. "То морају брзо да разреше, јер у ствари обрађују исте податке и праве различите интерпретације.

Било да се ради о кредитној картици, обради зајма, пословном процесу или је то хипотекарни пословни поступак или нешто треће, помажемо им да у стварном времену раде на корелацији и усклађивању како би се осигурало да ти пословни процеси остану у синхронизацији. То је још један занимљив случај употребе. Постоји главни амерички уговарач који гледа на ДНС саобраћај ради откривања аномалија. Изграђен је модел за обуку ван мреже и они раде оцјењивање на основу тог модела промета у реалном времену. Неки од тих занимљивих случајева употребе. Постоји главна авиокомпанија која гледа у сигурносне редове и покушава вам дати ту информацију да: „Хеј, то је капија вашег авиона за ваш лет. Ред чекања ТСА данас траје око 45 минута у односу на два сата у односу на нешто друго. “То ажурирање добијате унапред. Још раде на томе. Занимљив случај употребе ИоТ-а, али одличан случај струјне аналитике према корисничком искуству.

Ребецца Јозвиак: Ово је Ребека. Док сте на тему случајева употребе, поставља се велико питање члана публике који се пита: „Да ли су ово студије случаја, да ли се ове иницијативе покрећу са аналитичке стране информационих система куће или се више воде од њих предузеће које има специфична питања или потребе на уму? "

Ананд Венугопал: Мислим да видимо око 60 процената или отприлике, 50 до 55 процената, углавном врло проактивних, ентузијастичних технолошких иницијатива које се знају, које су прилично паметне и разумију одређене пословне захтеве, а вероватно имају једног спонзора који су идентификовали, али ове да ли се технолошки тимови спремају за напад случајева пословне употребе који долазе и онда када једном изграде способност, знају да могу то учинити и онда крену у посао и агресивно то продају. У 30 до 40 процената случајева видимо да пословање већ има посебан случај употребе који моли за способност аналитичке струје.

Ребецца Јозвиак: То има смисла. Имам још једно мало техничко питање од члана публике. Пита се да ли ови системи подржавају и структуриране и неструктуриране токове података, попут седимената потока или постова у стварном времену, или га треба прво филтрирати?

Ананд Венугопал: Производи и технологије о којима говоримо врло брзо подржавају и структуриране и неструктуриране податке. Могу да се конфигуришу. Сви подаци имају неку структуру, било да је то КСМЛ или нешто уопште. Постоји нека структура у погледу постојања фееда временске ознаке. Постоји можда још једна мрља коју је потребно рашчланити да бисте могли да убацујете парсес у ток да бисте анализирали структуре података. Ако је структурирано, тада само кажемо систему: "У реду, ако постоје вредности одвојене зарезима, а прва је низ, друга је датум." Тако да можемо да убацимо ту анализу интелигенције у слојеве горњег екрана и лако обрађивати и структуриране и неструктуриране податке.

Ребецца Јозвиак: Имам још једно питање од публике. Знам да смо прошли мало иза врха сата. Овај полазник жели знати, чини се да можда апликације за стриминг у реалном времену развијају и потребу и прилику за интегрисање назад у трансакционе системе, на пример, системе за спречавање преваре које стварају. У том случају, да ли трансакциони системи морају бити прилагођени да се некако уклапају у то?

Ананд Венугопал: То је спајање, зар не? То је спајање система трансакција. Они понекад постају извор података где анализирамо трансакције у реалном времену и у многим случајевима где рецимо да постоји проток апликација и овде покушавам да покажем статички сајт за претраживање података, а затим у нашем случају где нека врста стриминга унутра и тражите статичку базу података као што је ХБасе или РДБМС како бисте обогатили проточне податке и статичке податке како бисте донели одлуку или аналитички увид.

Постоји још један велики индустријски тренд који такође видимо - конвергенција ОЛАП-а и ОЛТП-а - и зато имате базе података попут Куду и базе података у меморији које подржавају и трансакције и аналитичку обраду у исто време. Слој за обраду токова био би у потпуности у меморији и гледаћемо или повезати се с неким од ових трансакцијских база података.

Ребецца Јозвиак: Мешовито радно оптерећење је једна од последњих препрека за скок, мислим. Дез, Робин, да ли имате још два питања?

Дез Бланцхфиелд: Ускочићу у последње питање и закључити ћу то ако немате ништа против. Први изазов са којим су се организације са којима сам се бавила последњу деценију или на тај начин довео до овог узбудљивог изазова аналитике струјања, прво што имају тенденцију да ставе на стол када смо започели разговор око целог овог изазова је где добили смо сет вештина? Како да преквалификујемо сет вештина и како да интерно добијемо ту способност? Улазак и наговор Импетус-а нас држи кроз путовање, а затим имплементирање као први први корак и то има пуно смисла.

Али за средње до велике организације, које су ствари које видите у овом тренутку да се припремите за то, да изградите ту способност интерно, да добијете било шта од само основног вокабулара око њега и какве везе могу са њима организације око преласка на овакав оквир и преуређивање постојећег техничког особља од ИТ-а од генералног директора, како би они сами могли то да покрену кад га изградите и имплементирате? Врло кратко, какви су изазови и како их решавају, купци са којима се суочавате, врсте изазова које су пронашли и како пролазе кроз решавање тог преквалификације и повратити искуство и знање како би се припремили за то и били Да ли сте у могућности да се крећете около?

Ананд Венугопал: Често је мали скуп људи који покушавају изаћи и купити платформу за струјну аналитику већ паметно с обзиром да су Хадооп свесни, већ су стекли своје вештине Хадооп МапРедуце, ​​и зато што блиско сарађују са дистрибутером Хадооп дистрибуције, или су познате. На пример, све добија Кафка. Они нешто раде с тим и Сторм или Спарк стреаминг су у њиховом опен-соурце домену. Дефинитивно су људи упознати са њом или граде вештине око ње. Али започиње са малим набором људи који су довољно квалификовани и довољно паметни. Они присуствују конференцијама. Уче и да продавцима постављају интелигентна питања, а у неким случајевима уче и са добављачима. Пошто продавци долазе и представљају се на првом састанку, они можда не знају ствари, али их поново читају и тада почињу да се играју са њим.

Та мала група људи је језгро и тада она почиње да расте и сви сада схватају да се први случај пословне употребе операционализује. Ту почиње талас и видели смо на самиту Спарк прошле недеље где је велико предузеће попут Цапитал Онеа било напољу и у пуној снази. Бирали су Спарка. Говорили су о томе. У Спарку образују много својих људи јер томе доприносе и у многим случајевима као корисници. То видимо и са многим, многим великим предузећима. Све започиње с неколико малих група врло паметних људи, а затим започиње талас свеукупног образовања и људи знају да се једном виши потпредседник или једном виши директор поравнају и желе да се кладите на ту ствар и реч се свашта и сви почну да покупе ове вештине.

Дез Бланцхфиелд: Сигурна сам да и ви имате фантастично време стварања и шампиона.

Ананд Венугопал: Да. Пуно се едукујемо док радимо са почетним шампионима и држимо течајеве тренинга и много, многи за наше велике купце смо се вратили и имали таласе и таласе тренинга како бисмо увели пуно корисника у фазу коришћења, посебно на Хадооп МапРедуце сајту. Открили смо да смо у великој компанији за кредитне картице која је наш клијент испоручили барем можда пет до осам различитих програма обуке. Такође имамо бесплатна издања у заједници за све ове производе, укључујући наш, кутије за песак које људи могу да преузму, навикну и да се тако и образују.

Дез Бланцхфиелд: То је све што имам јутрос за тебе. Много вам хвала. Невјероватно ми је занимљиво видјети врсте модела и случајеве кориштења које данас имате за нас. Хвала вам.

Ананд Венугопал: Сјајно. Хвала вам пуно људи.

Ребецца Јозвиак: Хвала свима што сте нам се придружили у овим мрежним емисијама Хот Тецхнологиес. Било је фасцинантно чути од Дез Бланцхфиелд-а, др Робина Блоор-а и из Импетус Тецхнологиес-а, Ананда Венугопала. Хвала вам, излагачи Хвала говорницима и хвала публици. Следећег месеца имамо још једну Хот Тецхнологиес, ​​па потражите то. Увек можете пронаћи наш архив архивиран на Инсидеаналисис.цом. Такође смо ставили пуно садржаја на СлидеСхаре и неколико занимљивих битова на ИоуТубе-у.

То је све народе. Хвала још једном и добар дан. Ћао.