6 великих митова о управљању великим подацима

Аутор: Eugene Taylor
Датум Стварања: 15 Август 2021
Ажурирати Датум: 22 Јуни 2024
Anonim
Applied Magic by Dion Fortune
Видео: Applied Magic by Dion Fortune

Садржај


Извор: Двнлд777 / Дреамстиме.цом

Одузети:

Велики подаци су велики послови, али само ако се правилно користе.

Још у мају 2014. године Форрестер Ресеарцх издао је два извештаја изводећи одређене закључке о хипету око великих података. Истраживачка фирма анкетирала је више од 250 руководилаца маркетинга и развоја пословања. Према ауторима извештаја, реторика великих података увек је на јаком нивоу, а произвођачи технологије оглашавају производе са, чини се, невероватним тврдњама.

Гартнер се слаже са Форрестер Ресеарцх; значајан хипе окружује велике податке. У извештају из септембра 2014. године, Гартнер објављује пет највећих митова о подацима, а Гартнерови аналитичари нуде своје мишљење о томе шта је погрешно схваћено у вези са великим подацима и његовом манипулацијом. Па који су велики подаци највећи митови? Хајде да погледамо.

Мит: Сви су испред нас у усвајању великих података.

Гартнер каже да је заинтересованост за велике податке непрестано велика. Упркос томе, слабих 13 процената анкетираних има радне системе. Разлог: већина компанија тек треба да смисли како да извуку било коју вредност из великих складишта података. Овде је Гартнерово истраживање оптимистичније од Форрестеровог извештаја, који је открио да је само 9 процената учесника анкете рекло да планирају да спроведу технологије великих података током наредне године. (Велики подаци нуде много тога. Сазнајте више у 5 стварних проблема. Велики подаци се могу решити.)

Мит: Имамо толико података; не треба да бринемо о свакој малој мањкавости података.

Гартнер је забринут због изводљивости коју људи имамо: "Имамо толико, оно мало лошег неће бити важно." Тед Фриедман, потпредседник и угледни аналитичар из Гартнера сматра да је то погрешан начин на који се сагледава ситуација.

"У стварности, иако сваки појединачни недостатак има много мањи утицај на целокупни скуп података него што је то био случај када је било мање података, постоји више пропуста него раније јер постоји више података", рекао је Фриедман. "Стога, укупни утицај неквалитетних података на читав скуп података остаје исти."

Фриедман додаје још један разлог за забринутост. Снимање великих података често укључује податке изван посла, који су, дакле, непознате структуре и порекла. То повећава могућност грешака.

Мит: Велика технологија података елиминисаће потребу за интеграцијом података.

Постоје две кључне стратегије анализе података које се могу применити на велике податке: "схема при писању" или "шема при читању". Донедавно, једина метода која се користила је схема за писање. Шема на читању је тренутна спрема у управљању базама података. За разлику од схеме при писању, која захтева структурирани формат, подаци се учитавају у базе података које се читају на шеми у свом необрађеном формату. Тада програмери - користећи неструктуриране платформе базе података као што је Хадооп - савијају различите податке у употребљив формат. Шема читања има очигледне предности, али како Гартнер спомиње, интеграција података се мора догодити у неком тренутку.

Мит: Кориштење складишта података за напредну аналитику је бесмислено.

Трошење времена за стварање складишта података изгледа бесмислено за многе менаџере информација, посебно када су новозахваћени подаци другачији од података у складишту података. Међутим, Гартнер опет упозорава да ће чак и напредна аналитика података користити складишта података и нове податке, што значи да интегратори података морају:
  • Прочистите нове типове података како бисте их учинили погодним за анализу
  • Одлучите који су подаци релевантни и потребан ниво квалитета података
  • Одредите како да обједините податке
  • Схватите да се прочишћавање података може догодити на местима осим складишта података

Мит: Лакови података ће заменити складиште података.

Језера података су складишта различитих података, за разлику од складишта података у којима су подаци у структурираном формату. Стварање податковног језера захтева мало напретка (нема потребе за форматирањем података) у поређењу са складиштима података, због чега су податковна језера од интереса.

Гартнер наглашава да поседовање података није поента - смисао манипулације заробљеним подацима за информисано одлучивање је поента. Штавише, употреба (помало недоказаних) података за олакшавање доношења одлука је проблематична.

"Складишта података већ имају могућност да подрже широки спектар корисника у целој организацији", рекао је Ницк Хеудецкер, директор истраживања у Гартнер-у. „Лидери за управљање информацијама не морају да чекају да се надокнаде датуми података.“ (Сазнајте више о усвајању великих података о 7 ствари које морате знати о великим подацима пре усвајања.)

Велики подаци раде - нове методе манипулације подацима могу

Разлог због којег је Гартнер рекао да су „митови о највећим подацима“ уместо „митови са великим подацима“ постаје јасан након што је прочитао извештај. Гартнер се не наслађује великим подацима. Гартнер се исмијава од оних који осећају да су новије методе манипулације великим подацима спремне за "приме тиме".