Данашњи велики изазови података настају из разноликости, а не количине или брзине

Аутор: Judy Howell
Датум Стварања: 28 Јули 2021
Ажурирати Датум: 1 Јули 2024
Anonim
Данашњи велики изазови података настају из разноликости, а не количине или брзине - Технологија
Данашњи велики изазови података настају из разноликости, а не количине или брзине - Технологија

Садржај


Одузети:

Превише ИТ одељења баца све што имају о питању обујма и брзине података, заборављајући да се позабаве основним питањем разноликости података.

Изазов управљања и искориштавања великих података долази из три елемента, рекао је Доуг Ланеи, потпредсједник истраживања у Гартнер-у. Ланеи је први приметио пре више од деценије да велики подаци представљају такав проблем за предузеће, јер уноси тешко управљану количину, брзину и разноликост. Проблем је у томе што превише ИТ одељења баца све што имају о питању обујма и брзине података, заборављајући да се позабаве темељним питањем разноликости података.

Ланеи је 2001. године написао да ће „водећа предузећа све више користити централизовано складиште података да би дефинисали заједнички речник предузећа који побољшава унутрашњу и спољну сарадњу“. Питање тог вокабулара - и варијабилност која спречава компаније да га стварају - остаје и даље најмање обрађени аспект велике загонетке података. (Погледајте шта други стручњаци имају да кажу. Погледајте стручњаке за велике податке које треба да следите.)


Три Вс великих података

Бројна предузећа су пронашла методе за коришћење повећаног обима и брзине података. на пример, може да анализира огромне количине података. Наравно, ти се подаци често изнова и изнова приказују у истим параметрима. То је потакнуло технолошке иновације, попут база података базе ступаца, које данас широко користе друге компаније које се суочавају са једнако великим продаваоницама сличних података.

У погледу брзине припитомљавања, добављачи попут Сплунка помажу предузећима да брзо анализирају креиране податке путем датотека дневника које биљеже неколико хиљада догађаја у секунди. Ова анализа догађаја великих количина усмерена је на случајеве коришћења безбедности и праћења перформанси. Као и код изазова за количину података, и изазов брзини у великој мери је решен софистицираним техникама индексирања и дистрибуираном аналитиком података који омогућавају процесирање капацитета за скалирање са повећаном брзином података.


Када је у питању разноликост, ипак, превише предузећа се и даље суочава са великим проблемом у приступу аналитикама великих података. Овај проблем покрећу три фактора: Прво, због раста, аквизиције и технолошких иновација које додају нове системе у окружење, предузећа су закључана у високо хетерогеном окружењу и та хетерогеност се с временом само повећава. Предузећа морају да прате мноштво типова система и управљају десетинама хиљада типова података, као и да се исти подаци представљају користећи различите номенклатуре и формате.

Друго, ови системи и врсте података у многим случајевима извештавају и релевантне информације и информације које се могу сигурно филтрирати као небитне за проблем који се решава. Потребно је поуздано идентификовати утицајне информације.

Трећа димензија изазову сорте је стална променљивост или промена околине. Системи се надограђују, уводе нови системи, додају се нови типови података и уводи нова номенклатура. То додатно оптерећује нашу способност да укротимо изазов за разноликост података. Ово додаје додатни слој изазову сорте. (За више увида, погледајте крупне податке: како су их ухватили, дробили и користили за доношење пословних одлука.)

Решавање проблема разноликости података

Да би решили проблем са разноликошћу података, предузећа морају почети са ИТ доменом, јер она често представља и најгоре прекршитеље и најгоре жртве проблема са разноликошћу. Први корак је започети са свеобухватном дефиницијом или таксономијом свих ИТ елемената или средстава. То пружа основну основу или основу за упућивање на било шта у или око ИТ-а и омогућава предузећима да управљају све већом хетерогеношћу наспрам познате таксономије или терминологије.

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје вештине програмирања када никога није брига за квалитет софтвера.

Сљедећи корак је препознавање бројних начина на који је исти објект представљен у различитим записима. То омогућава ИТ професионалцима да прегледају своје хетерогено окружење и високо филтрирају и компримирају податке у релевантне и управљиве комаде.

Коначно, ИТ менаџери морају усвојити поступак сталног испитивања окружења ради промена, попут увођења нових врста елемената или нове номенклатуре да би се односиле на исти елемент.

Помоћу ових корака ИТ организације могу решити проблем разноликости и извући дубоке увиде који су историјски избегли ИТ тимови. Штавише, управљање проблемом сорте увелике побољшава њихов повраћај улагања у алате и технике који се баве традиционалнијим проблемима великих података о количини и брзини.