Каталози података и сазревање тржишта машинског учења

Аутор: Roger Morrison
Датум Стварања: 28 Септембар 2021
Ажурирати Датум: 21 Јуни 2024
Anonim
Каталози података и сазревање тржишта машинског учења - Технологија
Каталози података и сазревање тржишта машинског учења - Технологија

Садржај


Извор: Нмедиа / Дреамстиме.цом

Одузети:

Тржиште МЛДЦ-а расте, а предузећа која желе ефикасно искористити велике податке помоћу машинског учења треба да буду свесна главних имена на терену и њиховог рангирања.

Ово је доба великих података. Информације смо преплављене и предузећима је то изазов за управљање и извлачење вредности из њих.

Данашњи проток великих података не укључује само обим, разноликост и брзину, већ и сложеност. Као што је САС идентификовао у Историји великих података и тренутним разматрањима, то је фактор токова „из више извора, што отежава повезивање, подударање, чишћење и трансформисање података кроз системе“. (Желите да сазнате више о великим подацима? Погледајте (велике) податке Велика будућност.)

Проналажење вредног увида није питање једноставно прикупљања што више података, већ проналажења правих података. Немогуће је све то радити ручним процесима. Због тога се све више предузећа "окреће каталозима података како би демократизовало приступ подацима, омогућило племенским знањима да обрађују информације, примењују политике података и брзо активирају све податке за пословну вредност".


Овде се у слику уносе каталози података (понекад познати и као каталози информација). Као што је овде дефинисано, они омогућавају „корисницима да истражују потребне изворе података и разумеју истражене изворе података, а истовремено помажу организацијама да постигну већу вредност од својих садашњих улагања“. Један од начина да се то постигне је омогућавање много већег приступа подацима међу различитим типовима корисника који могу да га искористе или допринесу.

Тхе Инфономицс Императиве

Примјећујући драматично повећану потражњу за каталозима података крајем 2017. године, Гартнер их је назвао „новом црном“. Постали су препознати као брзо и економично решење „пописати и класификовати организације које све више дистрибуирају и дезорганизирају имовину података и мапирају њихове ланце снабдевања информацијама“. Потреба за тим појавила се због пораста „инфомонике“, која захтева примену исте прецизности у праћењу информација као и за управљање другом пословном имовином. (За више информација о ланцима снабдевања, погледајте како Машинско учење може да побољша ефикасност ланца снабдевања.)


Гартнерс узимају кретње са каталогом података Форрестер Ваве ™: Каталог података о машинском учењу, К2 2018. Преко половине учесника у истраживању рекло је да планирају изградњу њихове имплементације каталога података. Вероватно су их у великој мери мотивисали чињеницом да је свако имало најмање седам језера података у својој организацији. Као што Гартнер објашњава да каталози података објашњавају, каталози података су посебно корисни за извлачење "цон, смисла и вредности података" који се обично оставља у некласификованом облику у језеру података.

Форрестер извјештава да је више од трећине доноситеља одлука и аналитичких података у 2017. години радило са 1.000ТБ или више података, што је износ за који је пријављено само између 10 и 14 посто годину прије. Управљање подацима на тој скали је све већи изазов, тачније два изазова:

„1) спајање постојећих пословних процеса на извор података како би се анализирали и имплементирали увиди и 2) прикупљање, прикупљање, управљање и управљање подацима у порасту.“

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје вештине програмирања када никога није брига за квалитет софтвера.

Шта каталози података могу учинити за предузећа

Гартнер идентификује посебне начине на које каталози података могу побољшати проток информација и продуктивност у организацијама:

  • Прикупљање и саопштавање ажурног инвентара имовинских података који је доступан организацији.

  • Стварање заједничког појма пословних термина који дефинише семантичку интерпретацију и значење података о организацијама, пружајући на тај начин средства за посредовање и решавање дефинитивних недоследности.

  • Омогућавање динамичног и окретног окружења за сарадњу како би се пословним и ИТ колегама омогућило да коментаришу, документују и деле податке.

  • Омогућавање транспарентности коришћења података анализом лозе и утицаја.

  • Надгледање, ревизија и праћење података ради подршке информацијама.

  • Снимање метаподатака ради побољшања интерне анализе употребе и поновне употребе података, оптимизације упита и сертификације података.

  • Укључивање информација у оквиру свог пословног коришћења тако што ће ухватити, комуницирати и анализирати који подаци постоје, одакле долазе, од чега се користе, зашто су потребни, како тече између процеса и система, ко је за то одговоран, шта то значи и какву вредност има.

Давање података који су исправно идентификовани и доступни кључним људима у организацији је важно, каже се у извештају Гартнера, не само за проналажење начина „уновчавања средстава података за дигиталне пословне резултате“, већ за усклађивање са прописима, без обзира да ли су у индустрији- специфичне попут Закона о преносивости здравственог осигурања и одговорности (ХИПАА) или опћенитије природе попут Опће уредбе о заштити података (ГДПР).

Додавање у машинском учењу

Али ништа није без недостатака. За каталоге података проблем је био спор и заморни процес који је условио ручном изградњом свих метаподатака које је потребно успоставити. Овде долази компонента машинског учења.

Каталози података које је Форрестер процијенио називају се МЛДЦс јер користе моћ машинског учења, једне од компоненти АИ. Како је објашњено у блогу Подиум Дата, то омогућава „изградњу упорног складишта метаподатака, а затим примену МЛ / АИ да бисте извадили и изложили потенцијално корисне увиде око основних средстава података“.

Како одабрати

Да би помогао организацијама да процене које би предузеће требало да изабере, Форрестер је применио 29 бодова процене на 12 најбољих МЛДЦ-а. Идентификовала је лидере на овом тржишту као: ИБМ, Релито, Унифи Софтваре, Алатион и Цоллибра. Снажни извођачи које су пронашли су Информатица, Орацле, Ватерлине Дата, Инфогик, Цамбридге Семантицс и Цлоудера. Хортонворкс стоји сам у рангу "противника".

Међутим, не треба ићи сам по укупном рангу. Извештај разбија посебне снаге и слабости сваког од њих. Сходно томе, ако је нека карактеристика, попут истраживања и развоја од највећег значаја за организацију, она може сматрати Хортонворкс једнаким ИБМ-у и Цолилбри за тај аспект, јер њих три деле најбољи резултат пет за тај квалитет, који је био два бода боља од Алатион и Цолоудера и четири бода боља од Цамбридге Семантицс-а.

Сходно томе, извештај Форрестер саветује оне који његов извештај користе као смернице да не претпостављају да је најбоље оцењена компанија најбољи избор за све. Они би требали да посвете велику пажњу раздвајању процене како би пронашли шта испуњава њихове посебне захтеве.