5 Увида о великим подацима (Хадооп) као услузи

Аутор: Roger Morrison
Датум Стварања: 18 Септембар 2021
Ажурирати Датум: 10 Може 2024
Anonim
How I Became a Data Analyst (without a related degree)
Видео: How I Became a Data Analyst (without a related degree)

Садржај


Извор: Инфо40555 / Дреамстиме.цом

Одузети:

Хадооп је одличан начин да извучете максимум из великих података, али постоје бројни други алати који могу да раде са Хадооп-ом на пружању још кориснијих резултата.

У данашњем свету који се стално мења, софтвер као услуга (СааС) постао је уобичајени модел. Услуга се претплатницима нуди по потреби. Велики подаци такође прате исти модел услуге. У овом ћемо чланку говорити о моделу услуга који се слиједи у домену технологије великих података.

Ево неких добро познатих модела услуга за велике податке као услуге (БДааС):

Рацкспаце

Рацкспаце Хадооп кластери могу покренути Хадооп на наменским серверима који управљају Рацкспаце, јавном или приватном облаку.


Један модел за велике податке у облаку обезбеђује Рацкспаце за Апацхе Спарк и Хадооп. Нуди потпуно управљану платформу од голог метала за обраду у меморији.

Рацкспаце елиминира проблеме с ручним управљањем и одржавањем великих података. Долази са следећим карактеристикама:


  • Смањује оптерећење рада пружањем подршке од 24 × 7 × 365
  • Омогућава потпуни приступ сет алата Хортонворкс Дата Платформ (ХДП), укључујући свиње, кошнице, ХБасе, Скооп, Флуме и ХЦаталог
  • Флексибилан мрежни дизајн са традиционалним умрежавањем до 10 ГБ
Бирање приватног облака пружа вам јавну облачност снагу и ефикасност, уз појачану сигурност и контролу. Главни недостатак употребе приватног облака је тај што је тешко управљати и захтева од стручњака да га надограде, закрпе и прате. Рацкспаце пружа одличну подршку у овим областима, тако да нема потребе за бригом о управљању облаком.


Јоиент

Заснован на Апацхе Хадоопу, Јоиент је окружење хостинга за облаке великих пројеката. Ово решење је изграђено помоћу платформе Хортонворкс података. То је инфраструктура са високим перформансама за контејнере за потребе данашњих мобилних апликација и Интернета у стварном времену. Омогућује покретање Хадоопа пословне класе на облаку Јоиент високих перформанси.



Такође има следеће предности:

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје вештине програмирања када никога није брига за квалитет софтвера.

  • Смањивање две трећине инфраструктурних трошкова решењима које пружа Јоиент са истим временом одзива
  • 3 × брже време одговора на диску И / О од стране Хадооп кластера у Јоиент Цлоуд-у
  • Убрзава времена одзива дистрибуиране и паралелне обраде
  • Побољшава скалирање Хадооп кластера извршавајући интензивне апликације за анализу података
  • Бржи резултати са бољим временом одзива
Генерално се велике апликације сматрају великим и тешким за употребу. Јоиент покушава да то промени пружањем јефтинијих и бржих решења. Јоиент пружа јавну и хибридну облачну инфраструктуру за веб и мобилне апликације у стварном времену. Њени клијенти укључују значајне кориснике као што су ЛинкедИн и Вокер.


Куболе

За велике пројекте података, Хадооп кластер обезбеђује Куболе са уграђеним конекторима за пренос података и графичким уређивачем. То омогућава употребу различитих база података као што су МиСКЛ, МонгоДБ и Орацле и поставља Хадооп кластер на ауто-пилот. Омогућава уређивач упита за кошнице, свиње и МапРедуце.


Куболе пружа све услуге као што су: укључујући:

  • Уређивач упита за кошницу, свињу и МапРедуце
  • Оцењивач израза
  • Управљачка плоча употребе
  • Екстракт оптерећења трансформације (ЕТЛ) и градитеља података
Његове карактеристике укључују:

  • Ради брже од Амазон ЕМР-а
  • Једноставан за употребу ГУИ са уграђеним конекторима и бешавном еластичном облачном инфраструктуром
  • Оптимизација распореда и управљања ресурсима врши КДС Хадооп мотор помоћу демона, пружајући напредни Хадооп мотор за боље перформансе
  • За брже упите, И / О је оптимизован за С3 складиштење. С3 је сигуран и поуздан. Куболе Дата Сервице нуди 5 × бржу изведбу наспрам података у С3.
  • Нема потребе за плаћањем неискоришћених функција и апликација
  • Интеграција у облаку - Куболе Дата Сервице не захтева измене у вашој тренутној инфраструктури, што значи да има флексибилност за рад са било којом платформом. КДС конектори подржавају увоз и извоз база података у облаку МонгоДБ, Орацле, ПостгресСКЛ и ресурсе попут Гоогле Аналитике.
  • Управљање животним циклусом кластера са Куболе Дата Сервице-ом за обезбеђивање кластера у неколико минута, скалирање по захтеву и покретање у окружењу за једноставно управљање проценама великих података

Еластиц МапРедуце

Амазон Еластиц МапРедуце (ЕМР) пружа управљани Хадооп оквир за поједностављење обраде великих података. Лако је и исплативо за дистрибуцију и обраду велике количине података.


Остали расподељени оквири као што су Спарк и Престо такође се могу покретати у Амазон ЕМР-у да би комуницирали са подацима у Амазону С3 и ДинамоДБ. ЕМР поуздано обрађује ове случајеве употребе:

  • Веб индексирање
  • Машинско учење
  • Научна симулација
  • Складиштење података
  • Анализа дневника
  • Биоинформатика
Њени клијенти укључују Иелп, Нокиа, Гетти Имагес, Реддит и друге. Неке од његових карактеристика су:

  • Флексибилан за употребу са роот приступом у свим инстанцама, подржава више Хадооп дистрибуција и апликација. Лако је прилагодити сваки кластер и инсталирати додатне апликације.
  • Инсталирати Амазон ЕМР кластер је лако.
  • Довољно поуздан да троши мање времена на праћење вашег кластера; поново покушава неуспешне задатке и аутоматски замењује инстанције које се лоше извршавају.
  • Безбедно, јер аутоматски конфигурише поставке заштитног зида Амазон ЕЦ2 за контролу мрежног приступа инстанцама
  • Обрадите податке у било којој скали помоћу Амазон ЕМР. Број инстанци се може лако повећавати и смањивати.
  • Ниска цијена без скривених трошкова; плаћати сатно за сваку коришћену инстанцу. На пример, лансирајте Хадооп кластер од 10 чворова за само 0,15 УСД на сат.
Користи се за анализу података кликовних токова за разумевање корисничких поставки. Оглашивачи могу анализирати протоке кликова и евиденције појављивања оглашавања.


Такође се може користити за ефикасну обраду огромних количина генских података и великих скупова података. Истраживачи могу бесплатно да приступе геномским подацима на АВС-у.

Амазон ЕМР може се користити за обраду дневника и помаже им у претварању петабајта неструктурираних и полуструктурираних података у корисне увиде.

Малтер

Мортар је платформа за велику науку података и изграђена на облаку Амазон Веб Сервицес. Изграђен је на Еластиц МапРедуце (ЕМР) за покретање Хадооп кластера. Мортар су створили К. Иоунг, Јереми Кам и Доуг Даниелс у 2011. години са мотивом да елиминишу тешке и тешке задатке. То је учињено тако да су научници могли да проведу своје време радећи друге критичне радове.


Ради на Јава, Јитхон, Хадооп, итд. Ради минимизирања времена које улажу корисници и омогућава им да се фокусирају на науку о подацима.

Има следеће карактеристике:

  • То ослобађа ваш тим од напорне и дуготрајне инсталације и одржавања.
  • Уштедава време добијањем решења у раду за кратко време.
  • Аутоматски упозорава кориснике на било какве пропусте у технологији и апликацијама како би се осигурало да добијају тачне и информације у стварном времену.
Примене Мортар платформе:

  • За употребу снажног, скалабилног препоручног мотора, најбржа платформа је Мортар.
  • Мортар је потпуно аутоматизован, јер покреће механизам препорука од краја до краја са само једном наредбом.
  • Користи индустријску стандардну контролу верзија која помаже у једноставном прилагођавању и прилагођавању.
  • За анализу, лако повежите више извора података у складишта података.
  • Руковањем инфраструктуром, распоређивањем и другим операцијама штедите радно време вашег тима.
  • Предвидите анализу користећи податке које већ имате. Мортар подржава приступе попут линеарне регресије и класификације за анализу.
  • Подржите водеће технологије машинског учења као што су Р, Свиња и Питхон за постизање паралелизације без напора за сложене задатке.
  • 99,9% продуженог времена и стратешког упозоравања осигурава поверење корисника и испоруку аналитичког система стално и изнова.
  • Алгоритми предвиђања користе се за раст пословања попут предвиђања потражње и идентификације купаца велике вриједности.
  • Анализа великих количина лако се врши, било да је токенизација, заустављање, ЛДА или н-грам.

Резиме

Данас је на располагању пуно апликација великих података, а убудуће ће без сумње бити бржим и јефтинијим рјешењима за кориснике. Поред тога, добављачи услуга наћи ће боља решења, чинећи инсталацију и одржавање мање експанзивним.