Наука података или машинско учење? Ево како уочити разлику

Видео: Компьютер и Мозг | Биология Цифр 01

Садржај

Наука података и машинско учење: широка и уска терминологија
Сетови вештина података и вештина машинског учења
Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот
Како уочити машинско учење
Две резовне дисциплине

Извор: Елнур / Дреамстиме.цом

Одузети:

Наука података и машинско учење су различити на кључне начине. На неки начин, једно се може посматрати као подскуп другог. Обоје су важни у тренутном напретку у ИТ.

У овом новом свету вештачке интелигенције и управљања подацима лако је збунити се неким терминима који се најчешће користе у ИТ свету.

На пример, наука о подацима и машинско учење имају много везе једно са другим. Није изненађујуће да би многи људи који само познају те дисциплине имали проблема схватити у чему се разликују једна од друге.

Ево најбољег начина за одвајање науке о подацима од машинског учења, као принципа и као технолошког приступа.

Наука података и машинско учење: широка и уска терминологија

Пре свега, наука о подацима је заиста широка, свеобухватна категорија технологије која обухвата много различитих врста пројеката и креација. (За више информација о ономе што је укључено у посао науке о подацима, погледајте Јоб Роле: Дата Сциентист.)

Наука података у суштини је пракса рада са великим подацима. Појавило се како је Моореов закон и ширење ефикаснијих уређаја за складиштење довело до огромних количина података које прикупљају компаније и друге странке. Тада су велике платформе података и алати попут Хадоопа почели да редефинишу рачунарство мењајући начин управљања подацима. Сада, са облаком и контејнеризацијом, као и потпуно новим моделима, велики подаци постали су главни покретач начина на који радимо и живимо.

У свом најједноставнијем облику, наука о подацима је начин на који управљамо тим подацима, од њиховог чишћења и рафинирања до употребе у облику увида.

Дефиниција машинског учења је много ужа. У машинском учењу технологије узимају податке и стављају их кроз алгоритме, како би симулирали људске когнитивне процесе описане као "учење." Другим речима, рачунаром је омогућено да пружи сопствене резултате, узимајући у обзир податке и обучавајући их. , где се чини да се технологија научила из процеса које програмери постављају.

Сетови вештина података и вештина машинског учења

Други начин да се супротстави наука о подацима и машинско учење је сагледавање различитих вештина које су највредније за професионалце у било којој од ових области.

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје вештине програмирања када никога није брига за квалитет софтвера.

Постоји општи консензус да научници са подацима уживају дубоке аналитичке и математичке вештине, практично искуство са технологијама база података и знање програмских језика као што је Питхон или други пакети који се користе за рашчлањивање великих података.

„Свако ко је заинтересован за изградњу снажне каријере у (наука о подацима) треба да стекне кључне вештине у три одељења: аналитика, програмирање и знање о домену“, пише Срихари Сасикумар из Симплилеарн-а. „Ако дубље зађете један ниво, следеће вештине ће вам помоћи да направите нишу као научник података: Снажно знање Питхон-а, САС-а, Р (и) Сцале, практично искуство у кодирању СКЛ базе података, способност рада са неструктуираним подацима из различити извори попут видео и друштвених медија, разумеју више аналитичких функција (и) знање машинског учења. "

На страни машинског учења стручњаци често наводе вјештине моделирања података, вјероватноће и статистичко знање и шире вјештине програмирања као корисне алате у приручнику алата за машинско учење.

Како уочити машинско учење

Овде је кључно да све врсте ствари обухватају науку о подацима, али то није машинско учење ако немате строго постављен режим који ће помоћи рачунару да учи из његових улаза.

Кад је то на месту, то омогућава неким изненађујуће способним системима који могу имати широке утицаје на наш живот.

„Много онога што радимо са машинским учењем догађа се испод површине“, наводно је рекао оснивач Амазона, Јефф Безос, истичући неке од примена ових врста система. „Машинско учење покреће наше алгоритме за предвиђање потражње, рангирање претраживања производа, препоруке за производе и понуде, пласмане робе, откривање превара, преводе и још много тога. Иако мање видљив, велики део утицаја машинског учења имаће ову врсту - тихо али значајно побољшавајући основне операције. "

Један од најкориснијих примера овде је појава неуронске мреже - то је уобичајена и популарна метода подешавања процеса машинског учења.

У свом најосновнијем облику, неуронска мрежа се састоји од слојева вештачких неурона. Сваки појединачни вештачки неурон има функцију еквивалентну биолошком неурону - али уместо синапси и дендрита, он има улазе, функцију активирања и евентуалне излазе.

Неуронска мрежа направљена је да делује као људски мозак, а професионалци за машинско учење често користе овај модел да би створили резултате машинског учења.

Међутим, то није једини начин машинског учења. Неки више рудиментарних пројеката машинског учења једноставно укључују показивање рачунару широк спектар фотографија (или га опскрбљују другим необрађеним подацима), уношење идеја кроз процес коришћења надзираног машинског учења и података о етикетама и омогућавање да рачунар на крају буде у стању да разликује разни облици или предмети у визуелном пољу. (За основе машинског учења, погледајте Машинско учење 101.)

Две резовне дисциплине

Закључно, машинско учење је вредан део науке о подацима. Али, наука о подацима представља границу ватера и конволуцију у којој се одвија машинско учење.

На неки начин можете рећи да се машинско учење никада неће догодити без великих података. Велики подаци сами по себи нису створили машинско учење - уместо тога, након што смо заједно сакупили толико података да скоро нисмо знали шта да радимо са тим, врхунски умови смислили су ове процесе био-симулирања надуван начин пружања увида.

Још једна добра ствар коју овде треба имати на уму је да се наука о подацима може применити на два главна начина - можемо пригрлити машинско учење и вештачку интелигенцију, препуштајући рачунарима да мисле за нас, или можемо да вратимо науку података на приступ који је више усмерен на људе где рачунар једноставно представља резултате и ми као људи доносимо одлуке.

То води неке стручњаке, укључујући неке од данашњих најбољих иноватора, који траже живахније рачуноводство начина на који користимо ове технологије.

"(АИ) је способан за много више него што готово сви знају и стопа побољшања је експоненцијална", цитиран је Елон Муск, упозоравајући да машинско учење и АИ програми захтевају надзор.

У сваком случају, и наука о подацима и машинско учење основни су део напретка који данас као друштва остварујемо у технологији.