Зашто је Хадооп савршена утакмица за секвенцирање генома

Аутор: Roger Morrison
Датум Стварања: 19 Септембар 2021
Ажурирати Датум: 5 Може 2024
Anonim
Зашто је Хадооп савршена утакмица за секвенцирање генома - Технологија
Зашто је Хадооп савршена утакмица за секвенцирање генома - Технологија

Садржај


Извор: А3701027 / Дреамстиме.цом

Одузети:

За секвенцирање генома потребне су снажне технолошке алатке за обраду свих његових података, а Хадооп је до краја задатка.

Клиничка геномика је фасцинантна тема, где људи раде на врхунским технологијама да би се обрадили брзи и тачни резултати. На тржишту је доступно мноштво секвенцијских генома, који производе петабајте података о секвенци, а раст секвенцирања ће у блиској будућности произвести екстрабајт података. Овде је Хадооп савршена платформа за обраду сложеног рада из геномике. Хадооп може да складишти и сортира огромне количине информација и такође може да направи смислену анализу. (Да бисте схватили колико података заиста укључује, прочитајте Разумевање битова, бајтова и њихових вишеструких.)

Садашњост и будућност геномике

Данас је мапирање генома достигло врхунац. Многи људи повезани са геномичком индустријом пуне су радозналост, а како се представљају нове могућности, боља технологија је потреба сата. Секвенцирање генома је врло понављајући задатак који захтијева много ресурса. Само у 2013. години произведено је око 15 петабајта података, а само 2.000 секвенера. Овај износ који испада из чељусти укључује 300 КБ секвенционираних података о људском геному. Овом брзином производње података може се проценити да ће до 2018. године бити произведено отприлике једно претјерано бајт података. То ће бити последица раста секвенци, који ће производити све више и више података по вожњи. Други разлог је појава изузетно моћних и јефтиних машина за секвенцирање генома. Од 2008. цена ових машина непрестано опада. То је због моћних машина нове генерације које су се пласирале на тржиште.


Потребе индустрије за мапирање генома

Комплексни алгоритми се користе за обраду података који су прикупљени из људског генома. Затим, ове информације је потребно похранити. Он ће се можда прегледати у будућности ради поређења са оригиналним подацима. Задатак обраде и складиштења 100 ГБ података није превише тежак, поготово када то радите са моћним машинама које раде у центрима за секвенцирање. Студије показују да се та количина података може обрадити у само око 1.000 ЦПУ сати, па је то врло лако. Овом брзином техничког напретка очигледно је да ће индустрија генома ускоро обрадити хиљаде гигабајта за само неколико секунди.

Међутим, технике управљања и складиштења података не развијају се тако брзо, због чега се може очекивати велики губитак драгоцених података. Ово је заиста непожељно, јер ће озбиљно ометати напредак остварен у људској геномици. Дакле, потреба за ефикасном техником управљања подацима, која се лако ажурира, веома је велика. Ово може бити ефикасно посебно у блиској будућности, где ће се мапирање генома преместити из великих лабораторија са моћним рачунарима у мале болнице и лабораторије.


Шта се очекује у решењу?

Темпо којим се откривају и развијају нове технике секвенцирања генома изузетно је висок. Овај темпо може бити од користи медицинској науци у облику снажног корака ка искорјењивању главних болести. Међутим, и овај темпо може бити веома изазован.

Изазов долази у облику управљања великим количинама података добивених пројектима који слиједе. Дакле, потребно је ефикасно решење које ће помоћи у складиштењу и обради великих података. Ово решење мора бити јефтино и брзо, а истовремено прилагодљиво. Анализа пружена овим решењем мора такође бити тачна и константна. Па, шта је решење проблема? Несумњиво да је то Хадооп. (За више информација о коришћењу Хадоопа, погледајте 5 Увида у велике податке (Хадооп) као услуге.)

Зашто је Хадооп најбоље решење за секвенце генома

Оно што треба геномичкој индустрији је врхунско решење које им може помоћи да ефикасно управљају подацима, обрађују их и чувају за будућу употребу. Чини се да је ово решење савршено подударање са Хадооп софтвером. Дакле, Хадооп се може сматрати савршеним софтвером за управљање великим подацима који може у великој мери побољшати тренутне технике чувања података геномичке индустрије.

Хадооп-ове могућности у стварном времену омогућавају секвенцијалима генома да анализирају и складиште велике количине података одједном у стварном времену. То такође омогућава будућу употребу података. Хадооп може победити многе наслеђене системе, јер је много бржи и поузданији од њих.

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје вештине програмирања када никога није брига за квалитет софтвера.

Шта још може Хадооп?

Захваљујући Хадоопу, отворио се велики број могућности и могућности на пољу геномике и секвенцирања гена. Хадооп нуди паралелне могућности рачунања због којих је могуће брже секвенцирање. Такође, помоћу Хадооп функције МапРедуце, ​​велики број гена може се врло лако пресликати. Због тога ће секвенцирање са Хадооп-ом заиста постати „нект-ген“ и биће много мање компликовано.

Прилике за Хадооп

Хадооп има неколико могућности у индустрији генома, али најбоља је изведена из чланка Линде Цхин „Утврђивање података о геномским подацима рака“, у часопису Генес & Девелопмент. У овом чланку она говори о томе како је савремена геномика отворила нова врата, а то је довело до многих позитивних резултата попут открића геномских информација о раку. Због тога смо ближе откривању самог лека за рак. Међутим, за ово је потребно мало више пажње и моћна апликација за управљање подацима ради боље истраживачке способности на терену. Ово је најбоља прилика за Хадооп да докаже своју брзину, снагу и тачност.

Самострел: Платформа за управљање подацима нове генерације

Самострел, који је софтверски део намењен анализи прекомерног секвенцирања генома, једно је од најбољих решења. То је резултат интеграције унутар Хадоопа, између брзог алгоритма за поравнавање секвенционираних података, који се назива Бовтие, и моћног алгоритма који упоређује и испитује секвенциране податке, тј. Генотипера названог СоапСНП. Изграђен је на Апацхе Хадооп-у и заснован је на имплементацији МапРедуце оквира. Самострел је преносив, скалабилан и погодан је и као алат за рачунарско коришћење у облаку.

Овом моћном интеграцијом комплетан геном може се испитати за само један дан на локалном кластеру који има 10 чворова. Са кластером од 40 чворова процес је још бржи и завршава се за само три сата, са укупним трошковима мањим од 100 УСД! Студија проведена да се испита тачност Цроссбов-а показала је да може упоредити сваки геном са 99 посто тачности. Још једна корисна карактеристика Цроссбов-а је да се покреће у облаку. Тако ће самострелица омогућити хиљадама будућих секвенцијалних центара, попут болница, да секвенцирају велике количине података о геному без потребе за моћним, скупим рачунарима и технологијом.

Остали софтвер Геномицс темељен на Хадооп-у

Многе компаније су препознале моћ Хадоопа у промени света геномике. Прикладно су модификовали Хадооп како би искористили његов потенцијал за напредне секвенце генома. Неколико примера познатих решења за секвенцирање генома заснованих на Хадооп-у је дато у наставку:

  • Хадооп-БАМ: Ово је моћан алат за управљање подацима који користи МапРедуце функцију Хадооп-а за разне активности повезане са геномиком, попут генотипизације. Ово функционише у формату Бинарно поравнавање / Мапа.
  • Цлоудбурст: Ово решење засновано на Хадоопу је креирано 2009. године. Изузетно је ефикасно у поређењу секвенци генома и мапирању појединих гена. Ово је такође једна од првих апликација заснованих на Хадооп-у дизајнирана за ову сврху.

Закључак

Интеграција великих података и индустрије геномике показује се благодатом у модерном времену. Ове платформе су ефикасне у откривању лечења неколико болести попут рака. Подаци који се проналазе мапирањем генома могу се користити за формулацију превентивних информација о таквим болестима. Појава великих података може се сматрати прекретницом у свету геномике, а ако се информације употребљавају мудро, онда можда и у ширем пољу здравства. Једини начин да ово поље напредује је употреба одговарајућих алата за управљање подацима као што је Хадооп.