5 најбољих пракси за аутоматизацију управљања већим инцидентима

Аутор: Roger Morrison
Датум Стварања: 27 Септембар 2021
Ажурирати Датум: 21 Јуни 2024
Anonim
Руководства по Google Рекламе: настройка кампании с максимальной эффективностью
Видео: Руководства по Google Рекламе: настройка кампании с максимальной эффективностью

Садржај



Извор: Пиктум / иСтоцкпхото

Одузети:

Помоћу стратегије паметне аутоматизације одговор на инцидент можете учинити бржим и једноставнијим него икад - минимизирајући застој и потенцијално кршење сигурности.

Велики ИТ инциденти дешавају се унутар компанија сваког дана. Иако само неколицина наслова чини догађаје попут прекида рада и нарушавања сигурности може озбиљно осакатити продуктивност запослених, негативно утицати на перцепцију купаца и што је најважније, резултирати изгубљеним приходом.

Када је реч о управљању великим информатичким инцидентима, најбоље је да се фокусирате на пословни утицај и суштину. Према Институту Понемон, просечна цена застоја у 2016. била је 8 851 УСД по минути - што износи преко 500 000 УСД на сат, а типични прекиди просека су више од 90 минута. А ово је само непосредни трошак! Дугорочнији утицај попут оштећења репутације и оштећења купаца су непредвидиви и потенцијално катастрофални.

Иако не можете у потпуности да избегнете све веће инциденте, можете наоружати своју организацију да буде што спремнија да се бори са њима кад настану. А главна компонента ваше стратегије требало би да буде укључивање аутоматизације. Организације које максимално користе аутоматизацију у главним процесима решавања инцидената постижу брже обнављање сервиса и много мањи број грешака услед људске грешке. То је зато што аутоматизација директно утиче на вашу способност да смањите трајање временског оквира утицаја на пословање - или на тај скуп период у којем ваши корисници и пословне операције заиста осећају утицај инцидента. (Да бисте сазнали више о аутоматизацији, погледајте одељак Аутоматизација: Будућност науке о подацима и машинском учењу?)


Да бисте максимално искористили предности аутоматизације, требали бисте испитати које активности треба да се одвијају током ударног прозора и схватите како пребацити све остале активности било пре почетка инцидента или након што се посао врати у уобичајено пословање. Ево пет корисних начина да започнете.

1. Развити и дефинисати процес

Дефинисање главног процеса управљања инцидентима значи прецизирање онога што се може планирати, координирати или извршити током инцидента. То може значити, на примјер, идентификовање кључних чланова тима за подршку на основу вештина и распореда, тако да ваш сервисни стожер може да их ангажује што брже и ефикасније. То такође значи смислити начин на који ћете пренијети релевантне информације свом тиму како би они могли одмах почети да рјешавају проблем, као и информисање и ажурирање правих дионика.

Аутоматизација је критична за кључне аспекте овог процеса. На пример, можете аутоматизовати укључивање релевантних информација из алата за надгледање у улазнице вашег сервисног стола или укључити информације са сервисног стола у обавештења разрешивача инцидента. Такође можете да документујете цео инцидент у једном извору свеобухватне истине који је свима доступан. Имајте на уму да овај поступак можете вежбати да бисте га исправно уредили - не требате чекати инцидент у стварном свету да бисте тестирали свој приступ.


2. Исправите своју инфраструктуру исправно

У овом дану и старости од умора од упозорења, кључно је да не наставите да бомбардујете своје тимове небитним обавештењима и информацијама које се на њих не односе. Примјена филтера на ваше упозорења о надгледању омогућиће вашим тимовима да лакше уђу у иглу у пласту сена рутинске буке. Ово је кључно за чињеницу да су сви ваши увиди и подаци заиста дјелотворни, а не само додавање преоптерећености информацијама.

Добри начини за аутоматизацију укључују коришћење АПМ решења за индексирање свих ваших апликација и система како би се проактивно утврдили основни узроци на тачки било какве деградације перформанси, пре него што је проузроковало велике прекиде у услугама. Такође можете да интегришете свој надзорни, услужни сто, апликације за колаборацију и алате за ћаскање да бисте разменили заједничке информације у реалном времену.

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје програмирање кад никога није брига за квалитет софтвера.

3. Тачно измерите МТТР

Како мерите средње време поправке (МТТР)? Да ли га заснивате на укупном времену ангажовања ИТ тимова или на укупном времену на који посао заиста утиче? Ако је ваш одговор први, требало би да размислите о мерењу утицајног прозора користећи пословну перспективу. То је много тачнији корак за ваше напоре на оптимизацији, јер је ваш циљ да минимизирате утицај инцидената, а не да једноставно представите боље извештаје о одзивању на вашем одбору. (Да бисте сазнали више о станкама и начину на који се поступа, погледајте шта значи тачно време између квара заиста.)

Можете да аутоматизирате пружајући потпуну видљивост апликацијама како бисте ретроактивно "покренули сат" ако је потребно и сачували пуну евиденцију својих активности и комуникација на разрешавању ради анализе и ревизије како бисте побољшали своје процесе.

4. Обавештавајте заинтересоване стране - али без прекида резолуције

Заинтересиране стране очекују ефикасну и правовремену комуникацију, истовремено очекујући да стручњаци за теме остану фокусирани на ласерско обликовање проблема. Иако бисте могли да одредите контактну тачку за надгледање и ангажовање пословних корисника, ефикаснија стратегија би била креирање веб странице за самопослуживање са ажурирањима статуса. Ово омогућава актерима да се сами провере без бомбардовања вашег тима даљим позивима. Сјетите се да редовно ажурирате своје дионике како би они увијек добијали и знали очекивати најновији извјештај о статусу. Не заборавите да комуникација не сме да престане само зато што је услуга обновљена! Важно је да актери добију резиме онога што се догодило, што се сазнало и како се ситуација може спречити у будућности.

Аутоматизација се у овом случају може имплементирати за креирање аутоматске странице са статусом у стварном времену за заинтересоване стране, као и за прављење наредбених коса у ваш алат за ћаскање ради ажурирања те странице.

5. Прикупите податке за подршку решавању проблема

Враћање услуге не представља крај управљања инцидентима! У ствари, неке од највреднијих активности догађају се након решавања. Прикупљањем дијагностичких података и података о утицају и анализом узрока узрока, можете извршити потпуну ревизију великог инцидента која укључује постављање превентивних мера како би се избегли слични инциденти у будућности. Поред тога, чак и ако се поново догоди препознатљиви инцидент, можете креирати дефинирану процедуру за врсте података које требате прикупити и кораке који су потребни за рјешавање проблема. На овај начин се ваш тим једноставно мора односити на контролни списак и усредсредити се на свој основни циљ обнове услуге, а не да се брине шта ће им требати и када.

Овде аутоматизација може снимити и сачувати активности резолуције, укључујући ствари као што су транскрипти ћаскања, у јединственом систему записа за анализу. Поред тога, помоћи ће вам да саставите каталог познатих инцидената или проблема, учврстите најбоље праксе за сваки од њих, а тиме и повећате брзину решења у будућности.

Закључак: Аутоматизирати паметније, не више

Будите упозорени да већа аутоматизација није нужно бољи приступ! Важније је да разумете када, где и како повезати своје ИТ системе да подрже управљање инцидентима. Не желите да додате никакве непотребне сложености ради повећања аутоматизованих процеса. Запамтите да је циљ да поједноставите и обједините операције што је више могуће како би се ваши тимови осећали оснаженима за ефикасно решавање проблема. Реч је о интелигентном спровођењу аутоматизације како би се олакшао добро координисан скуп процеса, знање особља и ефикасна комуникација са заинтересованим странама, како би се минимизирао укупни утицај већих инцидената на пословање.