Учење ојачања може пружити лијеп динамички окрет маркетингу

Садржај

Шта је појачано учење?
Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот
Машине за маркете
Долази ускоро
Тхинкинг Биггер
Пут ка усвајању

Извор: Јулиатимцхенко / Дреамстиме.цом

Одузети:

Ојачавање учења је подскуп вештачке интелигенције и машинског учења који може предвидјети исходе и помоћи корисницима да донесу боље одлуке.

Продавци на тржишту непрестано траже скалабилна и интелигентна решења када покушавају да остваре предност у све конкурентнијим маркетиншким условима. Није чудо што вештачка интелигенција (АИ) и машинско учење (МЛ) сада масовно усвајају брендови и њихове маркетиншке организације. (Да бисте сазнали више о основама МЛ-а, погледајте машинско учење 101.)

За неупућене, АИ се уопштено може сматрати технологијом када рачунар аутоматизује дефинисане задатке које би иначе обављао човек. Машинско учење, као функционално подручје унутар АИ-ја, јесте када је рачунару постављен крајњи циљ, али он мора сам да израчуна најбољи пут.

Данас видимо ове технологије - посебно машинско учење - распоређене у многим областима маркетинга, укључујући откривање превара огласа, предвиђање понашања потрошача, систем препорука, креативну персонализацију и још много тога.

Иако је то све добро и добро, постоји нова технологија која пуца изван тржишта, која ће, за маркете, уистину испоручити на захтев који ствара машинско учење. То се назива „учење ојачања“ (РЛ).

Шта је појачано учење?

Прелазак са МЛ на РЛ корак је више од слова. Већина задатака предатих машинском учењу укључује употребу једног корака, попут „препознати ову слику“, „разумети садржај књиге“ или „ухватити превару“. За маркетингу је пословни циљ као што је „привлачење, задржавање и ангажовање корисника“. својствено више-степени и дугорочни, а није лако постићи машинским учењем.

Овде долази учење ојачања. РЛ алгоритми се односе на оптимизацију за неко несметано путовање које се стално мења - оно где се јављају динамични проблеми. Употребом математичке „функције награђивања“ за израчунавање резултата сваке пермутације, РЛ може сагледати будућност и упутити прави позив.

Данас се најбоље реализације ове врхунске технологије могу видети у играма и особним возилима. Када је Гооглеов АлпхаГо систем прошле године победио најбољег светског играча у друштвеној игри Го то прошле године, њихов тајни сос био је учвршћење учења. Док су игре поставиле правила, играчеве могућности за пут ка победи се динамично мењају на основу стања плоче. Са учењем ојачања систем рачуна за све могуће пермутације које се могу мењати на основу сваког следећег потеза.

Слично томе, аутомобил који се вози самостално креће на пут у коме правила пута и локација одредишта остају фиксна, али се променљиве на путу - од пешака до блокова пута до бициклиста - динамички мењају. Зато ОпенАИ, организација коју је основао Теслин Елон Муск, користи напредне РЛ алгоритме за своја возила.

Без грешака, без стреса - Ваш корак по корак водич за креирање софтвера за промену живота без да вам уништи живот

Не можете побољшати своје вештине програмирања када никога није брига за квалитет софтвера.

Машине за маркете

Шта све ово значи за трговце?

Основне изазове многих трговаца ствара чињеница да се стање пословања стално мења. Побједничка стратегија кампање може с временом постати неугодна, док стара стратегија може стећи нову привлачност. РЛ је корак ка опонашању праве људске интелигенције на којој учимо из успеха и / или неуспеха вишеструких исхода и обликујемо победничку стратегију будућности. Дозволите ми да дам неколико примера:

1. Побољшање корисничког ангажмана

Усредсредимо се на ангажовање купаца у ланцу ресторана, а циљ је да га десет пута помножимо током наредне године. Данас би маркетиншка кампања могла да укључи рођенданску честитку са попустом, можда чак и на основу преференција према храни. Ово је линеарно размишљање где је продавац одредио почетну и крајњу тачку.

Живот купаца се у ужурбаном свету непрестано мења у стварном времену - понекад су више ангажовани, понекад мање. Код учења ојачања систем би се непрестано рекалибрирао које тактике у маркетиншкој оружари у било којем тренутку представљају најбоље шансе да примаоца крене ка крајњем циљу 10к ангажовања.

2. Динамична алокација буџета

Замислите сада сценариј оглашавања у којем имате буџет од милион долара и требате их потрошити сваки дан до краја месеца, а распоређујемо на четири различита канала: ТВ, промоције лојалности и Гоогле. Како можете осигурати да трошите буџет на најоптималнији начин? Одговор зависи од дана, циљаних корисника, цене залиха и низа других фактора.

У учењу ојачања алгоритми би користили историјске податке о резултатима огласа за писање функција награђивања које одређују одређене одлуке о потрошњи. Али такође узима у обзир факторе у реалном времену као што су цене и вероватноћа позитивног пријема од стране циљане публике. Кроз итеративно учење, распоређивање потрошње огласа током месеца динамично би се променило. Иако је крајњи циљ постављен, РЛ ће доделити буџет на најбољи могући начин кроз све сценарије. (За више информација о АИ у маркетингу погледајте како ће вештачка интелигенција револуционарати продајну индустрију.)

Долази ускоро

Ојачавање учења признаје сложеност и препознаје да су људи хетерогени и објашњава те истине, побољшавајући сваку следећу радњу током времена како се делови вашег одбора за игре мењају око ње.

Учење ојачања је и даље у великој мјери очување истраживачких пројеката и водећих усвајања. Концепт и техника математике постоје већ више од 40 година, али није их било могуће применити до недавно, захваљујући три тренда:

Ширење рачунарске снаге путем моћних графичких процесорских јединица (ГПУ-а).
Цлоуд рачунарство омогућава врхунску снагу процесора доступном за делић трошкова куповине самих ГПУ-а, омогућавајући трећим лицима да изнајме ГПУ како би тренирали свој РЛ модел неколико сати, дана или недеља по релативно повољној цени у подруму.
Побољшање било нумеричких алгоритама, било паметне хеуристике. Неколико критичних нумеричких корака у РЛ алгоритму сада су у стању да се конвергирају много бржим темпом. Без ових магичних нумеричких трикова, они још увек не би били изведиви чак и са данашњим најмоћнијим рачунарима.

Тхинкинг Биггер

Све ово значи да ће нове моћи учења ојачања ускоро бити доступне на нивоу бренда и трговаца. Међутим, за прихватање тога биће потребан помак у размишљању. За маркетинг менаџера ова технологија значи способност скидања руку са управљача.

Сваки посао има циљ, али када сте дубоко у рововима, свакодневне радње подузете у том циљу могу постати нејасне. Сада РЛ технологија омогућава доносиоцима одлука да поставе циљ, имајући више поверења да ће системи планирати свој најбољи пут ка њему.

На примјер, у оглашавању, многи људи данас схватају да су метрике попут кликовног постотка (ЦТР) само посредници за стварне пословне резултате који се рачунају само зато што се могу рачунати. Маркетиншки системи вођени РЛ-ом де-нагласит ће такве посредничке метрике и сва велика повећања која су с њима повезана, омогућавајући шефовима да се фокусирају на циљеве.

Ово ће захтијевати да предузећа размишљају о својим великим проблемима на много проактивнији и дугорочнији начин. Када технологија постане зрела, они ће постићи свој циљ.

Пут ка усвајању

Учење ојачања још није спремно за употребу у робној мери од стране марки; међутим, трговцима би требало времена да схвате овај нови концепт који би могао револуционирати начин на који брендови продају, добро се сналазе на неким раним обећањима машинског учења.

Када дође до снаге, доћи ће у маркетиншки софтвер са корисничким интерфејсом, али задаци који захтевају тај софтвер биће радикално поједностављени. За особље ће бити мање помичних прекидача и уноса бројева, као и мање читања аналитичких извјештаја и дјеловања на њих. Иза арматурне плоче алгоритам ће управљати већином тога.

Мало је вероватно да РЛ може да се усклади с људском интелигенцијом одмах кроз капију. Брзина његовог развоја зависила би од повратних информација и сугестија које нуде трговци. Морамо осигурати да тражимо од рачунара да реши прави проблем и кажњавамо га када то не учини. Звучи као како бисте научили своје дете, зар не?