Учење ојачања

Садржај

Дефиниција - Шта значи ојачавање учења?
Увод у Мицрософт Азуре и Мицрософт Цлоуд | Кроз овај водич научићете о томе шта се рачуна у облаку и како вам Мицрософт Азуре може помоћи да мигрирате и покренете посао из облака.
Техопедиа објашњава ојачавање учења

Дефиниција - Шта значи ојачавање учења?

Ојачавање учења, у вези са вештачком интелигенцијом, је врста динамичког програмирања која тренира алгоритме користећи систем награде и казне.

Алгоритам учења или агента за појачавање учи интеракцијом са окружењем. Агент прима награде ако правилно обавља и казне за погрешно обављање. Агент учи без интервенције од стране човека тако што максимизира своју награду и минимизира казну.

Увод у Мицрософт Азуре и Мицрософт Цлоуд | Кроз овај водич научићете о томе шта се рачуна у облаку и како вам Мицрософт Азуре може помоћи да мигрирате и покренете посао из облака.

Техопедиа објашњава ојачавање учења

Ојачавање учења је приступ машинском учењу који је инспирисан бихевиористичком психологијом. То је слично начину на који дете учи да обавља нови задатак. Ојачавање учења се разликује од других приступа машинском учењу по томе што алгоритму није изричито речено како да извршава задатак, већ делује кроз проблем сам.

Као агент, који би могао бити ауто који се вози или програм који игра шах, комуницира са окружењем, добија наградно стање у зависности од начина извођења, попут сигурне вожње до одредишта или побједе у игри. Супротно томе, агент добија казну за погрешно обављање послова, као што је излазак са пута или потврђивање.

Агент с временом доноси одлуке како би повећао своју награду и смањио казну користећи динамичко програмирање. Предност овог приступа вештачкој интелигенцији је у томе што омогућава програму АИ да учи без да програмер прецизира како агент треба да обавља задатак.