АлпхаГо

Видео: AlphaGo - The Movie | Full award-winning documentary

Садржај

Дефиниција - Шта значи АлпхаГо?
Увод у Мицрософт Азуре и Мицрософт Цлоуд | Кроз овај водич научићете о томе шта се рачуна у облаку и како вам Мицрософт Азуре може помоћи да мигрирате и покренете посао из облака.
Техопедија објашњава АлпхаГо

Дефиниција - Шта значи АлпхаГо?

АлпхаГо је уски АИ, рачунарски програм који је развио Гоогле ДеепМинд за играње Го, кинеске стратешке табле за два играча слична шаху. АлпхаГо је први програм АИ који је у октобру 2015. године успео да победи професионалног човека, 2-дан играча Фан Хуи-а, на плочи пуне величине без икаквих хендикепа. Потом је у марту 2016. године победио једног од највише рангираних људских играча на свету, 9-дана Лее Седол, победивши четири од пет утакмица.

Увод у Мицрософт Азуре и Мицрософт Цлоуд | Кроз овај водич научићете о томе шта се рачуна у облаку и како вам Мицрософт Азуре може помоћи да мигрирате и покренете посао из облака.

Техопедија објашњава АлпхаГо

Пројект АлпхаГо започет је 2014. године као тестни лежај како би се утврдило колико се алгоритам неуронске мреже Гоогле ДеепМиндс који користи дубоко учење може такмичити у програму Го. Алгоритам за АлпхаГо је комбинација претраживања стабала и техника машинског учења и ојачан опсежном обуком како људи тако и других рачунарских играча. Користи Монте Царло стабло претраживања и води га политика и вредносна мрежа, имплементирана коришћењем технологија дубоке неуронске мреже. Мрежа политика је обучена и помаже АИ да предвиди следећи потез који ће највероватније победити, док је мрежа вредности обучена за сужавање стабла претраживања и одређивање вредности тих позиција, процењујући победнике на свакој позицији, а не претражујући скроз доле до краја игре.

АлпхаГо је прво храњен историјским потезима мечева од људских играча, користећи базу података од око 30 милиона потеза, чинећи то опонашајући људске игре. Једном када је АИ достигао ниво стручности, додатно је оспособљен тако што је играо против случајева себе, користећи учење појачања за побољшање и учење више.

Октобра 2015., дистрибуирана рачунарска верзија АлпхаГо-а играла је и победила Фан Хуи-а, два дана европског првака у Го-у, обележивши први пут да је рачунарски програм победио професионалног играча на Го-у. Фан Хуи је тада неколико месеци након пораза помагао као консултант за тим ДеепМинд-а. У марту 2016. године АлпхаГо је повео против Лее Седол, једног од најплаћенијих играча света, постигавши највиши ниво од 9 дана. Освајањем четири игре у Леес 1, ово је означило велики помак у АИ истраживању јер је то значило да се алгоритам дубоког учења и неуронских мрежа који користи ДеепМинд може користити у било које друге сврхе, јер у ствари није програмиран за играње Го, већ је подучаван како играти Го. Ово отвара сасвим нови свет за АИ истраживање.