
Основное отличие представленной самообучающейся программы от аналогов заключается, как заметил автор опубликованного на YouTube ролика, в том, что до первой попытки пройти уровень она не имела игрового или какого-либо другого опыта. Искусственный интеллект даже не знал цели игры и не представлял, какой именно требуется результат.
Принцип действия программы оказался основан на переборе возможных вариантов — искусственный интеллект пробовал различное поведение в игре. Удачные шаги сохранялись и в точности повторялись в следующих попытках. Проигрышные пополняли список неудачных и больше не применялись.
Автор алгоритма, управляющего развитием искусственного интеллекта, признает, что смена уровня приведет к необходимости очередного обучения. Программа не реагирует на окружающую среду, а выполняет определенные действия в заданные промежутки времени. Однако он не оставляет надежды, что вскоре от этого недостатка удастся избавиться. В дополнение к видеоролику, объясняющему принципы работы самообучающейся программы, программист опубликовал ее исходный код.
Комментарии (0)