sarsa-lambda

MorvanZhou / Reinforcement-learning-with-tensorflow

#计算机科学#Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

reinforcement-learning 教程 q-learning sarsa sarsa-lambda deep-q-network a3c ddpg policy-gradient dqn double-dqn dueling-dqn deep-deterministic-policy-gradient actor-critic Tensorflow proximal-policy-optimization ppo 机器学习

Python 9.3 k

1 年前

chen0040 / java-reinforcement-learning

Package provides java implementation of reinforcement learning algorithms such Q-Learn, R-Learn, SARSA, Actor-Critic

reinforcement-learning q-learning sarsa sarsa-lambda actor-critic Java

Java 129

6 年前

DavidMouse1118 / Reinforcement-Learning-Maze-World

SARSA, Q-Learning, Expected SARSA, SARSA(λ) and Double Q-learning Implementation and Analysis

reinforcement-learning q-learning sarsa-lambda

Python 29

6 年前

NeymarL / Pacman-RL

Implement some reinforcement learning algorithms, test and visualize on Pacman.

reinforcement-learning pacman q-learning sarsa-lambda policy policy-gradient actor-critic

Python 28

7 年前

moripiri / Reinforcement-Learning-on-FrozenLake

Reinforcement Learning Algorithms in FrozenLake-v1

reinforcement-learning openai-gym reinforcement-learning-algorithms actor-critic q-learning reinforce sarsa sarsa-lambda

Jupyter Notebook 25

7 个月前

leofansq / Reinforcement_Learning_Curling

基于强化学习(RL)的冰壶游戏实例; 梯度下降的Sarsa(lambda) + 非均匀径向基特征表示

reinforcement-learning sarsa-lambda Demo

Python 22

5 年前

leolellisr / poke_RL

Code repository with classical reinforcement learning and deep reinforcement learning methods for Pokémon battles in Pokémon Showdown.

pokemon reinforcement-learning sarsa-lambda function-approximation game dqn double-dqn ppo ppo2 deep-reinforcement-learning deep-rl reinforce pokemon-showdown

Jupyter Notebook 14

10 个月前

RicardoDominguez / RL-Intro

Introduction to Reinforcement Learning in Python

reinforcement-learning reinforcement-learning-algorithms sarsa sarsa-lambda q-learning actor-critic tree-search

Python 13

7 年前

timbmg / easy21-rl

Easy21 assignment from David Silver's RL Course at UCL

reinforcement-learning reinforcement-learning-excercises function-approximation rl sarsa sarsa-lambda

Python 11

7 年前

imraviagrawal / Reinforcement-Learning-Implementation

Implementation of Reinforcement Algorithms from scratch

reinforcement-learning blackbox-optimization sarsa q-learning sarsa-lambda actor-critic-algorithm reinforce

Python 9

7 年前

wikke / Reinforcement_Learning

Series of Reinforcement Learning: Q-Learning, Sarsa, SarsaLambda, Deep Q Learning(DQN)；一些列强化学习算法，玩OpenAI-gym游戏

dqn deep-q-learning deep-q-network reinforcement-learning openai-gym q-learning sarsa sarsa-lambda

Python 9

8 年前

Pegah-Ardehkhani / Shortest-Path-using-Reinforcement-Learning

Solve the shortest path problem using Reinforcement Learning. This project applies RL techniques, such as Q-learning and SARSA(λ), to find optimal routes in a weighted graph, where the algorithm learn...

q-learning reinforcement-learning reinforcement-learning-algorithms sarsa sarsa-lambda

Jupyter Notebook 5

9 个月前

nilskruse / mdp

Markov decision process master thesis

markov-decision-processes q-learning reinforcement-learning reinforcement-learning-algorithms reinforcement-learning-environments Rust sarsa sarsa-lambda

Rust 3

2 年前

weiyx16 / RL_Toy_Example

Deep RL toy example based on gym package with several methods

gym sarsa sarsa-lambda a2c a3c

Python 3

6 年前

klima7 / Reversi-RL

Reversi game with multiple reinforcement learning algorithms.

mcts q-learning reinforcement-learning sarsa sarsa-lambda

Python 2

3 年前

PranavNyati / Reinforcement_Learning_Term_Project

This repository contains the codes for Term Projects as part of the Reinforcement Learning course (CS600077) that I am taking in the Autumn 2023 semester at IIT Kharagpur

markov-decision-processes q-learning reinforcement-learning sarsa-lambda

Python 2

2 年前

arielfayol37 / Easy21

Applying reinforcement learning methods to a simple card game.

collectible-card-game sarsa-lambda

Python 1

1 个月前

Hysperr / gridworld-v2

An agent learns the optimal path towards its goal from any starting point while avoiding obstacles.

人工智能 C#markov-decision-processes pathfinding q-learning sarsa-lambda

C# 1

2 年前

pagrim / FrozenLake

Q-learning agent to solve the frozen lake problem from the OpenAI gym

q-learning sarsa sarsa-lambda reinforcement-learning

Python 1

3 年前

valinsogna / ReinForceMate

Advanced RL algorithms for two simplified versions of chess. Shortest Path finds the minimal moves between two cells based on piece capabilities. Capture Pieces trains against random opponents aiming ...

deep-q-learning q-learning reinforcement-learning sarsa sarsa-lambda

Jupyter Notebook 1

2 年前

Website
Wikipedia